@Xvir43

Требуется помощью с регулярезацией L-2?

Имеется нейронная сеть обратного распространения с функцией градиентного спуска, вопрос в какой момент делается регуляризация? Я понимаю что регуляризация применяется на этапе вычисления обратной ошибки, но куда??когда мы корректируем веса?
  • Вопрос задан
  • 78 просмотров
Решения вопроса 1
freeExec
@freeExec
Участник OpenStreetMap
Грубо говоря
newWeight = weight * (L1 + L2 * weight + grad) / batchSize
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы