Требуется помощью с регулярезацией L-2?

Question

Xvir43 @Xvir43

Требуется помощью с регулярезацией L-2?

Имеется нейронная сеть обратного распространения с функцией градиентного спуска, вопрос в какой момент делается регуляризация? Я понимаю что регуляризация применяется на этапе вычисления обратной ошибки, но куда??когда мы корректируем веса?

Вопрос задан более трёх лет назад
79 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Решения вопроса 1

6 комментариев

Xvir43 @Xvir43 Автор вопроса

В момент корректировки весов или просчёта ошибки нейрона?

Написано более трёх лет назад
freeExec @freeExec

Xvir43, обновление весов

Написано более трёх лет назад
Xvir43 @Xvir43 Автор вопроса

freeExec, Подскажи пожалуйста, что такое batchSize,

Написано более трёх лет назад
freeExec @freeExec

Xvir43, Вы же градиент накапливаете, а не после каждого BP делаете обновление весов. Ну вот это как раз то количество - мини подвыборка, на скольки элементах вы обучились, прежде чем обновить веса..

Написано более трёх лет назад
Xvir43 @Xvir43 Автор вопроса

freeExec, Вы меня извините за столько вопросов, подскажите как вы используете нормализацию точнее когда и в каком месте(например на входной слой и все скрытые слои или как то еще, перед функцией активации или после нее )? моя сеть состоит из из 2ух скрытых слоев (прямого распространения).

Написано более трёх лет назад
freeExec @freeExec

Xvir43, Я вам предлагаю взять и посмотреть как написана сеть у других, раз объяснения на словах вам не подходят.
https://github.com/tensorflow/playground/blob/mast...

Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 2 часа назад
- 13 просмотров
0

ответов
Нейронные сети

Средний
Каков объём данных, передаваемых между узлами ComfyUI и где они хранятся (RAM/VRAM/...)?
- 1 подписчик
- 28 сент.
- 52 просмотра
1

ответ
Машинное обучение

+1 ещё

Средний
Есть ли готовая архитектура модели, которая принимает на вход подобный формат данных?
- 3 подписчика
- 27 сент.
- 117 просмотров
0

ответов
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 4 подписчика
- 22 сент.
- 944 просмотра
6

ответов
Нейронные сети

Простой
Отечественные нейронки для кодинга и не только сентябрь 2025?
- 1 подписчик
- 22 сент.
- 194 просмотра
3

ответа
Нейронные сети

Простой
Какая AI модель дешевле в пересчете на решение задачи в программировании?
- 1 подписчик
- 21 сент.
- 245 просмотров
3

ответа
Нейронные сети

Простой
Как настроить оркестрацию вайбкодинга?
- 2 подписчика
- 21 сент.
- 381 просмотр
3

ответа
3D

+2 ещё

Средний
Cуществует ли софт для генерации трёхмерного (если нет — двухмерного) видео говорящего какой-либо заданный текст человека?
- 1 подписчик
- 20 сент.
- 81 просмотр
1

ответ
Машинное обучение

+1 ещё

Простой
Поиск по образцу. Как сделать быстрый поиск вхождения картинок-символов на большом чертеже?
- 2 подписчика
- 19 сент.
- 175 просмотров
1

ответ
Python

+1 ещё

Простой
Почему модель обнаружения объектов YOLO работает медленно?
- 1 подписчик
- 14 сент.
- 199 просмотров
1

ответ
Показать ещё Загружается…

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽

Разработчик Delphi

EuroAuto • Санкт-Петербург

от 200 000 ₽

Консультант-разработчик 1C (в офис)

EuroAuto • Санкт-Петербург

от 200 000 ₽

Answer 1 · 2019-11-12 16:35:37

freeExec @freeExec

Участник OpenStreetMap

Грубо говоря

newWeight = weight * (L1 + L2 * weight + grad) / batchSize

Ответ написан более трёх лет назад

6 комментариев

Требуется помощью с регулярезацией L-2?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт