Регуляризация правильно ли понимаю?

Question

Алексей Пушкин @fav022

программирование

Нейронные сети

Регуляризация правильно ли понимаю?

Допустим есть сеть 4 входных нейрона и 1 на выход. Веса w1=0.2 w2=0.5 w3=0.1 w4=0.9
Функция потерь среднеквадратическая, предположим равна 0.5 далее мы плюсуем ( параметр который указывается вручную а=0.1 умножаем на сумму квадратов всех весов. То есть L2=(0.2^2+0.5^2+0.1^2+0.9^2)*a
L2=0.111+функция потерь(0.5)=0.611
Далее обновляем веса new_w1=w1*(L2*w1+градиент)/batch_size и т.д.
Правильно ли я понял формулу? И правильно ли обновляю вес?
После нескольких эпох все веса становятся нулями, подскажите пожалуйста что делаю не так?

Вопрос задан более трёх лет назад
55 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Нейросети для анализа данных

9 недель

Далее
Яндекс Практикум

Нейросети для работы

2 месяца

Далее
Skillfactory

Курс по нейронным сетям

10 недель

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Чтобы сделать несколько запросов к OpenAI серверу из Python, нужно каждый раз вызывать client.chat.completions.create?
- 1 подписчик
- 21 дек.
- 97 просмотров
2

ответа
Мобильные устройства

+1 ещё

Простой
Какой девайс взять, чтоб за границей говорить и слушать иностранцев?
- 6 подписчиков
- 08 дек.
- 676 просмотров
6

ответов
Системное администрирование

+2 ещё

Средний
Сервер с GPU предназначен ли для запуска фронтенда/бэкенда или он для вычислений?
- 1 подписчик
- 08 нояб.
- 336 просмотров
1

ответ
Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- 26 окт.
- 138 просмотров
1

ответ
Нейронные сети

Простой
Как надиктовывать текст голосом в Cursor?
- 1 подписчик
- 24 окт.
- 124 просмотра
1

ответ
Нейронные сети

Средний
Имеют ли нейросети или надстройки над ними возможность анализа «полноты» вопроса?
- 1 подписчик
- 23 окт.
- 102 просмотра
2

ответа
Нейронные сети

Сложный
Как организовать разбивку по таймкодам текста из 30000 слов?
- 1 подписчик
- 18 окт.
- 83 просмотра
0

ответов
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент.
- 105 просмотров
1

ответ
Нейронные сети

Средний
Каков объём данных, передаваемых между узлами ComfyUI и где они хранятся (RAM/VRAM/...)?
- 1 подписчик
- 28 сент.
- 96 просмотров
1

ответ
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 6 подписчиков
- 22 сент.
- 1521 просмотр
5

ответов
Показать ещё Загружается…

Менеджер проектов

Vital Partners • Москва

от 160 000 до 180 000 ₽

Database Administrator / Администратор PostgreSQL

Vital Partners

от 200 000 до 270 000 ₽

Technical support (Ассистент Product Owner)

uKit Group • Ростов-на-Дону

от 50 000 до 55 000 ₽

Answer 1 · 2020-01-20 05:02:23

Потери будут выглядеть так:
Потери = Значение функции среднекв. ошибки + L1 * a + L2 * b , где a, b - гиперпараметры, которые будут указывать, насколько сильно мы будем штрафовать модель за большие веса.
Дальше просто от этого берем градиент от полученного выражения и меняем веса.

Регуляризация правильно ли понимаю?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт