Обратное распространение ошибки. Почему такая разница в знаках формулы при одинаковом подходе?

Question

Pantuchi @saneok44

Машинное обучение

Обратное распространение ошибки. Почему такая разница в знаках формулы при одинаковом подходе?

Всех приветствую.
При изучении нейронных сетей и штурмование формул на разных источниках появился неоднозначный вопрос при методе обратного распространения ошибки. Например:
d - желаемый результат y - ответ сети w - вес g - градиент v - значение сигмоиды
где то пишут что (1)[e = d - y], а где то (2)[y - d].
В корректировке весов (1)[w = w - скорость обучения * g * v] , а
где то (2)[w = w + скорость обучения * g * v]; Пока только нашел закономерность знака в корректировке весов с порядком переменных в нахождении ошибки.

Вопрос задан более трёх лет назад
89 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 50 просмотров
0

ответов
Машинное обучение

+1 ещё

Простой
Reverse engineering black box ML-модели?
- 1 подписчик
- 10 июл.
- 134 просмотра
3

ответа
Python

+3 ещё

Простой
Как повысить точность классификации по табличным документам?
- 2 подписчика
- 19 мая
- 268 просмотров
1

ответ
Машинное обучение

+2 ещё

Средний
Какие виды эмбединга используется в nlp?
- 1 подписчик
- 10 мая
- 90 просмотров
1

ответ
Машинное обучение

Средний
В чем преимущество позиционного кодирования синусами?
- 1 подписчик
- 25 апр.
- 104 просмотра
1

ответ
Машинное обучение

Простой
Как обучается трансформер?
- 1 подписчик
- 25 апр.
- 91 просмотр
1

ответ
Python

+2 ещё

Средний
GeForce GTX 1650 > RTX A2000 — как такое возможно?
- 2 подписчика
- 15 апр.
- 739 просмотров
2

ответа
Машинное обучение

+2 ещё

Средний
Какие архитектуры с механизмом внимания появились после transformer?
- 2 подписчика
- 11 апр.
- 171 просмотр
1

ответ
Python

+4 ещё

Средний
Как реализовать фарм-бота для игры Rush Royale?
- 1 подписчик
- 01 апр.
- 739 просмотров
2

ответа
Регулярные выражения

+2 ещё

Простой
Поиск оптимальной регулярки для бинарной классификации строк. Как?
- 1 подписчик
- 22 мар.
- 197 просмотров
1

ответ
Показать ещё Загружается…

ML Engineer

Vortex • Москва

от 330 000 до 380 000 ₽

ML Engineer / Data Scientist (Middle+, 25h/w)

Perare

от 2 100 до 2 600 $

React-разработчик (frontend) с опытом работы в области ML

DevTeam.Space

от 2 000 до 3 000 $

Answer 1 · 2020-10-28 12:19:08

Потому, что это не строгая формула, аля "как найти вычитаемое". Тут важно только в какую сторону надо "подтолкнуть" сеть. А вот уже на сколько решает каждый сам в его конкретном случае. И это вы ещё не используете регуляцию первого и второго уровня.

Обратное распространение ошибки. Почему такая разница в знаках формулы при одинаковом подходе?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт