Чем отличется обратное распространение ошибки от стохастического градиентного спуска?

Question

numitus2 @numitus2

Чем отличется обратное распространение ошибки от стохастического градиентного спуска?

Насколько я понял из литературы, они отличаются только тем, что обратное распространение ошибки меняется после обработки всей выборки, а стохастический спуск после каждого образа?

Вопрос задан более трёх лет назад
547 просмотров

Комментировать

Подписаться 3 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Аналитика

+1 ещё

Простой
Какие есть эффективные средства анализа больших данных?
- 1 подписчик
- 20 авг.
- 98 просмотров
2

ответа
Анимация

+1 ещё

Простой
Существет ли AI делающая промежуточную анимацию между 2 кадрами?
- 1 подписчик
- 09 авг.
- 89 просмотров
1

ответ
Нейронные сети

Простой
Существуют ли нейросети делающие видео с персонажем по эскизу фото?
- 1 подписчик
- 08 авг.
- 84 просмотра
1

ответ
Видео

+1 ещё

Простой
Нейросеть для перевода видео?
- 2 подписчика
- 07 авг.
- 314 просмотров
2

ответа
Видео

+1 ещё

Простой
Есть ли видео-нейросеть, дорисовывающая объекты к реальному видео?
- 1 подписчик
- 03 авг.
- 167 просмотров
1

ответ
IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 289 просмотров
3

ответа
Нейронные сети

+2 ещё

Простой
Можно ли закешировать результат загрузки gguf модели в Forge?
- 1 подписчик
- 27 июл.
- 42 просмотра
1

ответ
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 56 просмотров
0

ответов
Нейронные сети

Простой
Как подключить Context7 к claude.ai?
- 1 подписчик
- 23 июл.
- 67 просмотров
0

ответов
Нейронные сети

+2 ещё

Средний
Как правильно подобрать модель, VAE и T5 чтобы запустить Flux1 gguf версию?
- 1 подписчик
- 16 июл.
- 63 просмотра
2

ответа
Показать ещё Загружается…

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽

Стажер Моушен дизайнер для контента в соцсетях музыкального стартапа

Vocaberry

от 15 000 до 15 000 ₽

JS Fullstack Инженер (Node.js + Vue.js)

SteadyControl • Воронеж

от 100 000 до 250 000 ₽

Answer 1 · 2016-06-28 15:50:25

На самом деле, это немного разные понятия.

Backpropagation дает нам функцию, которую надо оптимизировать ( = найти минимум\максимум).

SGD находит минимум\максимум некоторой произвольной функции.

Кроме стохастического спуска, есть еще full-batch gradient descent (это тот самый, по умолчанию, когда изменяем коэффициенты после обсчета всей выборки), mini-batch gradient descent (промежуточный вариант, когда меняем коэффициенты после обсчета N элементов выборки), rmsprop, ADAM, имитация отжига и т.д.

Чем отличется обратное распространение ошибки от стохастического градиентного спуска?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт