Задать вопрос

Почему уровень ошибки при обучении сети постоянно скачет?

Почему уровень ошибки при обучении ведет себя так?de816a1450504f62b313bf83b88baab3.PNG
Есть нейронная сеть, с тремя слоями, принимающая на вход картинки из базы mnist. Соответственно в входном слое 784 нейрона, по одному на каждый пиксель. В скрытом слое 30 нейронов, на выходном десять, по одному на каждый класс. На скрытом слое в качестве функции активации используется tanh, на выходном - softmax. В качестве функции потерь используется кросс-энтропия. Тренировочный сет имеет 60000 картинок. Обучаю сеть методом стохастического градиентного спуска, выборки из 5, 10, 100(это не важно, результат в целом не меняется) рандомных элементов обучающего множества.
  • Вопрос задан
  • 728 просмотров
Подписаться 2 Оценить 1 комментарий
Помогут разобраться в теме Все курсы
  • Нетология
    Python-разработчик: расширенный курс + нейросети
    12 месяцев
    Далее
  • Академия Эдюсон
    Python-разработчик
    9 месяцев
    Далее
  • ProductStar × РБК
    Профессия: Python-разработчик + ИИ
    8 месяцев
    Далее
Пригласить эксперта
Ответы на вопрос 1
Слишком большой шаг в градиентном спуске. Попробуйте уменьшить его наполовину.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
ITK academy Краснодар
от 220 000 до 300 000 ₽
ITK academy Краснодар
от 75 000 ₽
DimaTech Ltd Краснодар
от 140 000 до 140 000 ₽