Как обучить нейросеть со слоем Relu+Softmax?

Question

roman22275 @roman22275

Нейронные сети

Как обучить нейросеть со слоем Relu+Softmax?

Нейросеть для решения MNIST состоит 3 слоев:
1)входной [784]
2)скрытый [500]. функция активации RELU
3) Выходной[10].функция активации softmax

На скрине под цифрой 1 - input выходного слоя
На скрине под цифрой 2 - output выходного слоя(после применения softmax)
На скрине под цифрой 3 - максимальное значение производной по весам, соединящим 2 и слой
На скрине под цифрой 4 - среднее значение этой же производной
Очевидно, что с такими малыми значениями сеть не обучится. Что делать?

Вопрос задан более трёх лет назад
99 просмотров

3 комментария

Подписаться 1 Сложный 3 комментария

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

+2 ещё

Простой
Можно ли закешировать результат загрузки gguf модели в Forge?
- 1 подписчик
- 27 июл.
- 32 просмотра
1

ответ
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 50 просмотров
0

ответов
Нейронные сети

Простой
Как подключить Context7 к claude.ai?
- 1 подписчик
- 23 июл.
- 51 просмотр
0

ответов
Нейронные сети

+2 ещё

Средний
Как правильно подобрать модель, VAE и T5 чтобы запустить Flux1 gguf версию?
- 1 подписчик
- 16 июл.
- 49 просмотров
2

ответа
Нейронные сети

+2 ещё

Простой
Что мешает создать сугубо инженерную генеративную нейросеть?
- 1 подписчик
- 14 июл.
- 191 просмотр
3

ответа
Нейронные сети

+2 ещё

Простой
Требуется ли junior deep learning инженеру знание математики?
- 1 подписчик
- 13 июл.
- 106 просмотров
1

ответ
Нейронные сети

Простой
Flowise, как подключить эмбендингс?
- 1 подписчик
- 05 июл.
- 58 просмотров
1

ответ
Нейронные сети

Простой
Flowise error 500?
- 1 подписчик
- 04 июл.
- 70 просмотров
0

ответов
Нейронные сети

Простой
Нейросеть на ПК для обработки книжной литературы с последующей выдачей ответов по запросам?
- 1 подписчик
- 28 мая
- 197 просмотров
4

ответа
Arduino

+1 ещё

Средний
Сможет ли нейросеть написать скетч для Arduino mini мультиплексор нескольких COM портов в один?
- 2 подписчика
- 26 мая
- 320 просмотров
1

ответ
Показать ещё Загружается…

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽

Эксперт по транспортной сети/Сетевой инженер

НТЦ ПРОТЕЙ • Санкт-Петербург

от 200 000 ₽

Сетевой инженер

МТС • Владивосток

от 100 000 ₽

На скрине под цифрой 1 - input выходного слоя

Необходимо нормализовать 0...1
freeExec, поделить на самое большее значчение?

Answer 1 · 2019-12-23 20:46:37

Да-а, сперва завис над "Очевидно, что с такими малыми значениями сеть не обучиться".)) Почему вы так считаете?
Как правило, на вход нейронных сетей данные подаются в отмасштабированном (нормализованном виде). Поэтому сперва переведите матрицы X_train и X_test из целочисленных значений на отрезке [0,255] (image набора данных MNIST) к вещественным на [0,1].
Вероятно, у вас не совсем подходящая архитектура сети. Опирайтесь на образец: ссылка, благодаря которому набор данных MNIST "расщёлкали" с эффективностью 99.25%.

Как обучить нейросеть со слоем Relu+Softmax?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт