Почему нейронная сеть правильно распознает только данные из MNIST?

Question

Никита @gth-other

Почему нейронная сеть правильно распознает только данные из MNIST?

Реализую нейронную сеть распознавания цифр на чистом C++ (исключительно в образовательных целях). В качестве данных решил использовать MNIST. Для обучения взял 60 000 изображений, для тестирования - 10 000. Написал нейронную сеть, написал обратное распространение, минута обучения и данные для тестирования распознаются с вероятностью в 92.69% (9 269 / 10 000). После этого решил протестировать нейронную сеть на своих собственных изображениях. Открыл GIMP, написал цифры от 0 до 9 белым цветом на черном фоне, экспортировал в PBM формат, а после загрузил в программу. Правильность загрузки изображения проверял, изображение в массив цветов загрузилось корректно. Запускаю нейронную сеть и вижу, что правильные результаты появляются с вероятностью в 10-20%, то есть не многим лучше случайного выбора. Что делать? Какого может быть причина?

Топология нейронной сети:

Входной слой - 784 нейрона (28 * 28)
Скрытый слой 1 - 16 нейронов
Скрытый слой 2 - 16 нейронов
Выходной слой - 10 нейронов (каждый нейрон для каждой цифры)

Понимаю, что вряд-ли кому-то будет не лень смотреть код и что я там наворотил, но на всякий случай вот ссылочка.

Вопрос задан более трёх лет назад
146 просмотров

Комментировать

Подписаться 1 Сложный Комментировать

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

6 комментариев

Никита @gth-other Автор вопроса

Спасибо! В любом случае попробую с этим что-то сделать, но разве это возможно? Нейронная сеть выдает хорошие результаты на последних 10 000 изображений из MNIST, когда их она ни разу не видела (в процессе обучения, как я и писал, используются только первые 60 000 изображений). Или я в чем-то не прав (являюсь новичком в этой теме, так что вполне вероятно, что не прав)?

Написано более трёх лет назад
rPman @rPman

это и есть переобученность
нейронная сеть смогла найти признаки, характерные для твоего датасета но не твоей задачи, или тупо заучила его весь но так и не смогла выявить признаки!

это как выучить наизусть все задачи из учебника и выдавать правильные ответы на задачи от туда но так и не понять принцип их решения и валиться на простом изменении коэффициентов в задачах

Написано более трёх лет назад
Никита @gth-other Автор вопроса

rPman, спасибо! Сейчас попробую покрутить гиперпараметры.

Написано более трёх лет назад
rPman @rPman

Никита, по ссылки в вики сходи, загугли, там куча алгоритмов

Написано более трёх лет назад
Василий Банников @vabka

Никита, у меня аналогичная проблема была - изображения из mnist распознаёт хорошо, а новые - шиш.
Думаю, это связано с тем, что сетка привязалась к тому почерку, который был у людей, которые писали примеры для mnist. Выборка не достаточно разнообразная.

В теории, ты можешь улучшить результат, если расширишь датасет хотябы на основе того что у тебя уже есть - немного поискажай картинки, покрути.

Написано более трёх лет назад
Никита @gth-other Автор вопроса

Василий Банников, хорошо, попробую.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 41 просмотр
0

ответов
Нейронные сети

Простой
Как подключить Context7 к claude.ai?
- 1 подписчик
- 23 июл.
- 41 просмотр
0

ответов
Нейронные сети

+2 ещё

Средний
Как правильно подобрать модель, VAE и T5 чтобы запустить Flux1 gguf версию?
- 1 подписчик
- 16 июл.
- 42 просмотра
2

ответа
Нейронные сети

+2 ещё

Простой
Что мешает создать сугубо инженерную генеративную нейросеть?
- 1 подписчик
- 14 июл.
- 178 просмотров
3

ответа
Нейронные сети

+2 ещё

Простой
Требуется ли junior deep learning инженеру знание математики?
- 1 подписчик
- 13 июл.
- 95 просмотров
1

ответ
Машинное обучение

+1 ещё

Простой
Reverse engineering black box ML-модели?
- 1 подписчик
- 10 июл.
- 134 просмотра
3

ответа
Нейронные сети

Простой
Flowise, как подключить эмбендингс?
- 1 подписчик
- 05 июл.
- 57 просмотров
1

ответ
Нейронные сети

Простой
Flowise error 500?
- 1 подписчик
- 04 июл.
- 68 просмотров
0

ответов
Нейронные сети

Простой
Нейросеть на ПК для обработки книжной литературы с последующей выдачей ответов по запросам?
- 1 подписчик
- 28 мая
- 196 просмотров
4

ответа
Arduino

+1 ещё

Средний
Сможет ли нейросеть написать скетч для Arduino mini мультиплексор нескольких COM портов в один?
- 2 подписчика
- 26 мая
- 316 просмотров
1

ответ
Показать ещё Загружается…

Data Scientist

YADRO

Machine Learning Engineer (LLM)

Icons8

Deep Learning Engineer в команду Perception

Navio • Москва

Answer 1 · 2022-03-20 16:17:09

Я решил сопоставить свои изображения и изображения из MNIST'а. Выяснилось, что цифры на моих изображениях разного размера, написаны в разных частях картинки, а цифры из MNIST'а - примерно равного размера и написаны точно по центру. Именно поэтому нейронной сети легко определять цифры из MNIST'а и так сложно определять мои. Решение проблемы лежит в переходе с многослойных перцептронов на сверточные нейронные сети.

Answer 2 · 2022-03-12 13:06:50

rPman @rPman

скорее всего сеть переобучилась
известная беда для нейронных сетей

Ответ написан более трёх лет назад

6 комментариев

Почему нейронная сеть правильно распознает только данные из MNIST?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт