CNN не начинает лучше распозновать изображения после корректировки весов и смещений на последних полносвязных слоях. Так надо или ошибка?

Question

Никита @gth-other

Нейронные сети

CNN не начинает лучше распозновать изображения после корректировки весов и смещений на последних полносвязных слоях. Так надо или ошибка?

Пишу сверточную нейронную сеть на C++ с нуля (исключительно в образовательных целях). Написал реализацию прямого распространения всех используемых слоев. Написал обратное распространение и корректировку весов со смещениями последних полносвязных слоев, но даже после нескольких полных проходов всего датасета MNIST сетка не начинает лучше распознавать изображения (как было 9-10% так и осталось 9-10%).

Вопрос. Я ошибся в реализации чего-то или для того, чтобы CNN хоть немного лучше стала распозновать изображения недостаточно обучить только последние слои?

P.S. Архитектура используемой CNN:

Входящий слой 28x28x1.
Сверточный слой 24x24x20.
Объединяющий слой 12x12x20.
Сверточный слой 8x8x50 .
Объединяющий слой 4x4x50.
Полносвязный слой 500.
Выходящий слой 10.

Вопрос задан более трёх лет назад
41 просмотр

Комментировать

Подписаться 1 Средний Комментировать

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

+2 ещё

Простой
Можно ли закешировать результат загрузки gguf модели в Forge?
- 1 подписчик
- 17 часов назад
- 18 просмотров
1

ответ
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 43 просмотра
0

ответов
Нейронные сети

Простой
Как подключить Context7 к claude.ai?
- 1 подписчик
- 23 июл.
- 42 просмотра
0

ответов
Нейронные сети

+2 ещё

Средний
Как правильно подобрать модель, VAE и T5 чтобы запустить Flux1 gguf версию?
- 1 подписчик
- 16 июл.
- 44 просмотра
2

ответа
Нейронные сети

+2 ещё

Простой
Что мешает создать сугубо инженерную генеративную нейросеть?
- 1 подписчик
- 14 июл.
- 180 просмотров
3

ответа
Нейронные сети

+2 ещё

Простой
Требуется ли junior deep learning инженеру знание математики?
- 1 подписчик
- 13 июл.
- 96 просмотров
1

ответ
Нейронные сети

Простой
Flowise, как подключить эмбендингс?
- 1 подписчик
- 05 июл.
- 58 просмотров
1

ответ
Нейронные сети

Простой
Flowise error 500?
- 1 подписчик
- 04 июл.
- 68 просмотров
0

ответов
Нейронные сети

Простой
Нейросеть на ПК для обработки книжной литературы с последующей выдачей ответов по запросам?
- 1 подписчик
- 28 мая
- 196 просмотров
4

ответа
Arduino

+1 ещё

Средний
Сможет ли нейросеть написать скетч для Arduino mini мультиплексор нескольких COM портов в один?
- 2 подписчика
- 26 мая
- 316 просмотров
1

ответ
Показать ещё Загружается…

Data Scientist

YADRO

Machine Learning Engineer (LLM)

Icons8

Deep Learning Engineer в команду Perception

Navio • Москва

Answer 1 · 2022-03-27 12:19:01

Если на свёрточных слоях веса были рандомные, то их тоже надо обучать, а не только последние слоя. Обучают последние слои только когда нейронка уже предобучена и вы хотели бы добавить какой-то новый класс.

CNN не начинает лучше распозновать изображения после корректировки весов и смещений на последних полносвязных слоях. Так надо или ошибка?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт