@aIan31

Правильно ли я понимаю одно из преимуществ сверточной нейронной сети над обычной для классификации изображений?

В глубоком обучении новичок, не судите строго. Так допустим я хочу использовать обычную нейронную сеть для классификации изображений, человек ли это или нет.
62237830b7a86109249429.png
Картинка всего имеет допустим 680 пикселей. На нейроны входного слоя поступают значение пикселей, нейроны скрытого слоя же, выявляют некоторые черты лица, и нейрон отмеченный зеленым цветом допустим отвечает за поиск носа.(допустим)

И допустим при обучении этой нейронной сети, большинство пикселей на которых был расположен нос это пиксели 50-75(допустим), это значит, что веса между нейронами 50-75 входного слоя и нейроном скрытого слоя отвечающий за нос(зеленый) намного больше чем между другими нейронами входного слоя и этим нейроном скрытого слоя.

В таком случае если мы будем хотим классифицировать картинку, которую нейронная сеть раньше не видела, на которой нос находится на других пикселях, допустим 220-245 , в таком случае веса между нейронами 220-245 и нейроном скрытого слоя отвечающего за нахождение носа будут не подходить.

И правильно ли я понимаю, что в этом как раз таки большое преимущество сверточной нейронной сети и использования в ней фильтров, над обычной для классификации изображений?
  • Вопрос задан
  • 39 просмотров
Пригласить эксперта
Ответы на вопрос 2
@rPman
нейронная сеть на изображениях которые не видела будет находиться в неопределенном состоянии, т.е. ничего нельзя гарантировать

но, главная фишка нейронных сетей (и вообще алгоритмов многомерной оптимизации из самой математики исходит) - она очень любит находить закономерности, необычные, странные, даже там где их нет и на их основе делать вывод

т.е. твои нейроны про зеленый нос могут оказаться не маркером зеленого носа, а 'удачно' совпавшие с на обучающей выборке совсем другой критерий, оттопыренная губа например на всех зеленоносых картинках, и когда сеть увидит что то неизвестное она может найти оттопыренную губу например в изгибе щупальца кальмара и среагировать.
Ответ написан
Комментировать
freeExec
@freeExec
Участник OpenStreetMap
Да, в общем вы правы. При классическом подходе и разворачивании картинки в один ряд пикселей, связи с соседними пикселями исходной картинки теряются.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы