Задать вопрос

Сверточная нейронная сеть, для чего нужны несколько слоев сверки и как работают ядра на глубоких слоях?

Я понял принцип ядер для первой сверки, это выделить какие то признаки. После этого получаем карты нового изображения в которых будут суммы прохождения ядер по изображению. Допустим я получил n-ое кол-во карт. В таком случая как работают новые ядра для этих карт, в чем суть? Ведь там просто числа значение которых показывают наличие признака, но набор этих значений уже не дает какой то признак, а всего лишь показывает наличие этих прзнаков. Вот в этом моменте я не понимаю да и в статьях и в видео это весьма расплывчато показывается аргументируя это тем что мы опять выделяем признаки. Но по факту я не могу понять роль ядер на глубоких слоях свертки.
  • Вопрос задан
  • 277 просмотров
Подписаться 7 Средний 1 комментарий
Пригласить эксперта
Ответы на вопрос 1
@OlegPyatakov
pyatakov.com
Если обычные многослойные нейронные сети вам понятны, то проще всего будет сформулировать, что "глубокие" сверточные слои выполняют такую же роль, как и "глубокие" слои в обычной нейросети. Они берут набор признаков из предыдущего слоя и комбинируя их получают новые более высокоуровневые признаки.

Разница в том, что нейрон типового Dense слоя нейронной сети владеет всей информацией с предыдущего слоя, а сверточные слои оперируют "локальными" ядрами. Поэтому обычно между сверточными слоями делают какой-либо pooling и тогда ядра новых сверточных слоев, получается, используют бОльше информации с предыдущих слоев.

Ведь там просто числа значение которых показывают наличие признака, но набор этих значений уже не дает какой то признак, а всего лишь показывает наличие этих прзнаков.

Набор двух базовых признаков можно считать как один высокоуровневый.

Очень условный пример:
  1. Например, вы на первом сверточном слое вы нашли одним ядром "левый угол глаза", а другим ядром "правый угол глаза".
  2. Сделали pooling. Теперь новый сверточный слой при таком же размере ядра в пикселях будет охватывать бОльшую часть картинки
  3. На втором сверточном слое, мы скомбинировать информацию, что "левый угол глаза" находится рядом слева от "правого угла глаза", то есть на этом слое мы можем сказать, что это новый признак "глаз".
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы