Где взять объяснение сверточных нейронных сетей на примере трехмерных матриц?
Вероятно, вопрос смешной, но никак не могу найти объяснения операций, применяемых в CNN, на примере трехмерных матриц. В интернетах полно сверхочевидных картинок, объясняющих свертку и объедение на примере простых одноканальных изображений, но нет объяснения того, что делать после свертки с несколькими фильтрами.
Допустим, у нас есть изображение в оттенках серого и в разрешении 28x28. Выполняем свертку с 8 фильтрами 3x3 и получаем матрицу 26x26x8. А дальше что? Как вообще дальше делать на такой матрице свертку или объединение? Какую статью / литературу (желательно русскоязычную) рекомендуете прочитать для полноценного понимания принципа работы CNN?
У тебя есть 8 слоёв в ядре свёртки для серого, добавь ещё 8 туда для красного и ещё 8 для зелёного.
Нет я наврал. Количество слоёв в свёртке равно размерности входного. И одни а та же свётка обрабатывает все приходящие каналы.
Возможно чего-то не понимаю, но зачем это нужно? Изображение в градациях серого, разве одного единственного канала, показывающего яркость пикселя не хватает?