Добрый день!
Изучая сверточные сети я наткнулся на очень популярный Tutorial по обучению сверточных сетей на известном примере с Kaggle (cats vs dogs)
Там на вход сети подаются изображения (кошка или собака) с размером IMG_SIZE=50 пикселей,где высота и ширина равны друг другу и равны 50 пикселям
Вопрос у меня вызывает следующий участок кода
Вопрос 1. Каким образом на изображение размером 50 х 50 пикселей могут быть примениниы 6 сверточных слоев (filter size =2 ,padding =0 ,stride =1) и max_pooling (kernel size =2)
Input_image (50x50)-->conv1-->(48x48)-->max_pooling(24x24)-->conv2-->(22x22)-->max_pooling(11x11)
То есть после второго слоя размер нашего изображения становится 11х11 пикселей, а после conv3 размер становится 3х3 пикселя . Как к такому маленькому изображению мы еще можем применить 3 оставшихся сверточных слоя?
Вопрос 2: Почему после того как нами были получены 64 свертки к ним применяют только 32 фильтра а не 128?