Здравствуйте!
Скажите пожалуйста, как работает генерация крупных картинок, например по тексту?
Мне как-то не верится, что у них столько же выходных нейронов, сколько и пикселей в картинке.
И ещё, для генерации изображений (или текста, музыки, т.п.) используют просто прямую многослойную ИНС, как на схемах, или что-то более хитрое?
Заранее спасибо!
Непонятно что в вопросе автора является исходными данными?
Заголовок генерацию? Но по сути вопрос - про обработку.
По обработке. Насколько я знаю сверточные НС на втором уровне уже работают не с пикселами а с группами пикселов обладающих каким-то свойством. Линия. Закорючка и так далее. Вот. А первый уровень не обязательно буквально должен отображать каждый пиксел в отдельные сущности. Я думаю что там просто есть перевод картинки в вещественную двумерную функцию и эта функция и будет активацией для второго слоя. Абстракции короче.