@Filipp42

Как работает генерация больших изображений?

Здравствуйте!
Скажите пожалуйста, как работает генерация крупных картинок, например по тексту?
Мне как-то не верится, что у них столько же выходных нейронов, сколько и пикселей в картинке.
И ещё, для генерации изображений (или текста, музыки, т.п.) используют просто прямую многослойную ИНС, как на схемах, или что-то более хитрое?
Заранее спасибо!
  • Вопрос задан
  • 52 просмотра
Пригласить эксперта
Ответы на вопрос 3
freeExec
@freeExec
Участник OpenStreetMap
Мне как-то не верится, что у них столько же выходных нейронов, сколько и пикселей в картинке.

Почему нет-то, да и готовят картинки не такие уж и больше, и даже тем надо десяток гигабайт видео памяти.
Ответ написан
Комментировать
@AlexSku
не буду отвечать из-за модератора
Если брать Semantic Segmentation, то там идёт попиксельное построение, да ещё для видео.
Ответ написан
Комментировать
mayton2019
@mayton2019
Bigdata Engineer
Непонятно что в вопросе автора является исходными данными?

Заголовок генерацию? Но по сути вопрос - про обработку.

По обработке. Насколько я знаю сверточные НС на втором уровне уже работают не с пикселами а с группами пикселов обладающих каким-то свойством. Линия. Закорючка и так далее. Вот. А первый уровень не обязательно буквально должен отображать каждый пиксел в отдельные сущности. Я думаю что там просто есть перевод картинки в вещественную двумерную функцию и эта функция и будет активацией для второго слоя. Абстракции короче.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы