Как работает генерация больших изображений?

Question

Filipp42 @Filipp42

Нейронные сети

Как работает генерация больших изображений?

Здравствуйте!
Скажите пожалуйста, как работает генерация крупных картинок, например по тексту?
Мне как-то не верится, что у них столько же выходных нейронов, сколько и пикселей в картинке.
И ещё, для генерации изображений (или текста, музыки, т.п.) используют просто прямую многослойную ИНС, как на схемах, или что-то более хитрое?
Заранее спасибо!

Вопрос задан более трёх лет назад
62 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Специалист по Data Science плюс

17 месяцев

Далее
Skillbox

Профессия Machine Learning Engineer

12 месяцев

Далее
Центр непрерывного образования ФКН НИУ ВШЭ

Глубинное обучение

10 недель

Далее

Пригласить эксперта

Ответы на вопрос 3

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- 26 окт.
- 114 просмотров
1

ответ
Нейронные сети

Простой
Как надиктовывать текст голосом в Cursor?
- 1 подписчик
- 24 окт.
- 92 просмотра
1

ответ
Нейронные сети

Средний
Имеют ли нейросети или надстройки над ними возможность анализа «полноты» вопроса?
- 1 подписчик
- 23 окт.
- 85 просмотров
2

ответа
Нейронные сети

Сложный
Как организовать разбивку по таймкодам текста из 30000 слов?
- 1 подписчик
- 18 окт.
- 67 просмотров
0

ответов
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент.
- 97 просмотров
1

ответ
Нейронные сети

Средний
Каков объём данных, передаваемых между узлами ComfyUI и где они хранятся (RAM/VRAM/...)?
- 1 подписчик
- 28 сент.
- 82 просмотра
1

ответ
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 6 подписчиков
- 22 сент.
- 1368 просмотров
5

ответов
Нейронные сети

Простой
Отечественные нейронки для кодинга и не только сентябрь 2025?
- 1 подписчик
- 22 сент.
- 249 просмотров
3

ответа
Нейронные сети

Простой
Какая AI модель дешевле в пересчете на решение задачи в программировании?
- 1 подписчик
- 21 сент.
- 278 просмотров
3

ответа
Нейронные сети

Простой
Как настроить оркестрацию вайбкодинга?
- 2 подписчика
- 21 сент.
- 440 просмотров
3

ответа
Показать ещё Загружается…

Frontend Developer/ Vue.js

DevTeam.Space • Москва

от 1 000 до 3 000 $

SRE/DevOps инженер

Сбер • Москва

от 200 000 до 300 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

Answer 1 · 2022-09-26 08:34:09

Мне как-то не верится, что у них столько же выходных нейронов, сколько и пикселей в картинке.

Почему нет-то, да и готовят картинки не такие уж и больше, и даже тем надо десяток гигабайт видео памяти.

Answer 2 · 2022-09-26 08:35:31

Александр Скуснов @AlexSku

не буду отвечать из-за модератора

Если брать Semantic Segmentation, то там идёт попиксельное построение, да ещё для видео.

Ответ написан более трёх лет назад

Комментировать

Answer 3 · 2022-09-26 15:48:46

Непонятно что в вопросе автора является исходными данными?

Заголовок генерацию? Но по сути вопрос - про обработку.

По обработке. Насколько я знаю сверточные НС на втором уровне уже работают не с пикселами а с группами пикселов обладающих каким-то свойством. Линия. Закорючка и так далее. Вот. А первый уровень не обязательно буквально должен отображать каждый пиксел в отдельные сущности. Я думаю что там просто есть перевод картинки в вещественную двумерную функцию и эта функция и будет активацией для второго слоя. Абстракции короче.

Как работает генерация больших изображений?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт