Как работает генерация больших изображений?

Question

Filipp42 @Filipp42

Нейронные сети

Как работает генерация больших изображений?

Здравствуйте!
Скажите пожалуйста, как работает генерация крупных картинок, например по тексту?
Мне как-то не верится, что у них столько же выходных нейронов, сколько и пикселей в картинке.
И ещё, для генерации изображений (или текста, музыки, т.п.) используют просто прямую многослойную ИНС, как на схемах, или что-то более хитрое?
Заранее спасибо!

Вопрос задан более трёх лет назад
62 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Skillfactory

Курс по нейронным сетям

10 недель

Далее
Skypro

Нейросети с 0

9 месяцев

Далее
Учебный центр IBS

AI-003 ИИ для бизнес-аналитика: Автоматизация, Оптимизация и Усиление

1 неделя

Далее

Пригласить эксперта

Ответы на вопрос 3

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Мобильные устройства

+1 ещё

Простой
Какой девайс взять, чтоб за границей говорить и слушать иностранцев?
- 3 подписчика
- 08 дек.
- 540 просмотров
4

ответа
Системное администрирование

+2 ещё

Средний
Сервер с GPU предназначен ли для запуска фронтенда/бэкенда или он для вычислений?
- 1 подписчик
- 08 нояб.
- 333 просмотра
1

ответ
Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- 26 окт.
- 135 просмотров
1

ответ
Нейронные сети

Простой
Как надиктовывать текст голосом в Cursor?
- 1 подписчик
- 24 окт.
- 117 просмотров
1

ответ
Нейронные сети

Средний
Имеют ли нейросети или надстройки над ними возможность анализа «полноты» вопроса?
- 1 подписчик
- 23 окт.
- 101 просмотр
2

ответа
Нейронные сети

Сложный
Как организовать разбивку по таймкодам текста из 30000 слов?
- 1 подписчик
- 18 окт.
- 81 просмотр
0

ответов
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент.
- 104 просмотра
1

ответ
Нейронные сети

Средний
Каков объём данных, передаваемых между узлами ComfyUI и где они хранятся (RAM/VRAM/...)?
- 1 подписчик
- 28 сент.
- 95 просмотров
1

ответ
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 6 подписчиков
- 22 сент.
- 1510 просмотров
5

ответов
Нейронные сети

Простой
Отечественные нейронки для кодинга и не только сентябрь 2025?
- 1 подписчик
- 22 сент.
- 276 просмотров
4

ответа
Показать ещё Загружается…

Мобильный разработчик (React Native / другие)

App Company

от 200 000 до 300 000 ₽

Разработчик Telegram-бота с ИИ (TypeScript / Node.js)

App Company

от 200 000 до 300 000 ₽

Координатор сервисной службы

ЛАНИТ • Омск

До 40 000 ₽

Answer 1 · 2022-09-26 08:34:09

Мне как-то не верится, что у них столько же выходных нейронов, сколько и пикселей в картинке.

Почему нет-то, да и готовят картинки не такие уж и больше, и даже тем надо десяток гигабайт видео памяти.

Answer 2 · 2022-09-26 08:35:31

Александр Скуснов @AlexSku

не буду отвечать из-за модератора

Если брать Semantic Segmentation, то там идёт попиксельное построение, да ещё для видео.

Ответ написан более трёх лет назад

Комментировать

Answer 3 · 2022-09-26 15:48:46

Непонятно что в вопросе автора является исходными данными?

Заголовок генерацию? Но по сути вопрос - про обработку.

По обработке. Насколько я знаю сверточные НС на втором уровне уже работают не с пикселами а с группами пикселов обладающих каким-то свойством. Линия. Закорючка и так далее. Вот. А первый уровень не обязательно буквально должен отображать каждый пиксел в отдельные сущности. Я думаю что там просто есть перевод картинки в вещественную двумерную функцию и эта функция и будет активацией для второго слоя. Абстракции короче.

Как работает генерация больших изображений?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт