Задать вопрос

Есть ли нейросети для интерактивной работы с изображениями?

Cуществуют ли нейросети для генерации и обработки изображений с возможностью последовательных итераций?
Например, нейросеть генерирует изображение (или я даю своё). И после этого я хочу строить работу так, чтобы само изображение менялось только в той части, в которой я прошу, а не генерировалось заново.
Пример:
1) Сгенерируй изображение "длинный промт... море, лето, счастливая семья на берегу". Выбираю картинку.
2) Для выбранной картинки - удалить мужчину, ОСТАЛЬНОЕ НЕ ТРОГАТЬ.
3) У женщины изменить цвет волос на блондинку. Ребенок должен быть старше - 12 лет. ОСТАЛЬНОЕ НЕ ТРОГАТЬ
4) На берегу слева поставить дом с другой фотографии (прикладываю). Дом должен быть именно этот, а не просто похожий.
5) Повернуть дом на 20 градусов относительно берега...
и т.п.

Или другой пример.
Я даю нейросети готовое фото комнаты со столом и прямоугольные изображения обложек парочки журналов. Мне нужно "положить эти журналы на стол". Но чтобы обложки этих журналов на 100% сохранились.
  • Вопрос задан
  • 29 просмотров
Подписаться 2 Простой 1 комментарий
Помогут разобраться в теме Все курсы
  • Нетология
    ИИ в медицине: как использовать в работе каждый день
    8 недель
    Далее
  • Академия Эдюсон
    Нейросети в строительстве
    2 месяца
    Далее
  • Нетология
    Нейросети для анализа данных
    9 недель
    Далее
Пригласить эксперта
Ответы на вопрос 2
opium
@opium
Просто люблю качественно работать
это inpainting — Firefly, ComfyUI, ChatGPT. Точный объект 1:1 не скопируют.
Ответ написан
Комментировать
vpetrov
@vpetrov
частный SEO-специалист
И да, и нет. Любая модель худо-бедно это может, но с пачкой "но".
Во-первых, они не умеют считать.
Во-вторых, "ребёнок старше 12 лет" - это слишком общо и не заменяет подробного описания.
Повернуть дом на 20 градусов - по какой оси? В какую сторону? Им-то всё равно, куда крутить.
Могут внезапно затупить и игнорировать прямые указания. Надо переформулировать. Или сбрасывать контекст даже.
Задавать им точные цвета (хоть в RGB, хоть ещё как) тоже бесполезно, их не учили пользоваться пантонами.
Ну а так-то я бы даже "Нано Банана" посоветовал для начала. Хорошо работает с русскими промптами, прекрасно понимает, что и где на картинке есть, при требовании фотореализма не переврёт пропорции.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы