Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
Никита Каргин
@Pakonigoosy
Разработчик ПО
Нейронные сети
Существует ли модель, обратная Stable Diffusion?
Stable Diffusion создает картинки по текстовому описанию. А существует ли модель, создающая текстовое описание картинки.
Было бы круто, если бы при скармливании этого описания Stable Diffusion, она бы генерировала +- похожий результат
Вопрос задан
более года назад
87 просмотров
Комментировать
Подписаться
1
Простой
Комментировать
Facebook
Вконтакте
Twitter
Решения вопроса
1
rPman
@rPman
https://github.com/mlfoundations/open_clip
https://huggingface.co/laion/CLIP-ViT-H-14-laion2B...
лучше гуглить сразу CLIP image classification, тьма моделей начиная с openai, разбираться долго
p.s. еще про анализ объектов на изображении лучше начни копать от
сюда
или лучше
segment-anything
фейсбук много чего выкладывает
Ответ написан
более года назад
Комментировать
Нравится
3
Комментировать
Facebook
Вконтакте
Twitter
Пригласить эксперта
Ответы на вопрос
1
Василий Банников
@vabka
Да, есть.
https://imagetoprompt.com/
Ответ написан
более года назад
Комментировать
Нравится
2
Комментировать
Facebook
Вконтакте
Twitter
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Нейронные сети
Простой
Как в comfyUi изменить текст промпта сразу в нескольких узлах?
2 подписчика
22 часа назад
171 просмотр
1
ответ
Нейронные сети
+2 ещё
Средний
Почему MidJourney и другие ИИ изменяют мою исходную картинку?
1 подписчик
27 февр.
212 просмотров
5
ответов
Видео
+2 ещё
Простой
Какая нейросеть генерит короткие видосы?
3 подписчика
25 февр.
104 просмотра
0
ответов
Windows
+4 ещё
Простой
Существует ли бесплатная онлайн нейросеть или программа которая из обычной статической картинки делает анимированную?
1 подписчик
24 февр.
321 просмотр
3
ответа
Нейронные сети
Простой
Какие модели могут оценить картинку по URL?
1 подписчик
12 февр.
57 просмотров
0
ответов
Нейронные сети
+1 ещё
Простой
Хорошо ли распознают современные версии FineReader по сравнению со старыми?
1 подписчик
04 февр.
104 просмотра
1
ответ
Нейронные сети
+1 ещё
Простой
Какие есть способы сделать динамическое квантование LLM в GGUF?
1 подписчик
29 янв.
93 просмотра
0
ответов
Нейронные сети
+1 ещё
Средний
Есть ли системы озвучки текста учитывающие интонации и эмоции конкретного человека?
1 подписчик
27 янв.
128 просмотров
2
ответа
Нейронные сети
+1 ещё
Простой
Чем автоматизировать некоторые задачи обработки фото с распознаванием местоположение лица?
1 подписчик
26 янв.
95 просмотров
2
ответа
Нейронные сети
Средний
LLM. Qwen2.5-Coder-32b-IQ2_XS vs Qwen2.5-Coder-14b-Q4_K_M. Что лучше?
3 подписчика
24 янв.
151 просмотр
1
ответ
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Senior AI Developer (Pyhton)
Akronix
•
Москва
от 200 000 ₽
ML-разработчик (Junior)
Xelari
от 60 000 ₽
Руководитель проектов цифровых медиа
SMI#1
от 120 000 ₽
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама