Существует ли готовая нейросеть, которая составляет текстовое описание изображения?
Мне нужна нейросеть, которая составляет текстовое описание изображения(описание должно быть полным, а не просто количество и названия предметов на изображении). Желательно, конечно, чтобы она работала на удалённом сервере и подключалось по API, но можно и локальную. GPT-4 не предлагать.