таких не существуют
есть нейронки текст+изображение -> текст (а тебе нужно текст+изображение -> текст+изображение), но на рабочие задачи там 50 но 50, то не работает, то фигня получается.
нейронки, которые генерируют изображения даже близко к ИИ не подошли, это просто красивые галлюцинации.