Думаю для свободного доступа только StableDiffusion, а для вашей задачи скорее всего нужно запрос под каждый образ составлять, готовую модель для подобного пока не видел, но можете поискать на этом сайте:
https://civitai.com/ Обычно там что-то новое нахожу.
Для StableDiffusion нужна видеокарта с хотя бы 4-мя гигами видеопамяти, если будет меньше, то будут частые вылеты и попросту некомфортная работа, в идеале нижняя планка 8 гиг.