Какую нейросеть можно использовать для позиционирования стикера на макете упаковки товара?
Нужно как-то автоматизировать процесс наложения стикера (белый прямоугольник с текстом) на макет развертки упаковки товара. Правила примерно такие:
1) Стикер должен быть расположен на одной из сторон коробки и не вылезать за края
2) Стикер не должен заслонять специальные значки на коробке (про переработку товара и пр.)
3) Стикер не должен заслонять список ингредиентов на английском языке
4) Расстояние от правого и левого края этого разворота коробки до стикера должно быть приблизительно равно
На вход есть pdf с макетом коробки и pdf со стикером. На выходе нужен pdf макета коробки с наложенным стикером. Посоветуйте, пожалуйста, как проще всего можно этого достичь.
P. S: кажется что новая генерация изображений в gpt-4o могла бы подойти для такой задачи, но пока она не доступна.
Безнадежные вводные.
1. Никто не будет делать и предоставлять в открытом доступе нейронные сети столь узкой направленности. Это не имеет ни какого коммерческого смысла.
2. Здесь речь идет о профессиональном софте работы с изображениями который поддерживает скриптинг (для автоматизации процесса).
Какой именно понятия не имею, я в этом не разбираюсь.
А я как раз не ищу узконаправленные нейронки. Хочу понять можно ли использовать что-то типо gpt-4o. Всё что мне по сути нужно это координаты где ставить стикер. Или отредактированное оригинальное изображение макета со вставленным чем-то временным куда нужно вставить стикер. Дальше я бы определил координаты этого объекта и вставил бы туда стикер. Пускай даже оно иногда будет ошибаться.
Или может быть как-то определять границы всех сторон коробки, границы блока с ингридиентами, границы спец. значков. И исходя из этого уже ставить стикер.
RDMStreet, gpt4o сможет решать эту задачу, с оговорками (вы можете это проверить через их api, от грамотно составленного промпта будет зависеть), но с некоторыми шансами на неуспех (есть локально доступные нейронки с еще более худшим качеством), и значительно хуже чем простой специализированный софт, на базе того же opencv и собственная обученная нейросетка (на пару порядков проще gpt)