Для обучения, конечно потребуется набор размеченных изображений(25-30 должно хватить), на которых выделена рамка ( в таком-же формате, как и хочется получать результат.
Также по идее должно получиться обучить сетку выдавать координаты левого-верхнего и правого-нижнего внутренних углов рамки -- взять что-то типа обученного на ImageNet-е res-net/yolo/ssd выкинуть полносвязные слои и дообучить на свою задачу, но для этого скорее-всего потребуется большая обучающая выборка..
https://towardsdatascience.com/background-removal-... -- вот хорошая статья на почти похожую тему -- они пытаются отделить фон с изображения
В идеале U-net тебе даст чёрно-белое изображение, где пиксели принадлежащие рамке окрашены в чёрный, а всё остальное -- в белый. По этому выходу обрезать рамку можно уже как угодно.
Написано
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Также по идее должно получиться обучить сетку выдавать координаты левого-верхнего и правого-нижнего внутренних углов рамки -- взять что-то типа обученного на ImageNet-е res-net/yolo/ssd выкинуть полносвязные слои и дообучить на свою задачу, но для этого скорее-всего потребуется большая обучающая выборка..