Как увеличить точность работы системы для поиска товаров на фото?
Работаю над системой поиска товаров расположеных на фото (в основном одежда). Логика приблизительно схожа с логикой работы google lens. Алгоритм хорошо работает для фото на которых человек или единичный товар расположен хорошо, но если человек стоит в неестественной позе или фон сильно плохой алгоритм работает плохо.
Для поиска использую Mask RCNN, а также ResNet для поиска схожих товаров по фичам.
Может у когото есть предположения по поводу улучшения точности работы алгоритма?
Для начала - декомпозировать ошибки (например, где ошибается детектор, а где - собственно поиск по фичам), и дальше уже решать (докидывать данные, усложнять/переучивать модель и т.п.)