Есть задача
(для меня это академический интерес) посчитать количество однотипных объектов на фото.
Пример фотографии.
Условия:
- Разная погода/освещение/ракурс
- Фотки делаем на телефон и шлём боту в telegram
- Время подсчёта – хотя бы меньше 10 секунд
- В идеале выполнять расчёты на хостинге, без привлечения GPU
На выходе желательно получить такую же фотку, размеченную bounding box'ами с их нумерацией и общим количеством (для визуального контроля).
Пример.
Пробовал адаптировать код из статьи для своей задачи –
получается плохо, скорее всего из-за "полевых" условий съёмки. Рулоны бывают лежат не точно в плоскости и/или чем-нибудь немного закрыты. Уже предвижу ложные срабатывания на отражения в луже или какие-нибудь колёса автомобилей.
Попался еще такой
пример на котиках. Там речь о каких-то предварительно обученных классификаторах и вряд ли среди них будут рулоны))
Поэтому стал двигаться в сторону нейронных сетей. Нашёл такой диссер –
Автоматизированный подсчет объектов на изображении.... Сложная для меня тема.
- Можно ли всё-таки обойтись "обычными" алгоритмами и не влезать в машинное обучение?
- Если да, то что посоветуете. Вдруг я просто упустил из виду готовое решение для своей задачи (из того же OpenCV)
- Если ML надо изучать, то прошу совета по поводу диссертации. Насколько реально повторить опыт исследователей.
Или может есть уже готовая нейронка, которой достаточно скормить свой датасет.