Как реализовать распознаваение бутылки по ее фотографии?
Есть достаточно большая коллекция изображений бутылок с алкоголем в хорошем качестве. С текстовым описанием того, что это за бутылка.
Есть желание на основании этой коллекции сделать распознователя бутылок. Например в виде телеграм бота, котором пользователь отправил фото бутылки, а в ответ полчает текст с описанием бутылки.
Вот только проблема в том, что не знаю с чего начать и какие технологии использовать по части распознования бутылок. Какие библиотеки и технологии использовать. Какой порядок примерный действий. Язык будет Python.
Буду рад за все мнения и советы.
Спасибо!
bubublik я бы на вашем месте взял бы какую-нибудь известную сетку (inception, например), загрузить веса imagenet. Далее заморозить верхние слои и дообучить на вашем датасете. По сути, вы получите обычный классификатор
Доброго времени суток. Ну... старт дан. Python достаточно мощный инструмент во всех аспектах вашей идеи.
Предлагаю поступить следующим образом:
1) Для начала в Google Colab натренировать сеть. Если есть возможность по мощностям на домашнем PC - можно на нем. Разбить ваши фотографии на тренировочный и тестовый сет и посмотреть результаты. Для всего этого вам понадобится CNN(Convolutional Neural Network), предлагаю сначала ознакомиться с концепцией распознавания объектов с помощью CNN.
2) Написать API для конечной модели сети
3) Написать бота, протестировав основные функции, которые требуются вам(напр. загрузка фотографий).
4) Связать модель нейронной сети и бота по написанному API
Собственно CNN для этого и создана. Если для распознавания рукописного текста подойдет и RNN - Сверточная Нейронная сеть служит для распознавания более сложных объектов.