1Aspect1
@1Aspect1

Как реализовать распознавание объектов на python?

Суть в том, чтобы через камеру анализировать рельсы, на которых бывают различные сколы/изломы и отправлять в базу данных все эти поломки. Можете посоветовать что-нибудь из этой сферы (статьи, сайты, ролики), которые помогут в кратчайшие сроки реализовать эту задумку. Вообще насколько это реальная задача, чтобы камера максимально точно обучилась это определять. (Анализировать всё будет raspberry pi)
  • Вопрос задан
  • 152 просмотра
Пригласить эксперта
Ответы на вопрос 4
fox_12
@fox_12
Расставляю биты, управляю заряженными частицами
Нужно в первую очередь определиться с камерой, методами измерений, чтобы получить наиболее контрастное и четкое изображение изломов и дефектов.
Применение нейросетей (если они вообще в этой задаче после этого понадобятся) - уже дело второе...
Ответ написан
Vindicar
@Vindicar
RTFM!
1. Данные, данные и ещё раз данные. У тебя есть выборка на несколько тысяч (а лучше десятков тысяч) дефектов? А выборка "приемлемо чистых", т.е. с незначительными дефектами?
2. Допуски. Сколько допустимо пропущенных дефектов? На 100% даже не надейся, 90% уже будет подвигом. Аналогично, сколько допустимо "ложных тревог"?
3. Как обеспечить условия съёмки? Какую предобработку изображения делать? Что за данные в итоге будет получать модель, которую ты будешь использовать? На эти вопросы нужно ответить. Кривые данные на входе - и ни одна ML модель не справится.
4. Эксперименты с моделями на тему "кто лучше". Подбор гиперпараметров модели.

Ну и просто для представления, что за жесть внедрение CV на производстве.
Тоссим руду: очень неочевидная ИТ-задача
Что случается с металлоломом и зачем там хардкорное ИТ

Короче, про "кратчайшие сроки" лучше забыть, имхо.

Если б мне поставили такую задачу, я бы уволился нафиг взял бы python-opencv для получения и предварительной обработки изображений, и tensorflow, если бы остановился в итоге на нейронках для анализа. Но это только потому что я другими инструментами не владею. =(

Ну и да, про "не углубляться в теорию" и "скопипастить половину кода" тоже забудь. С таким настроем лучше сразу на фриланс.
Ответ написан
AlexNest
@AlexNest
Работаю с Python/Django
Смотреть следует в сторону CV2/OpenCV.
Вообще насколько это реальная задача, чтобы камера максимально точно обучилась это определять.

В теории - возможно, но все упирается в качество снимков и количество примеров поломок, которые вы сможете скормить нейросети.
Ответ написан
@mayton2019
Bigdata Engineer
Raspberry Pi - это игрушка для энтузиастов. Если вы на разработку модели потратили тера-флопы облаков с TPU то нет смысла такую модель запускать на детской конфигурации. Тем более что речь идет о рельсах. Это железная дорога. А железная дорога вполне себе способна оплатить нормальный десктоп. И я никогда не поверю в какую-то здесь в данном случае экономию.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы