Здравствуйте!
Есть несколько вопросов по машинному обучению(новичка-новичка).
Использую Python + ImageAI.
from imageai.Detection import ObjectDetection
Задача, упрощенно - получить количество кубиков в коробке. Все кубики одного цвета, один может перекрывать другой.
1) Можно ли добиться нормального распознавания (с высокой точностью)?
2) И что для этого надо сделать - то есть какие картинки лучше в обучение пихать?
Мне неясен сам принцип, как система запоминает те или иные объекты. Мне лучше много снимков, где в кадре один объект, но под определенным углом? Или лучше, когда в кадре куча объектов, в часности какие-то друг друга перекрывают?
3) Как система реагирует, когда я в рамочку (через LabelImg) обвожу повернутый объект, который частично перекрывает другой? Должен ли я обвести все кубики на картинке, или это необязательно?
4) ну и последнее, самое простое, наверное - что такое функция LOSS? Не, я понимаю, что это доля потерь, ошибок. Но, например, если на первой итерации LOSS = 150, и на последней LOSS=15, вот 150 - это от чего? От 1000? То есть какое число отражает 100% потерь?
Смысл в чем. Сейчас у меня набор из 130 картинок. Угадывает система примерно 80% объектов, LOSS 16. Если я увеличу до 200, вырастет ли качество распознавания? И если увеличивать до 200 (а то и выше) - я как раз хочу понять, какие картинки подбирать и размечать, чтобы обучение было наиболее эффективным.