Нужно реализовать следующее: на стол кладется предмет, камера его фиксирует и на распберри пи отправляет сигнал о том, что предмет на столе, а когда его забирают о том, что предмет удален.
Звучит крайне просто, но я запутался, когда начал копать про компьютерное зрение. Везде пишут , что требуются знания линейной алгебры и матанализа, а это курс высшей математики годичный! Я уже всё это и забыл. Может для моей задачи можно основы изучить какие-то, не подскажите?
Python владею достаточно неплохо.
Вы написали не в тот тег, примите рекомендованные исправления.
Кроме того, вопрос в принципе поставлен не совсем верно. Распознавание образов - задача весьма распространенная и под неё наделано множество инструментов относительно высокоуровневых. А матан и линал - это таки для того случая, если вам не удастся решить проблему готовыми высокоуровневыми средствами и придётся городить свой велосипед на костылях.
В теории здесь нужно иметь скриншот стола когда он пуст и сравнивать его с текущим скриншотом. Если ракурс и освещение у скринов одинаковые, то дельта двух скринов покажет есть что-то новое на столе или нет.
Ну совсем без знаний эту задачу не решить. Надо хотя бы иметь представление о матрицах и операциях с ними. Остальное вполне могут сделать готовые библиотеки. Например: https://proglib.io/p/real-time-object-detection