С использованием opencv такое пишется довольно быстро и дёшево. Двух - трёх камер будет вполне достаточно. Основные моменты - определить координаты объекта в системе координат камер (например, по цвету), а затем перевести в нужные. Пример решения аналогичной задачи можете посмотреть в
моей статье.