Изучив немного тему, я бы рекомендовал ввести ряд определений, в частности понятие "объект" в контексте машинного зрения. Такого в интернете и в учебниках навряд ли найдёшь, но это упрощает (с моей точки зрения) понимание.
Изображение — это набор простых форм.
Простая форма — это плавно меняющийся цвет в некотором диапазоне ограниченной области пространства.
Объект — это сложно-сочленённая форма. Состоит из резко или относительно плавно меняющихся цветов простой формы. Например: Человек (1) с каштановыми волосами (2), одет в синюю майку (3), белые трусы(4) и кроссовки (5).
Таким образом человек состоит из 5 цветов и N оттенков. Чтоб найти человека на изображении, его нужно "собрать" с простых форм и сравнить с шаблоном.