Для начала нужно выбрать алгоритм работы и основу для данной задачи. Такая задача может быть реализована с помощью opencv или же с помощью сверточных нейронных сетей (CNN object detection). Если выбор лежит в сторону нейронных сетей то лучше использовать готовые струткруры детекторов (например YoLo). Также желательно найти готовый датасет уже размеченых фото, например
mrl.cs.vsb.cz/eyedataset, или разметить картинки самому
https://towardsdatascience.com/collecting-data-for...
В датасете уже пристутствуют размеченые данные и координаты блоков. При непосредственной работе с обученой сетью и ее внедрению в систему нужно будет принимать с выхода сети тензор (вектор) с размечеными областями и вектор классов, но для задачи определения одного типа обьектов (глаза) вектор классов Вам не понадобится