@i_rustem
Знаю java, swift, javaScript, HTML, CSS.

Как написать программу, которая распознает глаза и лица на фото?

Добрый день, появилась идея для создания видео. И возник вопрос: как сделать чтобы программа у каждой фотки находила глаза и указала позицию в координатах ? Всем советам буду благодарен)
  • Вопрос задан
  • 188 просмотров
Решения вопроса 1
@rostik_tsekhmistro
Data Scientist
Для начала нужно выбрать алгоритм работы и основу для данной задачи. Такая задача может быть реализована с помощью opencv или же с помощью сверточных нейронных сетей (CNN object detection). Если выбор лежит в сторону нейронных сетей то лучше использовать готовые струткруры детекторов (например YoLo). Также желательно найти готовый датасет уже размеченых фото, например mrl.cs.vsb.cz/eyedataset, или разметить картинки самому https://towardsdatascience.com/collecting-data-for...
В датасете уже пристутствуют размеченые данные и координаты блоков. При непосредственной работе с обученой сетью и ее внедрению в систему нужно будет принимать с выхода сети тензор (вектор) с размечеными областями и вектор классов, но для задачи определения одного типа обьектов (глаза) вектор классов Вам не понадобится
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
@dmshar
Как написать программу, которая распознает глаза и лица на фото? - какие чудесные, содержательные вопросы пошли на форуме. Ну вот "как написать программу"?
Да элементарно написать такую программу, так-же, как пишутся любые другие программы.
1. Изучаем подходящий язык программирования. Подойдет любой - Python,С++,С#, Julia, Go.... на худой конец сойдет и Java.
2. Изучаем методы или ХОТЯ-БЫ инструменты для решения вашей проблемы(в данном случае - распознавания изображения по фото-видео) созданные кем то другим и любезно предоставленные для широкого пользования. Именно изучаем - т.е. смотрим, сравниваем, какой нам подойдет, а какой нет, каким удобнее пользоваться именно в нашем конкретном случае и исходя из нашего опыта, какой дешевле купить, легче установить, проще интегрировать и т.д.
3. Думаем, как встроить/использовать изученные вами и инструменты в программу, которую вы напишете на изученном вами языке.
4. Обучаем построенную систему - как это сделать отличается для каждого из инструментов и (вот неожиданность!) описывается в документации к нему. Кроме того, на сегодня в интернете для каждого из инструментов существует по несколько десятков примеров их использования в аналогичных проектах - ищем, изучаем, применяем.
5.После этого легко и непринужденно применяем нашу программу там и так, как посчитаем нужным. Хоть для распознавания лиц и глаз, хоть ушей и хвостов, хоть колес и руля.
Все, как вы видите совершенно так-же как и при решении любой задачи - ИЗУЧАЕМ, ДУМАЕМ, ПРИМЕНЯЕМ. А вы думали, что эта задача решается как-то по другому, и ее можно в трех строчках описать в виде ответа на форуме. Или что какой-то из этих этапов можно пропустить?
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы