Задать вопрос
@otachkin
Программист php

Насколько сложно написать систему подсчета количества однотипных действий человека на видео?

Есть база коротких видео продолжительностью около 3 минут (180000 шт.) где люди делают однотипные действия, например приседания, для каждого видео известно количество действий.
Насколько сложно и сколько бы могла стоить разработка системы, которая в автоматическом режиме смогла бы обработать видео и посчитать сколько однотипных действий совершил человек.
  • Вопрос задан
  • 2124 просмотра
Подписаться 12 Простой 3 комментария
Пригласить эксперта
Ответы на вопрос 5
zoonman
@zoonman
⋆⋆⋆⋆⋆
Ответ написан
Комментировать
Taraflex
@Taraflex
Ищу работу. Контакты в профиле.
{бредовый способ}
Если действия так или иначе заставляют человека совершать движения головой с достаточной амплитудой. То достаточно взять любую либу распознавания лиц на фото (позиции лиц уже давно научились достаточно точно трекать) и измерять цикличность колебаний рожи человека.
{/бредовый способ}
Ответ написан
Комментировать
@asd111
Можно попробовать взять обычный классификатор изображений натренированный на imagenet, который может по картинке сказать что там, например определить приседание или что человек стоит и т.п.
Потом разбить видео на кадры и проверить каждый кадр через этот классификатор. Потом посчитать результаты классификатора.
Например гугл определяет эту картинку как "статические приседания".5a035ba2c25fb883814062.jpeg

Попробуйте сделать скриншот видео и залить на гугл, если гугл определяет что происходит на картинке, то способ который я описал может сработать.

По поводу цены спросите на ods.ai там же можно поискать исполнителей. Это российское сообщество специалистов по ai и среди них есть те кто занимал высокие места на kaggle.
Ответ написан
Комментировать
@popov654
Специалист в области веб-технологий
Я может полный бред сейчас напишу, но возможно, есть математические методы, как определить скелеты людей на видео (начать с поиска контрастных областей, отделив людей от фона, а потом попытаться построить векторы конечностей), и задать приседания как определённые движения скелета человека в пространстве? В конце девяностых так распознавали порнографию на видео, была очень хорошая точность. Про это есть даже статья на Хабре. Имхо, это получится проще, быстрее в разработке, чем нейросеть с её обучением, а главное - не потребует огромную базу образцов для обучения находить.
Ответ написан
Комментировать
adugin
@adugin
Самая простая гипотеза, которую я бы проверил в первую очередь - вычисление пульсации средней яркости и/или цвета. Для простоты можно уменьшить размер кадра и даже дополнительно размыть изображение. Тогда никакие нейронки не требуются.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы