Какие есть технологии для распозваниия видео (именно видео, а не отдельных кадров)?
Есть OpenCV, она может распознавать отдельные кадры видео. Я могу узнать человека в каждом кадре. Но что делать, если мне нужно знать, бежит ли он или машет руками? Я могу распознать дерево в каждом кадре, но мне нужно выяснить, качается ли дерево на ветру. Я могу распознать ветрогенератор в каждом кадре, но мне нужно знать, вращается ли он прямо сейчас.
Поэтому возникает вопрос: существуют ли технологии, библиотеки, алгоритмы или хотя бы концепты для распознавания объектов в течение определенного периода времени? Например, у меня есть серия из нескольких кусков кадров, в каждом из которых точно есть человек, и мне нужно выяснить, ходит ли он или машет руками.
Может есть хотя бы какие-нибудь статьи или описания идей подобной технологии? Идеи по обучению такой системы, хранение данных и так далее.