Возможно что-нибудь типа kinect для определения положения валика. Валик играет роль кисти для альфа-канала видео с предопределенными и отрепетированными переключениями сцен.
Ну или вариант 2 (имхо более реалистичный): на видел видно что оно заметно ускорено, на небольшой скорости вполне можно успеть просто водить валиком в нужных местах и за пару-тройку дублей снять как надо.