FFmpeg
Есть отличный биндинг для питона:
https://github.com/kkroening/ffmpeg-python
Можно даже натравить потом на это TTS, который сгенерит субтитры с временнЫми метками, а на них уже натравить какой-нибудь Elasticsearch, чтобы можно было делать текстовый поиск по видосам и быстро находить нужные фрагменты лекций. Если к этому прикрутить ещё и предобученную ламу, то можно будет не изголяться с составлением поискового запроса в таком виде, чтобы он искался по индексу, а задавать вопросы по человечески, лама сама определит тему, найдёт место в лекциях и скинет ссылку на таймкоды где послушать.
И это будет очередной шаг к протезированию мозга=) Ничего не поделаешь, к этому и идём. Нормальный процесс.