Формально такое можно собрать из открытых данных и кода.
Модель для распознавания речи whisper от openai, есть даже реализация на процессоре whisper.cpp
Переводчик от facebook - nnlb, у нее даже маленькая версия работает на процессоре быстро со сносным переводом. Модель заточена на перевод коротких фраз, идеально для субтитров.
И при должном везении это даже будет работать на лету на cpu, готовой реализации именно плеера я не видел, но по отдельности полно на гитхабе.
P s. Осторожно с лицензиями, они не открытые и применимость моделей для бизнеса нужно изучать