Worlding, поскольку я записываю ролики для себя - в большинстве случаев они короткие, единицы минут. Однако, насколько я понимаю, SubtitleEdit для транскрибации использует готовые оффлайновые модули - Vosk или Whisper, соответственно, возможности зависят от них. Более качественно сутбитры даёт Whisper. Однако, изредка (в десятой части случаев) результат Whisper'a получается неудовлетворительным. И тут выручает Vosk. Такого, чтобы в обоих случаях ничего не вышло было лишь пару раз для настолько зашумлённых роликов, что там и человек врядли что-то может разобрать.
Написано
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.