Задать вопрос
fanat_win_8_1
@fanat_win_8_1
Олдовый пользователь родом из 90-х

Какие есть сервисы для «вытягивания» слов из аудио и видео файлов?

Доброе утро!
Подскажите, пожалуйста, какие есть онлайн-сервисы (а может и оффлайн-программы для Windows), где можно закинуть аудио или видеофайл (например, песню на иностранном языке) - а оно тебе выдаст текст этой песни? Есть таковые? Я так понимаю, это основано на ИИ.
  • Вопрос задан
  • 173 просмотра
Подписаться 1 Простой 1 комментарий
Пригласить эксперта
Ответы на вопрос 3
opium
@opium
Просто люблю качественно работать
мне Whisper от OpenAI нормально работал — оффлайн, бесплатно, поддерживает кучу языков. Под виндой есть обёртки типа Whisper Batch Transcriber: кидаешь файл, получаешь текст. Из онлайн — Писец (pisec.app).

p.s. с песнями точность всегда хуже чем с обычной речью, сам замечал
Ответ написан
Комментировать
@SunTechnik
В Google вбиваем: "расшифровка аудио в текст"
Далее читаем, пробуем.

Ну или вот обзор:
https://habr.com/ru/companies/bothub/articles/979320/

Но расшифровывать песню сложнее, чем нормальный текст, так как ради мелодии как только над словами не изголяются.
Если известен автор произведения - проще найти в интернете готовую текстовку.
Ответ написан
Комментировать
@rPman
Для музыки, сначала нужно ее сепарировать, отделить вокал от инструментов, сам я этим не занимался, из последних топовых решений есть это:
https://github.com/lucidrains/BS-RoFormer

Если погуглить, есть какой то gui для чуть по старее решений, там на выбор несколько моделей, в т.ч. удаляющих шумы.
https://github.com/Anjok07/ultimatevocalremovergui

А уже потом полученный чистый файл подсовывать whisper, он работает прямо сразу после установки из pip install (скачает указанную модель сам).
whisper лучший для русского языка из доступных локально, но помним что он может пропускать и придумывать тексты (классический пример, в конце субтитров добавляет выдуманного автора)
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы