Эффективное ПО для распознавания речи с поддержкой русского языка?

Можете порекомендовать что-нибудь действенное? Есть, например, запись радиопрограммы, хочется сделать более-менее годную стенограмму.
  • Вопрос задан
  • 26528 просмотров
Пригласить эксперта
Ответы на вопрос 9
На данный момент времени решения нет.

Русский язык фонетически слишком сложен. Можно добиться более-менее корректного распознавания отдельных слов, но о нормальном преобразовании надиктованного предложения в текст можно только мечтать.
Ответ написан
Запись радиопрограммы можно распознать с помощью Voco Professional www.speechpro.ru/product/rechevye-produkty/voco/sp...
Сначала скачайте демоверсию и убедитесь, что качество ваших записей достаточно для распознавания.
Ответ написан
Shultc
@Shultc
RnD Developer
Такой вопрос уже задавался мной всего лишь месяц назад. =)
Правда там ничего особо дельного не предложили =(
Ответ написан
kuzemchik
@kuzemchik
SpeechPro. (было выше) У них есть saas решение с недавнего времени, лучше им писать. Нам оно не подошло, но вам может, в принципе.
Google speech Api
У Nuance есть пара нормальных продуктов: www.nuance.com/for-individuals/by-product/dragon-for-pc/index.htm
Ответ написан
a1ndrey
@a1ndrey
Тут же основной вопрос: Вам за деньги или побаловаться. Очень много облачных решений с приемлемым распознаванием, но они платные.
Ответ написан
raqeta
@raqeta
В обновлении в Evernote для Android есть хорошая русская надиктовка речь в текст.
Ответ написан
@impass Автор вопроса
едва ли это заслуга Evernote

Evernote for Android Update: Speech-to-text and Big Widget Enhancements
The speech-to-text feature uses Google Android’s text transcription service. You must be online for it to work. Also, this capability is available on version 4 of the Android Operating System (aka Ice Cream Sandwich) and some devices with version 2.2 and above. If you see the speech-to-text option appear when you update, then you’ll know that your phone or tablet supports the functionality.
Ответ написан
@nshmyrev
Попробуйте библиотеку для распознавания речи с открытым исходным кодом "Воск":

https://github.com/alphacep/vosk-api

Преимущества библиотеки:

  • Поддерживает 9 языков - русский, английский, немецкий, французский, португальский, испанский, китайский, турецкий, вьетнамский. В скором времени будут добавлены и другие
  • Работает без доступа к сети даже на мобильных устройствах - Raspberry Pi, Android, iOS
  • Устанавливается с помощью простой команды pip3 install vosk без дополнительных шагов
  • Модели для каждого языка занимают всего 50Мб, но есть и гораздо более точные большие модели для более точного распознавания
  • Сделана для потоковой обработки звука, что позволяет реализовать мгновенную реакцию на команды
  • Поддерживает несколько популярных языков программирования - Java, C#, Javascript
  • Позволяет быстро настраивать словарь распознавания для улучшения точности распознавания
  • Позволяет идентифицировать говорящего


Для распознавания радиопередач можно установить сервер из docker, проект здесь

https://github.com/alphacep/vosk-server

Запускается одной командой:

docker run -d -p 2700:2700 alphacep/kaldi-en:latest
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы