@Flatout73

Какой алгоритм для минимизации ошибок при распознавание речи посоветуете?

Есть исходный текст и текст, распознанный в реальном времени с помощью bing speech api. В целом оба текста должны совпадать, но могут быть отклонения (то есть человек говорит по исходному тексту, но может начать из любого места или прерваться на время и начать говорить не по теме, а затем продолжить читать по тексту). Как можно избавиться от ошибок распознавания речи? Само апи предоставляет обработку ошибок в словах, то есть такие слова существует, но человек мог произнести совсем другое слово, а не то которое распознал фреймворк, как можно на основе соседних распознанных слов понять, что это просто ошибка распознавания, а не человек начал читать из другого места? Нужно воспользоваться каким-нибудь алгоритмом нечеткого поиска для слов в предложениях?
  • Вопрос задан
  • 226 просмотров
Пригласить эксперта
Ответы на вопрос 2
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
Попробуйте подключить API Stumper.ru
Выдаёт очень точные результаты на совпадения двух строк.
ede39a35933e42edbc9da3408edb748c.jpg
Ответ написан
Комментировать
dimonchik2013
@dimonchik2013
non progredi est regredi
см. NLTK

биграмы, триграммы и статистика

насчет "читал отсюда, а теперь не отсюда" будет посложнее, но в целом так же
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы