Задать вопрос
@Flatout73

Какой алгоритм для минимизации ошибок при распознавание речи посоветуете?

Есть исходный текст и текст, распознанный в реальном времени с помощью bing speech api. В целом оба текста должны совпадать, но могут быть отклонения (то есть человек говорит по исходному тексту, но может начать из любого места или прерваться на время и начать говорить не по теме, а затем продолжить читать по тексту). Как можно избавиться от ошибок распознавания речи? Само апи предоставляет обработку ошибок в словах, то есть такие слова существует, но человек мог произнести совсем другое слово, а не то которое распознал фреймворк, как можно на основе соседних распознанных слов понять, что это просто ошибка распознавания, а не человек начал читать из другого места? Нужно воспользоваться каким-нибудь алгоритмом нечеткого поиска для слов в предложениях?
  • Вопрос задан
  • 227 просмотров
Подписаться 1 Оценить Комментировать
Помогут разобраться в теме Все курсы
  • GB (GeekBrains)
    Специалист по внедрению ИИ
    6 месяцев
    Далее
  • Нетология
    Data Scientist: расширенный курс
    13 месяцев
    Далее
Пригласить эксперта
Ответы на вопрос 2
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
Попробуйте подключить API Stumper.ru
Выдаёт очень точные результаты на совпадения двух строк.
ede39a35933e42edbc9da3408edb748c.jpg
Ответ написан
Комментировать
dimonchik2013
@dimonchik2013
non progredi est regredi
см. NLTK

биграмы, триграммы и статистика

насчет "читал отсюда, а теперь не отсюда" будет посложнее, но в целом так же
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы