Какой алгоритм для минимизации ошибок при распознавание речи посоветуете?
Есть исходный текст и текст, распознанный в реальном времени с помощью bing speech api. В целом оба текста должны совпадать, но могут быть отклонения (то есть человек говорит по исходному тексту, но может начать из любого места или прерваться на время и начать говорить не по теме, а затем продолжить читать по тексту). Как можно избавиться от ошибок распознавания речи? Само апи предоставляет обработку ошибок в словах, то есть такие слова существует, но человек мог произнести совсем другое слово, а не то которое распознал фреймворк, как можно на основе соседних распознанных слов понять, что это просто ошибка распознавания, а не человек начал читать из другого места? Нужно воспользоваться каким-нибудь алгоритмом нечеткого поиска для слов в предложениях?