Задать вопрос

Flatout73 @Flatout73

распознавание-речи

Распознавание речи

Какой алгоритм для минимизации ошибок при распознавание речи посоветуете?

Есть исходный текст и текст, распознанный в реальном времени с помощью bing speech api. В целом оба текста должны совпадать, но могут быть отклонения (то есть человек говорит по исходному тексту, но может начать из любого места или прерваться на время и начать говорить не по теме, а затем продолжить читать по тексту). Как можно избавиться от ошибок распознавания речи? Само апи предоставляет обработку ошибок в словах, то есть такие слова существует, но человек мог произнести совсем другое слово, а не то которое распознал фреймворк, как можно на основе соседних распознанных слов понять, что это просто ошибка распознавания, а не человек начал читать из другого места? Нужно воспользоваться каким-нибудь алгоритмом нечеткого поиска для слов в предложениях?

Вопрос задан более трёх лет назад
227 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Data Scientist: расширенный курс

13 месяцев

Далее
GB (GeekBrains)

Специалист по внедрению ИИ

6 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

xmoonlight

xmoonlight @xmoonlight

https://sitecoder.blogspot.com

Попробуйте подключить API Stumper.ru
Выдаёт очень точные результаты на совпадения двух строк.

Ответ написан более трёх лет назад

Комментировать

Комментировать

dimonchik2013

Dimonchik @dimonchik2013

non progredi est regredi

см. NLTK

биграмы, триграммы и статистика

насчет "читал отсюда, а теперь не отсюда" будет посложнее, но в целом так же

Ответ написан более трёх лет назад

Комментировать

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

JavaScript

+1 ещё

Простой
Есть ли js-библиотека для офлайн-распознавания русской речи?
- 1 подписчик
- 12 окт.
- 202 просмотра
2

ответа
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент.
- 105 просмотров
1

ответ
Машинный перевод с одного языка на другой

+1 ещё

Простой
Надёжный распознаватель речи в текст на разных языках?
- 2 подписчика
- 06 мая
- 1187 просмотров
2

ответа
Windows

+1 ещё

Простой
Как на компе с виндой набивать голосом текст на русском языке, с качеством не хуже чем у клавиатуры gboard для Android?
- 1 подписчик
- 03 мар.
- 241 просмотр
2

ответа
Windows

+1 ещё

Простой
Насколько хороша Cortana встроенная в Win11 для распознавания русской речи?
- 1 подписчик
- 12 февр.
- 191 просмотр
1

ответ
C++

+2 ещё

Простой
Как обучить акустическую модель?
- 2 подписчика
- более года назад
- 158 просмотров
0

ответов
Нейронные сети

+1 ещё

Сложный
Какой использовать стек для создания полностью локального STT-LLM-TTS русско-английского голосового ассистента?
- 3 подписчика
- более года назад
- 1442 просмотра
2

ответа
Нейронные сети

+1 ещё

Простой
Как сделать голосовой командный интерфейс?
- 1 подписчик
- более года назад
- 69 просмотров
0

ответов
Node.js

+1 ещё

Простой
Как перевести аудио в текст в Яндекс SpeechKit v3?
- 2 подписчика
- более года назад
- 352 просмотра
1

ответ
Python

+1 ещё

Простой
Ошибка UNAUTHORIZED при работе с Yandex SpeechKit API: Как правильно передать API-ключ?
- 1 подписчик
- более года назад
- 405 просмотров
1

ответ
Показать ещё Загружается…

Менеджер проектов

Vital Partners • Москва

от 160 000 до 180 000 ₽

Database Administrator / Администратор PostgreSQL

Vital Partners

от 200 000 до 270 000 ₽

Technical support (Ассистент Product Owner)

uKit Group • Ростов-на-Дону

от 50 000 до 55 000 ₽