Нужна помощь в алгоритмах распознавания речи?

Question

lightcaster @lightcaster

Распознавание речи

Нужна помощь в алгоритмах распознавания речи?

Хочу разобраться в теме. Хорошо себе представляю как происходит декодирование от фонем до уровня слов и гамматик. Но абсолютно не ориентируюсь в первых этапах обработки сигнала: сигнал -> вектор фич -> фонемы.

Может быть кто-то этим занимался. Было бы инетересны ссылки на статьи, а также тулзы по декодированию сигнала в вектор фич и фонем, и соответствующие словари. Смотрел по-диагонали cmu-sphinx, с налета не разобрался.

Спасибо.

Вопрос задан более трёх лет назад
3143 просмотра

Комментировать

Подписаться 7 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Data Scientist: расширенный курс

20 месяцев

Далее
GB (GeekBrains)

Специалист по внедрению ИИ

6 месяцев

Далее
Skillbox

Нейросети с нуля: ваш ИИ-ассистент для жизни и работы

2 месяца

Далее

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

+1 ещё

Простой
Диктовалки (speech to text) под Линукс?
- 2 подписчика
- 23 янв.
- 369 просмотров
2

ответа
JavaScript

+1 ещё

Простой
Есть ли js-библиотека для офлайн-распознавания русской речи?
- 1 подписчик
- 12 окт. 2025
- 221 просмотр
1

ответ
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент. 2025
- 133 просмотра
1

ответ
Машинный перевод с одного языка на другой

+1 ещё

Простой
Надёжный распознаватель речи в текст на разных языках?
- 2 подписчика
- более года назад
- 1215 просмотров
2

ответа
Windows

+1 ещё

Простой
Как на компе с виндой набивать голосом текст на русском языке, с качеством не хуже чем у клавиатуры gboard для Android?
- 1 подписчик
- более года назад
- 264 просмотра
2

ответа
Windows

+1 ещё

Простой
Насколько хороша Cortana встроенная в Win11 для распознавания русской речи?
- 1 подписчик
- более года назад
- 221 просмотр
1

ответ
C++

+2 ещё

Простой
Как обучить акустическую модель?
- 2 подписчика
- более года назад
- 168 просмотров
0

ответов
Нейронные сети

+1 ещё

Сложный
Какой использовать стек для создания полностью локального STT-LLM-TTS русско-английского голосового ассистента?
- 3 подписчика
- более года назад
- 1967 просмотров
2

ответа
Нейронные сети

+1 ещё

Простой
Как сделать голосовой командный интерфейс?
- 1 подписчик
- более года назад
- 74 просмотра
0

ответов
Node.js

+1 ещё

Простой
Как перевести аудио в текст в Яндекс SpeechKit v3?
- 2 подписчика
- более года назад
- 406 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2012-01-25 21:51:21

Можете начать, например, с HTK Toolkit. Там есть ссылка на книгу, в которой вначале идет теория. Сам тулкит использует скрытые Марковские модели для распознавания.

Нужна помощь в алгоритмах распознавания речи?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт