Нужна помощь в алгоритмах распознавания речи?

Хочу разобраться в теме. Хорошо себе представляю как происходит декодирование от фонем до уровня слов и гамматик. Но абсолютно не ориентируюсь в первых этапах обработки сигнала: сигнал -> вектор фич -> фонемы.


Может быть кто-то этим занимался. Было бы инетересны ссылки на статьи, а также тулзы по декодированию сигнала в вектор фич и фонем, и соответствующие словари. Смотрел по-диагонали cmu-sphinx, с налета не разобрался.


Спасибо.
  • Вопрос задан
  • 3136 просмотров
Пригласить эксперта
Ответы на вопрос 1
@fralik
Можете начать, например, с HTK Toolkit. Там есть ссылка на книгу, в которой вначале идет теория. Сам тулкит использует скрытые Марковские модели для распознавания.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
03 окт. 2024, в 13:05
15000 руб./за проект
03 окт. 2024, в 12:54
10000 руб./за проект
03 окт. 2024, в 12:52
7000 руб./за проект