@stainer

Как создать свою языковую модель под pocketsphinx?

Добрый день!
Появилась потребность распознавать "стоп-слова" в wav файлах.
Для этого решил воспользоваться библиотекой cmusphinx/pocketsphinx.
Все настроил и поставил русскую модель с офф. сайта "zero_ru_cont_8k_v3.tar.gz".
И вроде бы все ок, но нужно распознавать слова, которые не входят в эту модель (например, название компании).

Понимаю, что надо:
1) Добавить слово в словарь произношения (.dic) - сделал!
2) Добавить слово в языковую модель (.lm) - проблема...
Подскажите, как сгенерировать .lm под свои слова (на русском языке)?
Строки .lm выглядят примерно так:
-5.7145 миротворец -0.2282
-6.4940 миротворский -0.2713
-5.8390 миротворца -0.2622
-6.4512 миротворцами -0.2025

Заранее, большое спасибо!
  • Вопрос задан
  • 98 просмотров
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы