@LakeForest

VOSK ASR для русского. Как настроить свой словарь? И как исправить предупреждения при генерации G.fst?

Везде жалуется на твердый знак. Откуда он взялся? В словах его нет.
Как быть?

LOG (arpa2fst[5.5.958~1-57f8d]:Read():arpa-file-parser.cc:149) Reading \1-grams: section.
WARNING (arpa2fst[5.5.958~1-57f8d]:Read():arpa-file-parser.cc:219) line 610817 [-4.645712 ъ-0.3890305] skipped: word 'ъ' not in symbol table
....
WARNING (arpa2fst[5.5.958~1-57f8d]:Read():arpa-file-parser.cc:219) line 9460316 [-3.161267 вчерашний ъ] skipped: word 'ъ' not in symbol table
LOG (arpa2fst[5.5.958~1-57f8d]:Read():arpa-file-parser.cc:149) Reading \3-grams: section.

LOG (arpa2fst[5.5.958~1-57f8d]:Read():arpa-file-parser.cc:149) Reading \4-grams: section.
WARNING (arpa2fst[5.5.958~1-57f8d]:Read():arpa-file-parser.cc:259) Of 2868 parse warnings, 30 were reported. Run program with --max-arpa-warnings=-1 to see all warnings
LOG (arpa2fst[5.5.958~1-57f8d]:RemoveRedundantStates():arpa-lm-compiler.cc:359) Reduced num-states from 105503353 to 12126947

Добавил свой lexicon.txt. Оченьь большой список получается...
Но почему-то (и с маленьким то же) после создания итоговой модели: utils/mkgraph.sh --self-loop-scale 1.0 data/lang/ am/ graph/ - качество распознавания речи ниже некуда...
Как правильно добавить распознавание имен в модель vosk?

(следовал этой инструкции, упуская пункт ЗАМЕНА ЯЗЫКОВОЙ МОДЕЛИ НА ГРАММАТИКУ) https://habr.com/ru/company/cft/blog/558824/
  • Вопрос задан
  • 463 просмотра
Пригласить эксперта
Ответы на вопрос 1
@nshmyrev
Мы недавно обновили документацию и пакет для пересборки:

https://alphacephei.com/vosk/lm
https://alphacephei.com/vosk/models/vosk-model-ru-...

Статья ЦФТ содержит несколько критических ошибок, лучше ей не следовать.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы