Везде жалуется на твердый знак. Откуда он взялся? В словах его нет.
Как быть?
LOG (arpa2fst[5.5.958~1-57f8d]:Read():arpa-file-parser.cc:149) Reading \1-grams: section.
WARNING (arpa2fst[5.5.958~1-57f8d]:Read():arpa-file-parser.cc:219) line 610817 [-4.645712 ъ-0.3890305] skipped: word 'ъ' not in symbol table
....
WARNING (arpa2fst[5.5.958~1-57f8d]:Read():arpa-file-parser.cc:219) line 9460316 [-3.161267 вчерашний ъ] skipped: word 'ъ' not in symbol table
LOG (arpa2fst[5.5.958~1-57f8d]:Read():arpa-file-parser.cc:149) Reading \3-grams: section.
LOG (arpa2fst[5.5.958~1-57f8d]:Read():arpa-file-parser.cc:149) Reading \4-grams: section.
WARNING (arpa2fst[5.5.958~1-57f8d]:Read():arpa-file-parser.cc:259) Of 2868 parse warnings, 30 were reported. Run program with --max-arpa-warnings=-1 to see all warnings
LOG (arpa2fst[5.5.958~1-57f8d]:RemoveRedundantStates():arpa-lm-compiler.cc:359) Reduced num-states from 105503353 to 12126947
Добавил свой lexicon.txt. Оченьь большой список получается...
Но почему-то (и с маленьким то же) после создания итоговой модели: utils/mkgraph.sh --self-loop-scale 1.0 data/lang/ am/ graph/ - качество распознавания речи ниже некуда...
Как правильно добавить распознавание имен в модель vosk?
(следовал этой инструкции, упуская пункт ЗАМЕНА ЯЗЫКОВОЙ МОДЕЛИ НА ГРАММАТИКУ)
https://habr.com/ru/company/cft/blog/558824/