Как решить проблему с расширением словаря vosk-model-ru-0.22?

Question

aLap @aLap

Распознавание речи

Как решить проблему с расширением словаря vosk-model-ru-0.22?

Приветствую!
Появилась необходимость расширить словарь модели vosk-model-ru-0.22.
Скачал vosk-model-ru-0.22-compile, собрал kaldi, установил все зависимости, далее следовал инструкциям. Заполнил файл db/extra.txt в нужном формате. При запуске compile_graph.sh ловлю такую ошибку:

LOG (arpa2fst[5.5.1012~2-dd107]:Read():arpa-file-parser.cc:149) Reading \1-grams: section.
WARNING (arpa2fst[5.5.1012~2-dd107]:Read():arpa-file-parser.cc:219) line 82 [-5.653475  абаимова] skipped: word 'абаимова' not in symbol table
WARNING (arpa2fst[5.5.1012~2-dd107]:Read():arpa-file-parser.cc:219) line 84 [-5.653475  абайдуллина] skipped: word 'абайдуллина' not in symbol table
WARNING (arpa2fst[5.5.1012~2-dd107]:Read():arpa-file-parser.cc:219) line 100 [-5.653475 абакировна] skipped: word 'абакировна' not in symbol table
WARNING (arpa2fst[5.5.1012~2-dd107]:Read():arpa-file-parser.cc:219) line 107 [-5.653475 абакшина] skipped: word 'абакшина' not in symbol table
WARNING (arpa2fst[5.5.1012~2-dd107]:Read():arpa-file-parser.cc:219) line 114 [-5.653475 абалмазова] skipped: word 'абалмазова' not in symbol table
WARNING (arpa2fst[5.5.1012~2-dd107]:Read():arpa-file-parser.cc:219) line 115 [-5.653475 абалымов] skipped: word 'абалымов' not in symbol table
......
WARNING (arpa2fst[5.5.1012~2-dd107]:Read():arpa-file-parser.cc:259) Of 15464 parse warnings, 30 were reported. Run program with --max-arpa-warnings=-1 to see all warnings

Затем такую:

utils/map_arpa_lm.pl: Processing "\1-grams:\"
utils/map_arpa_lm.pl: Warning: OOV line -5.653475       абаимова        -0.004129345
utils/map_arpa_lm.pl: Warning: OOV line -5.653475       абайдуллина     -0.004129345
utils/map_arpa_lm.pl: Warning: OOV line -5.653475       абакировна      -0.004129345
utils/map_arpa_lm.pl: Warning: OOV line -5.653475       абакшина        -0.004129345
utils/map_arpa_lm.pl: Warning: OOV line -5.653475       абалмазова      -0.004129345
utils/map_arpa_lm.pl: Warning: OOV line -5.653475       абалымов        -0.004129345
......

Соответственно, на выходе имею базовый словарь без слов из extra.txt

Я в это теме новичок, поделитесь, пожалуйста, опытом, что я делаю не так? Проблема с lexicon? Если да, то куда сгенерированный lexicon.txt положить?
Спасибо!

UPD.
Обнаружил, что некорректно отрабатывает скрипт dict.py, в файл lexicon.txt не попадают слова из db/extra.txt, только из db/ru.dic. Вероятно, некорректно отрабатывает phonetisaurus.predict. Разбираюсь дальше...

Вопрос задан более трёх лет назад
264 просмотра

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

Data Scientist: расширенный курс

13 месяцев

Далее
GB (GeekBrains)

Специалист по внедрению ИИ

6 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

JavaScript

+1 ещё

Простой
Есть ли js-библиотека для офлайн-распознавания русской речи?
- 1 подписчик
- 12 окт.
- 201 просмотр
2

ответа
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент.
- 104 просмотра
1

ответ
Машинный перевод с одного языка на другой

+1 ещё

Простой
Надёжный распознаватель речи в текст на разных языках?
- 2 подписчика
- 06 мая
- 1186 просмотров
2

ответа
Windows

+1 ещё

Простой
Как на компе с виндой набивать голосом текст на русском языке, с качеством не хуже чем у клавиатуры gboard для Android?
- 1 подписчик
- 03 мар.
- 241 просмотр
2

ответа
Windows

+1 ещё

Простой
Насколько хороша Cortana встроенная в Win11 для распознавания русской речи?
- 1 подписчик
- 12 февр.
- 190 просмотров
1

ответ
C++

+2 ещё

Простой
Как обучить акустическую модель?
- 2 подписчика
- 18 дек. 2024
- 158 просмотров
0

ответов
Нейронные сети

+1 ещё

Сложный
Какой использовать стек для создания полностью локального STT-LLM-TTS русско-английского голосового ассистента?
- 3 подписчика
- более года назад
- 1419 просмотров
2

ответа
Нейронные сети

+1 ещё

Простой
Как сделать голосовой командный интерфейс?
- 1 подписчик
- более года назад
- 69 просмотров
0

ответов
Node.js

+1 ещё

Простой
Как перевести аудио в текст в Яндекс SpeechKit v3?
- 2 подписчика
- более года назад
- 350 просмотров
1

ответ
Python

+1 ещё

Простой
Ошибка UNAUTHORIZED при работе с Yandex SpeechKit API: Как правильно передать API-ключ?
- 1 подписчик
- более года назад
- 396 просмотров
1

ответ
Показать ещё Загружается…

Python Software Engineer - ML/LLM

Ennabl • Лимассол

от 650 000 ₽

Fullstack-разработчик

IT-hunter • Санкт-Петербург

До 300 000 ₽

Senior Backend Engineer

Yolk

от 4 000 до 8 000 $

Answer 1 · 2022-04-21 15:21:25

Разобрался. В общем, проблема в работе pnonetisaurus на CentOS. Увидел на гитхабе коммантарий, что оно протестировано на Debian, запустил скрипт на Ubuntu (с соблюдением версий для чистоты эксперимента) и всё заработало, новые слова добавились в модель.

Как решить проблему с расширением словаря vosk-model-ru-0.22?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт