@kvellou

Как улучшить качество распознавания речи Vosk в Python?

Хочу создать голосовой ассистент на python с использованием vosk на казахском языке. Проблема в том что модель казахского языка маленькая по сравнению с другими и он распознает только некоторые слова. Как можно улучшить точность распознавания и расширить модель?

Вот код:
with sd.RawInputStream(samplerate=samplerate, blocksize = 16000, device=default_device[0], dtype='int16',
                            channels=1, callback=callback):

        rec = vosk.KaldiRecognizer(model, samplerate)
        while True:
            data = q.get()
            if rec.AcceptWaveform(data):
                data = json.loads(rec.Result())['text']
                print(data)
  • Вопрос задан
  • 374 просмотра
Пригласить эксперта
Ответы на вопрос 1
@q2digger
никого не трогаю, починяю примус
не работал с этой моделью, но заинтересовался и открыл доку.
на странице https://alphacephei.com/vosk/adaptation есть такие слова
Vosk-API supports online modification of the vocabulary. See the demo code for details.

и собственно там ссылка на демо-код. Глянь, может поможет https://github.com/alphacep/vosk-api/blob/master/p...
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы