Сделал распознование речи при помощи библиотеки vosk, но выдаёт ошибку.
Вот часть кода:
import json
import pyaudio
from vosk import Model, KaldiRecognizer
p=pyaudio.PyAudio()
model = Model('vosk-model-small-ru-0.15')
rec = KaldiRecognizer(model, 8000)
streaming = p.open(format=pyaudio.paInt16, channels=1,rate = 8000, input=True, frames_per_buffer=8000)
streaming.start_stream()
engine = pyttsx3.init()
Вот ошибка:
ERROR (VoskAPI:DecodableNnetLoopedOnlineBase():decodable-online-looped.cc:50) Ivector feature dimension mismatch: got -1 but network expects 40
terminate called after throwing an instance of 'kaldi::KaldiFatalError'
what(): kaldi::KaldiFatalError
Как я понял, проблема тут:
Ivector feature dimension mismatch: got -1 but network expects 40
Как это решить? Понятия не имею