Вероятно проблема в аргументах KaldiRecognizer. Второй аргумент это частота дискретизации. Скорее всего заработает при 44100 (эта частота как-то выводится из теоремы Котельникова, но это не точно)
https://stackoverflow.com/questions/72432217/excep...
Upd. Почитал про частоту дискретизации. Тут срабатывает sampwidth * framerate
https://dsp.stackexchange.com/questions/10877/rela...