Есть в общем то более подходящие инструменты. А так в случае Виндоуз строите граф DirectSound захватываете звук и отправляете post запрос хоть на яндекс хоть на Microsoft. В ответ вам приходят варианты распознавания в виде Json
Ответ написан
Оценили как «Нравится»
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.