Распознавание голоса - это очень сложная задача, а по тому качественного и быстрого распознавания на локальном компьютере быть не может.
А то что предлагает винда - это совсем смех.
А раз не может быть на локальном компьютере, но все вендоры предлагают распознавание текста через облако, и только платно: Яндекс Облако и уже упомянутый гугл.
(И только платно, тк чужое железо бесплатным быть не может)
В принципе, кроме облака есть ещё бесплатный
Vosk - его качество заметно хуже, чем у яндекса и гугла, но в во много раз лучше, чем в винде, и ты можешь в своём "голосовом ассистенте" предлагать пользователю выбор между несколькими движками (пусть сам оплачивает Yandex speech)
Кстати, у яндекса не такие уж и дорогие тарифы - 16 копеек за 15 секунд распознаваемой речи.
https://cloud.yandex.ru/docs/speechkit/pricing#rul...
За время демо-периода можно бесплатно много часов распознавать.