Какие есть опенсорс программы с голосовым управлением?
Добрый день.
Ищу бесплатные аналоги VoiceAttack или VoxCommando, желательно опенсорсы, но не принципиально.
Ищу такую программу, что бы она могла самое базовое хотя бы. А именно: Мы говорим что либо, программа нажимает кнопки.
(Первая из выше указанных не подходит, т.к. жестко завязана на en интерфейсе win, плюс только en движок распознания и еще n часов на обучение его. Вторая не подходит, т.к. в win8 не работает ру-движок распознания речи. Точнее он не обучается. В итоге не может распознать правильно речь :D)
- - - - - - -
Если такой информации нету не у кого, то просьба тогда напомнить, какие библиотеки на питон умеют работать с голосовым помощником гугл? Я помню что как то давно, два года назад, для прикола на программировал на питоне, по урокам, на планшете простую программу, которая через голосовые команды включала вайфай. Но я уже не помню, как делал и какие библиотеки питона использовал.
и вот - хороший же вопрос был....
сам как раз, лет 8-10 назад ток на VoxCommando и сидел
а что б нынче кто-нибудь замену посоветовал....?
и я не просто про голосовой поиск, как умеют наши компании на букву Г и букву Я, а вот именно, что б можно было и свои скрипты пописать на каком-нить их скриптовом языке и оно в зависимости от голосовой команды выполняло эти действия и ещё сказать в ответ что-то прописанное мной могло бы....
аля, из разряда - я например скажу:
--- %Ева%, к нам в гостики пришёл %дядя Вова%
оно мне отреагировало бы на %Еву% и поняло б чот запрос к ней идёт и ответило бы:
--- Добрый %день/вечер% (в зависимости от %current_time%), %дядя вова%! рады тебя снова видеть! заходите в гостики и располагайтесь по удобнее! (и после этого запустила бы Ютуб какой с %Дядей Вовиной% любимой песенкой)
и ИЕННО ТАК ответило, как Я прописал, а не как ИИ какой-нибудь...
Ну так кто мешает взять какой нибудь whisper или локально поднять vosk, обработать услышанную фразу, перевести в текст.
Потом на любом вашем любимом языке, любыми скриптами генерировать ответ.
А синтезаторов обратно в голос - полно.
Или вы ищете именно коробочное решение?