Как реализована функция "ok google"? Вернее будет сказать как смартфон определяет, что была сказана именно эта фраза? Он сканирует весь эфир, записывает и шлет его кусками на сервера Google? А с включенной функцией "Активировать голосовой поиск на заблокированном экране" смартфон будет слушать всё, что происходит вокруг него, распознавать всю речь, ожидая команды? Это же тонны трафика.
Вопрос интересует потому, что хотелось создать систему "Умный дом" с голосовым управлением с активацией конкретной командой, вроде "ok google". Но встал в ступор, ибо распознавать весь эфир нерационально.
Может кто-нибудь укажет примерное направление, в котором следует копать.
Ну логично, что анализируется поток звуков, в конкретном примере "ok google".
И анализируется он постоянно, фоново, и без трафика, а внутренними средствами гуглофона.
Это как пример того, как телефон в блокировки получает информацию о том, что на него приходит звонок внешний.
Так и тут.
И только после того как ключевое "ok google" сработало - телефон пытается "услышать" и распознать все, что будет сказано в определенный промежуток времени или же до определенной паузы.
То есть, чтобы мой "Умный дом" научился понимать меня "с полу слова", мне надо реализовать функцию локального распознавания голоса, не прибегая к помощи Google\Yandex Speech? Может есть какие то решения под данный вопрос? Заранее спасибо!