Как организовать непрерывную прослушку микрофона и реакцию на определенное слово?
Имеется железка в виде Raspberry Pi 3. Стоит распбиан и есть задача постоянно слушать микрофон и когда произносят какую-то фразу, реагировать (запускать скрипт, например). Как это лучше организовать? Если нет подключения к интернету?
Окей, я уточню. Интернет есть, но проблема в том, что скармливать ему 24-х часовую запись я не могу (скорость так себе, ограничение по трафику). Поэтому я хочу научить его узнавать мой голос с одной единой командой (обращением, что-то типа Окей гугл), которая уже будет запускать питон-скрипт (мой), который будет записывать остальной текст и распознавать через сервисы гугля или яндекса
rivalsm: Я бы тоже такую штуку использовал. Когда открыто дофига окон (штук по 40) и переключаться между ними сплошная мука. А так - назвал окно и пожалуйста!
Без интернета только если у вас есть бюджет в пару миллионов зеленых на серверную ферму и оплату работы стада программистов для написания распозновалки голоса.
Если в условиях задачи есть оговорка реагировать только на конкретно заданные слова которые заранее заданы для заранее известного голоса и интонации то решения есть. К примеру CMU Sphinx(сфинкс) но работает оно откровенно говоря несколько странно с Русским и вообще начинает очень плохо работать когда число команд переходит пару десятков (по крайней мере так было когда я его смотрел довольно давно). Порта на армы вроде не было но скорее всего добрые люди есть.
Есть еще самый простой вариант, заюзать яндекс\гугл\... сервисы. Из плюсов удобное апи, огроменная точность(на фоне любых оффлайн решений). Из минусов нужен инет и забесплатно ограничения на число запросов.
Еще можно задействовать андроид под это дело(точно не помню но вроде бы сервисы распознования без ограничений идут но требуют инета).
Если есть подключение к сети, то полно скриптов, которые умеют слушать в непрерывном режиме и скармливать услышанное Google Speech API. А дальше дело техники.