Как организовать непрерывную прослушку микрофона и реакцию на определенное слово?

Question

Oleg Wock @OlegWock

Python, Java+Android, Frontend

Как организовать непрерывную прослушку микрофона и реакцию на определенное слово?

Имеется железка в виде Raspberry Pi 3. Стоит распбиан и есть задача постоянно слушать микрофон и когда произносят какую-то фразу, реагировать (запускать скрипт, например). Как это лучше организовать? Если нет подключения к интернету?

Окей, я уточню. Интернет есть, но проблема в том, что скармливать ему 24-х часовую запись я не могу (скорость так себе, ограничение по трафику). Поэтому я хочу научить его узнавать мой голос с одной единой командой (обращением, что-то типа Окей гугл), которая уже будет запускать питон-скрипт (мой), который будет записывать остальной текст и распознавать через сервисы гугля или яндекса

Вопрос задан более трёх лет назад
2023 просмотра

3 комментария

Подписаться 5 Оценить 3 комментария

Помогут разобраться в теме Все курсы

Нетология

Специалист по информационной безопасности + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Решения вопроса 3

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

Простой
Как переместить неразмеченную область ext4?
- 2 подписчика
- вчера
- 142 просмотра
2

ответа
Linux

+1 ещё

Простой
Почему не грузится контент каналов TG через VPN?
- 2 подписчика
- 26 июн.
- 825 просмотров
1

ответ
Linux

+2 ещё

Средний
Почему не получается войти в bios? Что делать с полосами на экране?
- 1 подписчик
- 21 июн.
- 294 просмотра
2

ответа
Linux

+1 ещё

Средний
Как мне перенести систему Proxmox на меньший диск?
- 2 подписчика
- 21 июн.
- 343 просмотра
4

ответа
Linux

Простой
Курсор «спотыкается» о рамку окна в Астре (ОС для ПК). Как убрать?
- 1 подписчик
- 20 июн.
- 257 просмотров
1

ответ
Linux

+1 ещё

Средний
Почему при малом проценте зарядки в Debian (Cinnamon) начинает лагать, перед выходом в гибернацию?
- 1 подписчик
- 17 июн.
- 142 просмотра
2

ответа
Linux

+1 ещё

Средний
Рост CLOSE-WAIT и утечки TCP-сокетов в Xray (vless + reality) — что делать?
- 3 подписчика
- 05 июн.
- 1139 просмотров
1

ответ
Raspberry Pi

+1 ещё

Простой
NAS Raspberry PI5 как правильно подключить hdd?
- 1 подписчик
- 26 мая
- 277 просмотров
2

ответа
Linux

+1 ещё

Средний
Редактирование загрузочного меню GRUB?
- 1 подписчик
- 23 мая
- 416 просмотров
3

ответа
Linux

+2 ещё

Сложный
Восстановление таблицы разделов?
- 3 подписчика
- 15 мая
- 551 просмотр
1

ответ
Показать ещё Загружается…

Изобретаете свой СОРМ с блэкджеком?)
rivalsm: Я бы тоже такую штуку использовал. Когда открыто дофига окон (штук по 40) и переключаться между ними сплошная мука. А так - назвал окно и пожалуйста!
Захаров Александр: лучше на неё повесить 20 килограмм тротила. К вам вламываются спецслужбы и произносишь "жопа" =D

Answer 1 · 2017-01-09 23:06:17

Без интернета только если у вас есть бюджет в пару миллионов зеленых на серверную ферму и оплату работы стада программистов для написания распозновалки голоса.
Если в условиях задачи есть оговорка реагировать только на конкретно заданные слова которые заранее заданы для заранее известного голоса и интонации то решения есть. К примеру CMU Sphinx(сфинкс) но работает оно откровенно говоря несколько странно с Русским и вообще начинает очень плохо работать когда число команд переходит пару десятков (по крайней мере так было когда я его смотрел довольно давно). Порта на армы вроде не было но скорее всего добрые люди есть.
Есть еще самый простой вариант, заюзать яндекс\гугл\... сервисы. Из плюсов удобное апи, огроменная точность(на фоне любых оффлайн решений). Из минусов нужен инет и забесплатно ограничения на число запросов.
Еще можно задействовать андроид под это дело(точно не помню но вроде бы сервисы распознования без ограничений идут но требуют инета).

Answer 2 · 2017-01-09 23:01:51

Если нет подключения к Интернет, то нужно что-то вроде этого cmusphinx.sourceforge.net/wiki

Если есть подключение к сети, то полно скриптов, которые умеют слушать в непрерывном режиме и скармливать услышанное Google Speech API. А дальше дело техники.

Answer 3 · 2017-01-10 05:55:57

Кроме CMU Sphinx есть и другие проекты по распознаванию голоса. Конечно не все они запустятся на Raspberry Pi, но в целом задача решаемая. И вы не первый кто делает подобное:
https://diyhacking.com/best-voice-recognition-soft...

Как организовать непрерывную прослушку микрофона и реакцию на определенное слово?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт