Как в linux произвести захват звука с пропуском тишины (отсутствия голоса)?

Question

Роман @lastuniverse

Всегда вокруг да около IT тем

Как в linux произвести захват звука с пропуском тишины (отсутствия голоса)?

Идея:
консольное приложение, постоянно слушающее микрофон и производящее запись в файл(ы) при обнаружении голоса человека. Далее файл будет отправлен для распознавания через яндекс(или google) speachAPI а результат распознавания использован для различных целей, одна из которых - голосовое управление.
Про Sphinx знаю, задачу голосового управления он вполне покрывает, но имеются и другие задачи, для которых его недостаточно, например консольное приложение для голосового общения с яндекс Алисой.

Уточнения/желания:
1. программа (набор программ) должна работать из консоли не требуя установленной DE (desktop environment);
2. желательно чтобы она могла отличать голос от шумов;
3. идентифицируя во входящем с микрофона аудиопотоке звук (желательно голос) должна записывать его в файл;
4. при наступлении тишины (отсутствия голоса) должна закрывать файл, а при последующих срабатываниях либо создавать новый файл либо перезаписывать имеющийся;
5. желательно чтобы была возможность указать длительность тишины (отсутствия голоса) по достижении которой текущий записываемый файл будет закрыт.

Что мне необходимо:
1. если Вы знаете о существующем свободном, бесплатном ПО или наборе утилит, не тянущих за собой сотни мегабайт зависимостей, на базе которого(которых) можно организовать требуемое поведение, подскажите мне пожалуйста (названия/ссылки).
2. если у Вас имеется ссылка(и) на мануал/описание/пример с описанием/реализацией требуемого поведения буду признателен если поделитесь материалом.

Заранее благодарю за потраченное Вами время и оказанную помощь.

Вопрос задан более трёх лет назад
293 просмотра

2 комментария

Подписаться 2 Средний 2 комментария

Помогут разобраться в теме Все курсы

Нетология

Специалист по информационной безопасности + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Решения вопроса 1

3 комментария

Роман @lastuniverse Автор вопроса

Вы подсказали мне верное направление для составления поискового запроса. Большое Вам спасибо.

Написано более трёх лет назад
Роман @lastuniverse Автор вопроса

Более или менее приемлемое решение найдено. Еще раз спасибо.

Написано более трёх лет назад
Алексей Скобкин @skobkin

Роман, Забавно. Я сейчас вспомнил, что сам когда-то с помощью sox писал звук с активацией по уровню (но не с таким набором требований как у вас, а значительно проще).

Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

Простой
Как переместить неразмеченную область ext4?
- 2 подписчика
- 07 июл.
- 195 просмотров
2

ответа
Linux

+1 ещё

Простой
Почему не грузится контент каналов TG через VPN?
- 2 подписчика
- 26 июн.
- 882 просмотра
1

ответ
Linux

+2 ещё

Средний
Почему не получается войти в bios? Что делать с полосами на экране?
- 1 подписчик
- 21 июн.
- 302 просмотра
2

ответа
Linux

+1 ещё

Средний
Как мне перенести систему Proxmox на меньший диск?
- 2 подписчика
- 21 июн.
- 361 просмотр
4

ответа
Linux

Простой
Курсор «спотыкается» о рамку окна в Астре (ОС для ПК). Как убрать?
- 1 подписчик
- 20 июн.
- 266 просмотров
1

ответ
Linux

+1 ещё

Средний
Почему при малом проценте зарядки в Debian (Cinnamon) начинает лагать, перед выходом в гибернацию?
- 1 подписчик
- 17 июн.
- 143 просмотра
2

ответа
Linux

+1 ещё

Средний
Рост CLOSE-WAIT и утечки TCP-сокетов в Xray (vless + reality) — что делать?
- 3 подписчика
- 05 июн.
- 1146 просмотров
1

ответ
Linux

+1 ещё

Средний
Редактирование загрузочного меню GRUB?
- 1 подписчик
- 23 мая
- 420 просмотров
3

ответа
Linux

+2 ещё

Сложный
Восстановление таблицы разделов?
- 3 подписчика
- 15 мая
- 552 просмотра
1

ответ
Linux

+3 ещё

Средний
Radxa debian почему не работает тачскрин?
- 1 подписчик
- 13 мая
- 264 просмотра
2

ответа
Показать ещё Загружается…

Рискну предложить что-то вроде gstreamer или Liquidsoap. Правда это только "движки" а все остальное придется делать ручками...
Alexey, спасибо и на этом, но думаю должны существовать готовые решения, идея голосовых ботов далеко не нова и наверняка имеет консольные реализации.

Answer 1 · 2018-09-21 12:43:43

Алексей Скобкин @skobkin

Гентушник, разработчик на PHP и Symfony.

Google: "linux voice activated recording"

Из первых результатов, например: https://www.linuxquestions.org/questions/linux-sof...

Ответ написан более трёх лет назад

3 комментария

Как в linux произвести захват звука с пропуском тишины (отсутствия голоса)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт