Как определить наличие голоса в файле?

Делаю простую систему голосового управления для "умного" дома, голос в текст разбирает Яндекс, но вот только 1 проблема, запросы к яше платные и не хочется впустую тратить деньги... Задался вопросом, а как понять, что файл не состоит из тишины? Записываю из JS и сохраняю на сервере, далее ffmpeg конвертит в ogg и шлет в яндекс...
Есть варианты? Может быть в nix есть какие-нибудь программы?
  • Вопрос задан
  • 296 просмотров
Решения вопроса 2
2ord
@2ord
Есть плагины к ffmpeg для определения/удаления тишины.
https://ffmpeg.org/ffmpeg-filters.html#silencedetect
Ответ написан
Комментировать
@loonny
Мне кажется можно понять по Wavefrom. Маленькие колебания - шум, большие - голос.
JS и в ogg может конвертировать сразу, к слову
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы