Как определить наличие голоса в файле?

Делаю простую систему голосового управления для "умного" дома, голос в текст разбирает Яндекс, но вот только 1 проблема, запросы к яше платные и не хочется впустую тратить деньги... Задался вопросом, а как понять, что файл не состоит из тишины? Записываю из JS и сохраняю на сервере, далее ffmpeg конвертит в ogg и шлет в яндекс...
Есть варианты? Может быть в nix есть какие-нибудь программы?
  • Вопрос задан
  • 231 просмотр
Решения вопроса 2
2ord
@2ord
продвинутый чайник
Есть плагины к ffmpeg для определения/удаления тишины.
https://ffmpeg.org/ffmpeg-filters.html#silencedetect
Ответ написан
@loonny
Мне кажется можно понять по Wavefrom. Маленькие колебания - шум, большие - голос.
JS и в ogg может конвертировать сразу, к слову
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
HistoryART
@HistoryART
Надзиратель
Посмотрите в документации обоих, возможно найдёте, честно - не эксперт, умничать не охота, но по моему это достаточно востребовано - чтобы было в документации.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы