Newmo
@Newmo

Как обрезать аудио в заданном интервале между слов?

Имеется куча mp3 и wav файлов (записи диктовки) по часу каждый. Требуется каждый разбить по 20-30 минут, но так, что бы было понятно на каком слове файл закончился и начался. Можно это реализовать с помощью ffmpeg? Либо другим open source софтом.
Была идея просто считывать значения WaveForm в заданном интервале и резать опираяясь на координаты, но не нашел подходящих библиотек. Может сможет кто-нибудь подсказать в какую сторону копать (wpf, win form, можно и java - без разницы).
  • Вопрос задан
  • 1172 просмотра
Пригласить эксперта
Ответы на вопрос 1
Для работы с аудио есть ответ - Trim an Audio File(.wav,.mp3)

Сложнее всего это - "чтобы было понятно на каком слове файл закончился и начался". Тут уже распознавание речи.
Или резать на ближайшей тишине по заданному участку, или реально разбирать на слова, с указанием start/end position для каждого слова в звуковом потоке.

Если в записи тишина и голос, то по тишине резать.
Если есть фоновый шум, музыка и что угодно другое, но не слова, то сложнее.

Распознавать можно не весь кусок а до первого слова в начале куска и в конце.

Вопрос с ответом по распознаванию - Voice/Speech to text.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы