Задать вопрос
Newmo
@Newmo

Как обрезать аудио в заданном интервале между слов?

Имеется куча mp3 и wav файлов (записи диктовки) по часу каждый. Требуется каждый разбить по 20-30 минут, но так, что бы было понятно на каком слове файл закончился и начался. Можно это реализовать с помощью ffmpeg? Либо другим open source софтом.
Была идея просто считывать значения WaveForm в заданном интервале и резать опираяясь на координаты, но не нашел подходящих библиотек. Может сможет кто-нибудь подсказать в какую сторону копать (wpf, win form, можно и java - без разницы).
  • Вопрос задан
  • 1237 просмотров
Подписаться 1 Простой Комментировать
Помогут разобраться в теме Все курсы
  • Stepik
    Профессия "C# разработчик"
    1 неделя
    Далее
  • XYZ School
    C# для разработки игр
    5 месяцев
    Далее
  • Учебный центр IBS
    DEV-001_NET Шаблоны проектирования GoF. Редакция для .NET
    1 неделя
    Далее
Пригласить эксперта
Ответы на вопрос 1
Для работы с аудио есть ответ - Trim an Audio File(.wav,.mp3)

Сложнее всего это - "чтобы было понятно на каком слове файл закончился и начался". Тут уже распознавание речи.
Или резать на ближайшей тишине по заданному участку, или реально разбирать на слова, с указанием start/end position для каждого слова в звуковом потоке.

Если в записи тишина и голос, то по тишине резать.
Если есть фоновый шум, музыка и что угодно другое, но не слова, то сложнее.

Распознавать можно не весь кусок а до первого слова в начале куска и в конце.

Вопрос с ответом по распознаванию - Voice/Speech to text.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы