Возможно ли вырезать музыку в real time?

Друзья, всем привет!

Интересует возможность технической реализации следующей задачи (а может даже готовое решение).

Я видел, что в аудиоредакторах можно вырезать музыку, чтобы остался только голос.

Вот мне нужно то же самое, только в реальном времени. Чтобы я ни смотрел: ролик на жестком диске, видео с Youtube или что-либо еще. Чтобы из звукового потока вся музыка вырезалась и оставался один голос.

Я понимаю, что качественно удалить музыку не получится. Но хотя бы снизить ее до минимума.

Концептуальные вопросы (а зачем тебе и т.д.) просьба пока не писать. Знаю огромную аудиторию для этой функции.

Друзья, интересует любая информация. В принципе реализуемость, сложность, уровень компетенции программистов, стоимость, сроки, возможно, внешнее оборудование, альтернативы.

Всех заранее благодарю!
  • Вопрос задан
  • 991 просмотр
Решения вопроса 4
@numfin
Тебе нужен savihost и подходящий vst плагин. Что это такое - ищи в интернете
Ответ написан
DollyPapper
@DollyPapper
В принципе реализуемость

Впринципе реализуемо. Ютуб по жалобе копирайтеров музыку вырезает из видео. Естественно там НС.
сложность

От сложно до очень сложно, если делать все с нуля.
уровень компетенции программистов

Очень компетентные программисты с такой задачей опять же с нуля врятли справятся. Тут скорее опять же эксперты по НС. Никакой алгоритм вам точно не скажет, музыка ли сейчас, или голос. Вернее скажет в 1 песне из 10 и то, в 1 месте песни из 10.
Что касается готовых реализаций или куда копать. Копать в торону гугловских апи. Возможно у них есть подобные API. Вот тут посмотрите https://cloud.google.com/
Ответ написан
Ezhyg
@Ezhyg
вся музыка вырезалась и оставался один голос

"Нет, сынок, это фантастика" (ц)
Во всяком случае пока.

Хотя тот же кодек Realtek (и ещё какой-то), в своих дровах имеет функцию глушения музыки, в настройках - "Караоке".
Ответ написан
@McBernar
Голос имеет свою частоту. Можно срезать все, что не попадает в этот диапазон.

Будет ли это качественно? Вряд ли. Даже ручная обработка трека не дает чистой минусовки — слышен сайдчейн, куча лишних мусорных шумов, поломанный голос. Идеально чистого звука просто так не добиться. Наверное, можно разработать алгоритмы, которые доведут этот процесс до хорошего результата. Но на коленке такое не собрать.
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
antonsosnitzkij
@antonsosnitzkij
студент, житель санкт-петербурга
https://en.wikipedia.org/wiki/Cocktail_party_effect
Можно попробовать алгоритм слепого разделения сигналов (Blind Signal Separation)
Там различные присутствуют техники, попробуйте какая Вам больше приглянется
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы