Возможно ли вырезать музыку в real time?

Question

Григорий Хримян @Gryphonn

English Coach

Возможно ли вырезать музыку в real time?

Друзья, всем привет!

Интересует возможность технической реализации следующей задачи (а может даже готовое решение).

Я видел, что в аудиоредакторах можно вырезать музыку, чтобы остался только голос.

Вот мне нужно то же самое, только в реальном времени. Чтобы я ни смотрел: ролик на жестком диске, видео с Youtube или что-либо еще. Чтобы из звукового потока вся музыка вырезалась и оставался один голос.

Я понимаю, что качественно удалить музыку не получится. Но хотя бы снизить ее до минимума.

Концептуальные вопросы (а зачем тебе и т.д.) просьба пока не писать. Знаю огромную аудиторию для этой функции.

Друзья, интересует любая информация. В принципе реализуемость, сложность, уровень компетенции программистов, стоимость, сроки, возможно, внешнее оборудование, альтернативы.

Всех заранее благодарю!

Вопрос задан более трёх лет назад
1012 просмотров

Комментировать

Подписаться 5 Сложный Комментировать

Помогут разобраться в теме Все курсы

Нетология

Режиссёр монтажа

8 месяцев

Далее
Яндекс Практикум

Режиссёр монтажа

9 месяцев

Далее
GB (GeekBrains)

Профессия Режиссёр монтажа

9 месяцев

Далее

Решения вопроса 4

1 комментарий

16 комментариев

numfin @numfin

Ответ вообще не в тему. Ни о чем. И вообще не ответ

Написано более трёх лет назад
devalone @devalone

Впринципе реализуемо. Ютуб по жалобе копирайтеров музыку вырезает из видео. Естественно там НС.

Во всех видосах, где я видел, удаляли полностью звуковую дорожку, т.е. и музыку и голос.

Написано более трёх лет назад
Григорий Хримян @Gryphonn Автор вопроса

numfin, ну почему же. Человек написал своё мнение, расписал подробно, постарался. Мне любая инфа полезна.

Написано более трёх лет назад
Григорий Хримян @Gryphonn Автор вопроса

devalone, я тоже так видел

Написано более трёх лет назад
Григорий Хримян @Gryphonn Автор вопроса

Спасибо за ответ

Написано более трёх лет назад
DollyPapper @DollyPapper

numfin, почему не в тему? Задачи гугла при удалении музыки с ютубе похожи на те задачи которые хочет решить ТС. Я дал точку где можно поискать API для подобной задачи, возможно там что-то полезное найдется. А возможно и нет, тогда уж извните.

Написано более трёх лет назад
DollyPapper @DollyPapper

devalone, мы видимо про разные ютубы говорим. никогда внимания не обращали, на искореженную музыку в видео? Автор что-то говорит, а на фоне иногда вырывается песня которую вставил автор, но ютуб ее отделяет от голоса и глушит, причем голос вполне себе спокойно продолжает существовать.

Написано более трёх лет назад
devalone @devalone

DollyPapper, пока ни разу не встречал.

Написано более трёх лет назад
DollyPapper @DollyPapper

devalone, ну как нибудь обратите внимание. Встречал много раз, так что точно не у меня галюны.

Написано более трёх лет назад
Григорий Хримян @Gryphonn Автор вопроса

DollyPapper, если попадется на глаза, скиньте пожалуйста ссылку!

Написано более трёх лет назад
Григорий Хримян @Gryphonn Автор вопроса

DollyPapper, кстати, а вы уверены, что на ютуб именно Реал тайм?? Поступила жалоба, обработали аудио и все. Им реал тайм не нужен. А это сильно проще.

Написано более трёх лет назад
DollyPapper @DollyPapper

Григорий Хримян, а вот на счет этого не знаю. Скорее всего не RT. Зачем каждый раз, кажому человеку в видео проводить расчеты, чтобы удалить песню. Действительно это не RT. Но другого варианта у меня нет. Но если существует такой апи от них, то можно в RT на сервере производителя софта это делать, мощности конечно же нужны не маленькие, но это уже другой вопрос. Тот же Translate API от гугла переводит сообщение почти в RT, вы пишите текст, он отправляется на сервер, там обрабатывается, возвращает перевод. Есть у них конечно база данных скорее всего из популярных фраз, слов, предложений, но остальное переводится в "почти RT". Короче очень много "НО" в данном вопросе.

Написано более трёх лет назад
Дмитрий Евграфович @Tantacula

Может у гугла и нейросети этим занимаются, но в начале 2000-х cooledit pro это делал с помощью плагинов. Тогда о нейросетях никто кроме ученых и не слышал, да и не потянули бы те компьютеры подобные излишества, а вырезание лишних частот более-менее быстро работало на том железе. Имхо, вы написали ответ просто наугад, совершенно не владея темой.

Написано более трёх лет назад
Григорий Хримян @Gryphonn Автор вопроса

Дмитрий Евграфович, скажите он в риал тайм это делал?

Написано более трёх лет назад
Дмитрий Евграфович @Tantacula

Григорий Хримян, эта программа не была предназначена для реалтайма, но на среднем компьютере 2004 года делала это вполне быстро (были вроде бы какие-то программы, обрабатывающие звук vsti плагинами в реальном времени вроде бы, но мне тогда это не нужно было, поэтому я в них не погружался). Вам бы вопрос задать на форумах звукорежиссёров и увлекающихся написанием музыки на компьютере людей, может и программиста не придется искать.

Написано более трёх лет назад
Григорий Хримян @Gryphonn Автор вопроса

Дмитрий Евграфович, а вот это самая здравая идея! Спасибо!

Написано более трёх лет назад

4 комментария

1 комментарий

Пригласить эксперта

Ответы на вопрос 1

9 комментариев

Григорий Хримян @Gryphonn Автор вопроса

Спасибо! А как их попробовать?

Написано более трёх лет назад
Даниил Смирнов @antonsosnitzkij

Григорий Хримян, сначала попробуйте просто в постобработке - в книге Хайкина, например, есть код для Matlab, где он смешивает три сигнала, а затем их разделяет с помощью максимизации взаимной информации. Если Вы пользователь Python, в библиотеках scikit-learn так же есть примеры применения этого алгоритма.

Написано более трёх лет назад
Григорий Хримян @Gryphonn Автор вопроса

Даниил Смирнов, спасибо. Но это пока слишком круто для меня. Интересовало направление мысли. В постобработке Audition неплохо справляется. Но это совсем другое.

Написано более трёх лет назад
Даниил Смирнов @antonsosnitzkij

Григорий Хримян, почему же, данный метод вполне себе работает в real-time, он просто вычисляет матрицу смешения и затем отделяет источники друг от друга. В постобработке я предложил просто понаблюдать.

Написано более трёх лет назад
Григорий Хримян @Gryphonn Автор вопроса

Даниил Смирнов, это про матлаб или пайтон?

Написано более трёх лет назад
Даниил Смирнов @antonsosnitzkij

Григорий Хримян, про матлаб и пайтон - что именно? в real-time это можно написать и в микроконтроллер на Си

Написано более трёх лет назад
Григорий Хримян @Gryphonn Автор вопроса

Даниил Смирнов, а вот это очень интересно. И к МК наушники подключаешь.

Сколько может стоить данный проект в вашем исполнении??

Написано более трёх лет назад
Даниил Смирнов @antonsosnitzkij

Григорий Хримян, по микроконтроллерам я не спец, больше в ПЛИС. Вы ищете возможности изготовления готового устройства? Как Вы видите его реализацию? Звучит просто интересно.

Написано более трёх лет назад
Григорий Хримян @Gryphonn Автор вопроса

Даниил Смирнов, почему бы и нет, как вариант. Кабель с 3.5 джеком, потом микроконтроллер, а в нем 3.5 разъем для наушников. Питание от батареек. Соответственно девайс может работать от любых устройств. Железо все доступное. Вот сколько будет стоить разработка ПО ??

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Обработка звука

Простой
Кто нибудь получал ELASTIQUE PRO SDK от zplane.technology?
- 1 подписчик
- 27 апр.
- 79 просмотров
1

ответ
Аудио

+1 ещё

Простой
Пищат сатиллиты от акустики A330U?
- 1 подписчик
- 26 февр.
- 179 просмотров
0

ответов
Аудио

+2 ещё

Простой
Почему могут возникать проблемы с записью звука?
- 1 подписчик
- 25 февр.
- 146 просмотров
1

ответ
Аудио

+1 ещё

Средний
Почему ухудшается звук собеседника при переключении на микрофон веб-камеры?
- 1 подписчик
- 11 февр.
- 163 просмотра
1

ответ
Аудио

Простой
Какой кабель взять для подключения активных колонок?
- 1 подписчик
- 11 февр.
- 197 просмотров
1

ответ
Аудио

+1 ещё

Средний
Передаст ли коаксиальный кабель 5-канальный звук?
- 1 подписчик
- 09 февр.
- 243 просмотра
1

ответ
Аудио

+1 ещё

Средний
Почему постоянно слышны щелчки и посторонние звуки в наушниках Nothing Ear 2 (2024)?
- 1 подписчик
- 05 дек. 2025
- 413 просмотров
1

ответ
Аудио

Простой
Разделение аудио на инструментал и вокал в Logic Pro или где угодно?
- 1 подписчик
- 29 нояб. 2025
- 205 просмотров
1

ответ
Видео

+3 ещё

Средний
Как скачать видеозапись Zoom со второй аудиодорожкой (не той, что по умолчанию)?
- 1 подписчик
- 25 нояб. 2025
- 226 просмотров
2

ответа
Обработка звука

Простой
Какое ПО использовать для озвучки?
- 3 подписчика
- 23 окт. 2025
- 287 просмотров
2

ответа
Показать ещё Загружается…

Answer 1 · 2017-12-06 15:24:30

numfin @numfin

Тебе нужен savihost и подходящий vst плагин. Что это такое - ищи в интернете

Ответ написан более трёх лет назад

1 комментарий

Answer 2 · 2017-12-06 15:08:44

В принципе реализуемость

Впринципе реализуемо. Ютуб по жалобе копирайтеров музыку вырезает из видео. Естественно там НС.

сложность

От сложно до очень сложно, если делать все с нуля.

уровень компетенции программистов

Очень компетентные программисты с такой задачей опять же с нуля врятли справятся. Тут скорее опять же эксперты по НС. Никакой алгоритм вам точно не скажет, музыка ли сейчас, или голос. Вернее скажет в 1 песне из 10 и то, в 1 месте песни из 10.
Что касается готовых реализаций или куда копать. Копать в торону гугловских апи. Возможно у них есть подобные API. Вот тут посмотрите https://cloud.google.com/

Answer 3 · 2017-12-06 15:36:02

вся музыка вырезалась и оставался один голос

"Нет, сынок, это фантастика" (ц)
Во всяком случае пока.

Хотя тот же кодек Realtek (и ещё какой-то), в своих дровах имеет функцию глушения музыки, в настройках - "Караоке".

Answer 4 · 2017-12-06 17:38:01

Голос имеет свою частоту. Можно срезать все, что не попадает в этот диапазон.

Будет ли это качественно? Вряд ли. Даже ручная обработка трека не дает чистой минусовки — слышен сайдчейн, куча лишних мусорных шумов, поломанный голос. Идеально чистого звука просто так не добиться. Наверное, можно разработать алгоритмы, которые доведут этот процесс до хорошего результата. Но на коленке такое не собрать.

Answer 5 · 2017-12-06 17:43:54

https://en.wikipedia.org/wiki/Cocktail_party_effect
Можно попробовать алгоритм слепого разделения сигналов (Blind Signal Separation)
Там различные присутствуют техники, попробуйте какая Вам больше приглянется

Возможно ли вырезать музыку в real time?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт