Как работают программы распознавания музыки?

Question

RendeRR @RendeRR

Обработка звука

Как работают программы распознавания музыки?

В частности, для андройда есть shazam. Получалось распознавать даже играющее фоном радио в столовой :)
Очень интересно, как это работает. Ясно, что есть некая база. Но что в этой базе храниться? Как убираются шумы?

Вопрос задан более трёх лет назад
7888 просмотров

Комментировать

Подписаться 6 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Саунд-дизайнер

7 месяцев

Далее
Skillbox

Основы съёмки и монтажа

5 месяцев

Далее
Onskills

Онлайн-курс по созданию подкаста

1 месяц

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Обработка звука

Простой
Кто нибудь получал ELASTIQUE PRO SDK от zplane.technology?
- 1 подписчик
- 27 апр.
- 69 просмотров
1

ответ
Аудио

+2 ещё

Простой
Почему могут возникать проблемы с записью звука?
- 1 подписчик
- 25 февр.
- 121 просмотр
1

ответ
Обработка звука

Простой
Какое ПО использовать для озвучки?
- 3 подписчика
- 23 окт. 2025
- 275 просмотров
2

ответа
Обработка звука

Простой
Как на студии звукозаписи сделать, чтобы исполнитель в кабине слышал меня в своих наушниках? Это помимо микро для записи ещё один нужен?
- 1 подписчик
- 16 сент. 2025
- 100 просмотров
0

ответов
Windows

+2 ещё

Простой
Чем записывать аудио поток на компьютере?
- 1 подписчик
- 22 июл. 2025
- 273 просмотра
3

ответа
Аудио

+1 ещё

Простой
Как починить очень плохую аудиозапись?
- 3 подписчика
- 05 июл. 2025
- 953 просмотра
1

ответ
Обработка звука

+2 ещё

Простой
Почему фоновое гудение даже на обработанном звуке на моменте разговора blue yeti?
- 1 подписчик
- 29 июн. 2025
- 64 просмотра
0

ответов
Аудио

+2 ещё

Средний
ИИ и создание музыкальных композиций (песен)?
- 1 подписчик
- 04 июн. 2025
- 265 просмотров
2

ответа
Машинное обучение

+2 ещё

Средний
Как обучить локальную модель своему голосу?
- 1 подписчик
- более года назад
- 1071 просмотр
1

ответ
Электроника

+4 ещё

Средний
Как правильно сдвинуть амплитуду аудио сигнала выше нуля?
- 1 подписчик
- более года назад
- 450 просмотров
5

ответов
Показать ещё Загружается…

Answer 1 · 2010-09-20 22:10:31

Keane @Keane

Вот, здесь доступно описан алгоритм (англ.) http://laplacian.wordpress.com/2009/01/10/how-shazam-works/

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2010-09-20 22:10:09

Привет, точно я конечно сказать не могу, но скорее всего и используется трансформация Фурье (FFT), и соответствующий набор фильтров. Фильтры срезают шумы выше и ниже каких-то уровней (ухо слышит где-то от 6 до 20000 герц, но я думаю срез они делают намного уже). Потом этот срез раскладывается через FFT. Можно себе это представить как разложение песни на частотные компоненты. Много баса — коэффициенты нижних частот будут выше. Много высоких звуков (hi-hat) — верхние компоненты будут выше. Получается отпечаток песни. Когда ты загружаешь туда свою запись с айфона сервер пытается подыскать самый похожий отпечаток.
Там наверняка тренируются алгоритмы AI и дата-майнинга чтобы искать наиболее эффективнее. Простейший пример это искусственная нейронная сеть (всё есть в вики).

Как работают программы распознавания музыки?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт