Как сделать алгоритм распознавания музыки?

Question

Neo01 @Neo01

Как сделать алгоритм распознавания музыки?

Хочу сделать мобильное приложение для распознавания музыки (для викторин по муз.литре в музыкалке). Самое трудное что нужно сделать - алгоритм разпознавания музыки

Что нужно знать и уметь для реализации такого алгоритма?
Какие технологии применяются?
Из каких источников брать информацию?

Вопрос задан более двух лет назад
530 просмотров

7 комментариев

Подписаться 1 Простой 7 комментариев

mayton2019 @mayton2019

Что должно быть результатом распознавания? Ритм? Мелодия? Или какие-то другие характеристики?

Надеюсь ты осознаешь что база мировой музыки даже в названиях слишком велика чтобы впихнуть
ее в мобилу.

Написано более двух лет назад
Saboteur @saboteur_kiev Куратор тега Программирование

изучаешь акустику и математику по работе с акустикой.
Алгоритмы обработки шумов, частот, высот и так далее.

Написано более двух лет назад
Neo01 @Neo01 Автор вопроса

mayton2019, результатом распознавания должно быть:

Композитор
Название
Жанр
Направление
Автор текста
Тональность
Действие
Картина

Написано более двух лет назад
mayton2019 @mayton2019

Что такое действие и картина?

Написано более двух лет назад
Neo01 @Neo01 Автор вопроса

mayton2019, это термины из оперы

Действие (акт) — основная и самая крупная единица в структуре оперы, включающая законченную часть ее сюжета. Нумеруется цифрами

Картина — часть оперы, которая, согласно либретто, разыгрывается в одних и тех же декорациях. Тоже нумеруются цифрами

Написано более двух лет назад
mayton2019 @mayton2019

Neo01, ты - Android разработчик или FullStack? Потому что для полноценного распознавания тебе нужен хороший внешний API.

Написано более двух лет назад
Виктор @nehrung

Neo01,
Композитор
Название
Жанр
Направление
Автор текста
Тональность
Действие
Картина

Боюсь, что такая широкомасштабная хотелка очень сложна в воплощении в код. Тут одному не справиться, нужна команда. Во-первых, понадобится база данных, огромнейшая, не побоюсь этого слова. Во-вторых, даже более простая задача - выделить из полного музыкального спектра любой аранжировки (а у популярных произведений их туева хуча под любые наборы музыкальных инструментов) основную музыкальную тему (буквально, ноты), по которой и будет происходить само распознавание - по-моему, неподъёмна для одного человека. Может быть, я ошибаюсь и с этим справится один высококвалифицированный кодер, но ему придётся убить на это дело не один год собственной жизни, прежде чем возникнет нечто удобоваримое.
Может, сузите задачу?

Написано более двух лет назад

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Профессия Инженер по тестированию

10 месяцев

Далее
Нетология

Инженер по тестированию

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 3

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Программирование

+1 ещё

Простой
Нужен ли микро-сервису отдельный сервер/хост?
- 1 подписчик
- 10 часов назад
- 69 просмотров
1

ответ
Аудио

+1 ещё

Средний
Почему постоянно слышны щелчки и посторонние звуки в наушниках Nothing Ear 2 (2024)?
- 1 подписчик
- 05 дек.
- 96 просмотров
1

ответ
Программирование

Простой
Какие технологии/ИИ есть для клонирования русской речи?
- 10 подписчиков
- 02 дек.
- 486 просмотров
1

ответ
Аудио

Простой
Разделение аудио на инструментал и вокал в Logic Pro или где угодно?
- 1 подписчик
- 29 нояб.
- 76 просмотров
0

ответов
Видео

+3 ещё

Средний
Как скачать видеозапись Zoom со второй аудиодорожкой (не той, что по умолчанию)?
- 1 подписчик
- 25 нояб.
- 132 просмотра
2

ответа
Программирование

+2 ещё

Средний
Возможно ли написать программу, которая будет удалять все данные с дисков?
- 3 подписчика
- 19 нояб.
- 926 просмотров
10

ответов
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 6 подписчиков
- 22 сент.
- 1499 просмотров
5

ответов
Железо

+2 ещё

Средний
Что делать если после поломанных наушников стали некорректно играть и колонки?
- 2 подписчика
- 18 сент.
- 250 просмотров
0

ответов
Аудио

Простой
Расстановка акустики 5.1.4 в домашнем кинотеатре?
- 1 подписчик
- 14 сент.
- 210 просмотров
1

ответ
JavaScript

+2 ещё

Простой
Можно ли заменить кликанье мышью по веб-интерфейсу cli-командой?
- 3 подписчика
- 13 сент.
- 1161 просмотр
2

ответа
Показать ещё Загружается…

Backend developer

Creative Code

До 190 000 ₽

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽

Backend Developer

Playerok

от 400 000 ₽

Что должно быть результатом распознавания? Ритм? Мелодия? Или какие-то другие характеристики?

Надеюсь ты осознаешь что база мировой музыки даже в названиях слишком велика чтобы впихнуть
ее в мобилу.
изучаешь акустику и математику по работе с акустикой.
Алгоритмы обработки шумов, частот, высот и так далее.
mayton2019, результатом распознавания должно быть:

Композитор
Название
Жанр
Направление
Автор текста
Тональность
Действие
Картина
mayton2019, это термины из оперы

Действие (акт) — основная и самая крупная единица в структуре оперы, включающая законченную часть ее сюжета. Нумеруется цифрами

Картина — часть оперы, которая, согласно либретто, разыгрывается в одних и тех же декорациях. Тоже нумеруются цифрами
Neo01, ты - Android разработчик или FullStack? Потому что для полноценного распознавания тебе нужен хороший внешний API.
Neo01,
Композитор
Название
Жанр
Направление
Автор текста
Тональность
Действие
Картина

Боюсь, что такая широкомасштабная хотелка очень сложна в воплощении в код. Тут одному не справиться, нужна команда. Во-первых, понадобится база данных, огромнейшая, не побоюсь этого слова. Во-вторых, даже более простая задача - выделить из полного музыкального спектра любой аранжировки (а у популярных произведений их туева хуча под любые наборы музыкальных инструментов) основную музыкальную тему (буквально, ноты), по которой и будет происходить само распознавание - по-моему, неподъёмна для одного человека. Может быть, я ошибаюсь и с этим справится один высококвалифицированный кодер, но ему придётся убить на это дело не один год собственной жизни, прежде чем возникнет нечто удобоваримое.
Может, сузите задачу?

Answer 1 · 2023-05-18 08:28:04

Что нужно знать и уметь для реализации такого алгоритма?

По алгоритмам ровно ничего, создать свой сервис для распознавания музыки - это сверхакадемический уровень (или уровень серьезного сеньора, которого оторвут с руками и возьмут на работу в youtube после того как его уведут из shazam).

Какие технологии применяются?

Для обычного разработчика применяются навыки работы с API любых сервисов, к которым можно получить доступ через авторизацию, и в которые в режиме запрос-ответ дадут искомые данные.
1. Изучаете API условного Shazam-a, куда будете отправлять образцы звуковых данных.
2. Изучаете API музыкальных библиотек, куда будете отправлять результат ответа от Shazam, чтобы получить недостающие данные.

Answer 2 · 2023-05-19 11:59:29

Если читать задачу как есть - не написать свое приложение с чужим API, а именно свой алгоритм...
Мне видится следующая схема:
1) Написание бизнес-плана, т.к. придется привлекать очень большие средства.
2) Получение первичного финансирования для изысканий.
3) Покупка сервера с несколькими видеокартами с большим объемом OЗУ.
4) Поиск и найм как минимум 2-х специалистов: музыкального теоретика, дружащего с программированием, и программиста, с опытом написания обучаемых нейросетей.
5) Даете им время на изыскания и опыты: определить какие ключевые моменты в мелодии надо анализировать и как уменьшить объем аудиоданных, сохранив только важные для распознавания характеристики. Написание и тренировка модели на относительно небольшой базе музыки, которая будет помещаться в видеопамять сервера, с учетом, что там еще и нейросеть размещена.
6) В случае успеха на пункте 5 (у вас есть модель, которая распознает входной аудиопоток по тестовой базе):
- корректируете бизнес-план с учетом масштабирования на всю музыкальную базу
- заключаете лицензионное соглашение с одним или несколькими лейблами - на получение и использование аудиоматериала.
- нанимаете команду для разработки мобильного приложения.
- арендуете датацентр с необходимыми серверными мощностями, обучаете нейросети распознаванию музыкального материала (частями), исходя из того, сколько может переварить 1 сервер.

P.S.
Ну и потом можете проводить свои викторины...

P.P.S.
Если Вы всё еще думаете, что распознавание это простой алогритм, который работает внутри телефона - попробуйте запустить Шазам отключив интернет.

Answer 3 · 2023-05-17 19:55:51

Самый лёгкий способ - искать api для решений типа шазама. Вот ещё почитать: https://habr.com/ru/articles/122969/

Как сделать алгоритм распознавания музыки?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт