@Neo01

Как сделать алгоритм распознавания музыки?

Хочу сделать мобильное приложение для распознавания музыки (для викторин по муз.литре в музыкалке). Самое трудное что нужно сделать - алгоритм разпознавания музыки

Что нужно знать и уметь для реализации такого алгоритма?
Какие технологии применяются?
Из каких источников брать информацию?
  • Вопрос задан
  • 295 просмотров
Пригласить эксперта
Ответы на вопрос 3
@alexalexes
Что нужно знать и уметь для реализации такого алгоритма?

По алгоритмам ровно ничего, создать свой сервис для распознавания музыки - это сверхакадемический уровень (или уровень серьезного сеньора, которого оторвут с руками и возьмут на работу в youtube после того как его уведут из shazam).
Какие технологии применяются?

Для обычного разработчика применяются навыки работы с API любых сервисов, к которым можно получить доступ через авторизацию, и в которые в режиме запрос-ответ дадут искомые данные.
1. Изучаете API условного Shazam-a, куда будете отправлять образцы звуковых данных.
2. Изучаете API музыкальных библиотек, куда будете отправлять результат ответа от Shazam, чтобы получить недостающие данные.
Ответ написан
pindschik
@pindschik
ФЫВА ОЛДЖ
Если читать задачу как есть - не написать свое приложение с чужим API, а именно свой алгоритм...
Мне видится следующая схема:
1) Написание бизнес-плана, т.к. придется привлекать очень большие средства.
2) Получение первичного финансирования для изысканий.
3) Покупка сервера с несколькими видеокартами с большим объемом OЗУ.
4) Поиск и найм как минимум 2-х специалистов: музыкального теоретика, дружащего с программированием, и программиста, с опытом написания обучаемых нейросетей.
5) Даете им время на изыскания и опыты: определить какие ключевые моменты в мелодии надо анализировать и как уменьшить объем аудиоданных, сохранив только важные для распознавания характеристики. Написание и тренировка модели на относительно небольшой базе музыки, которая будет помещаться в видеопамять сервера, с учетом, что там еще и нейросеть размещена.
6) В случае успеха на пункте 5 (у вас есть модель, которая распознает входной аудиопоток по тестовой базе):
- корректируете бизнес-план с учетом масштабирования на всю музыкальную базу
- заключаете лицензионное соглашение с одним или несколькими лейблами - на получение и использование аудиоматериала.
- нанимаете команду для разработки мобильного приложения.
- арендуете датацентр с необходимыми серверными мощностями, обучаете нейросети распознаванию музыкального материала (частями), исходя из того, сколько может переварить 1 сервер.

P.S.
Ну и потом можете проводить свои викторины...

P.P.S.
Если Вы всё еще думаете, что распознавание это простой алогритм, который работает внутри телефона - попробуйте запустить Шазам отключив интернет.
Ответ написан
Комментировать
xez
@xez
TL Junior Roo
Самый лёгкий способ - искать api для решений типа шазама. Вот ещё почитать: https://habr.com/ru/articles/122969/
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы