Алгоритмы для обработки и анализа звука

Question

KiriKiri @KiriKiri

Алгоритмы для обработки и анализа звука

Хочется написать свой программный тюнер для гитары (на подобии AP Guitar Tuner), но к сожалению я в этой теме совершенно не ориентируюсь. Примерно себе представляю, что для этого нужно, но как подступиться к проблеме не знаю. Посоветуйте ресурсы или литературу на соответствующую тематику. Спасибо.

Вопрос задан более трёх лет назад
12190 просмотров

Комментировать

Подписаться 6 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 4

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Аналитика

+1 ещё

Простой
Какие есть эффективные средства анализа больших данных?
- 1 подписчик
- 19 часов назад
- 73 просмотра
2

ответа
Алгоритмы

Простой
Как можно уменьшить количество комбинаций в игре крестики нолики?
- 1 подписчик
- вчера
- 111 просмотров
2

ответа
Компьютеры

+1 ещё

Простой
Как вывести звук на беcпроводные наушники имея пк, тел. с проводом, в тел. блютуз?
- 1 подписчик
- 18 авг.
- 105 просмотров
1

ответ
Алгоритмы

+1 ещё

Простой
Как в квантовый компьютер вводятся данные?
- 1 подписчик
- 12 авг.
- 184 просмотра
3

ответа
Windows

+2 ещё

Простой
Чем записывать аудио поток на компьютере?
- 1 подписчик
- 22 июл.
- 212 просмотров
2

ответа
Электроника

+1 ещё

Простой
Как правильно заменить обычный потенциометр на DPDT?
- 1 подписчик
- 14 июл.
- 207 просмотров
1

ответ
Аудио

+1 ещё

Простой
Как проверить множество mp3-файлов на целостность?
- 1 подписчик
- 13 июл.
- 80 просмотров
1

ответ
Аудио

+1 ещё

Простой
Как починить очень плохую аудиозапись?
- 3 подписчика
- 05 июл.
- 854 просмотра
1

ответ
Алгоритмы

+1 ещё

Средний
Как можно предиктить дату регистрации при массиве данных?
- 1 подписчик
- 03 июл.
- 153 просмотра
1

ответ
Аналитика

+1 ещё

Средний
Как быстро локализовать в логах источник изменений метрики?
- 1 подписчик
- 30 июн.
- 87 просмотров
0

ответов
Показать ещё Загружается…

Разработчик бэкенда в команду коммуникационной платформы

Яндекс • Москва

от 300 000 до 490 000 ₽

Разработчик в буткемп Core Infrastructure

Яндекс • Москва

от 300 000 до 490 000 ₽

Разработчик бэкенда сервисов телефонии

Яндекс • Москва

от 300 000 до 490 000 ₽

Answer 1 · 2010-09-28 09:35:30

musicdsp.org и евонный форум, и e-mail рассылка.
На русском — любая книжка по цифровой обработке сигналов даст нормальную базу.

По вашей ситуации алгоритм такой:
микрофон(звук)=>АЦП(цифровой массив)=>оконное FFT(массив комплексных чисел)=>массив амплитуд(массив действительных чисел)=>относительная частота максимума=>частота максимума=>нота

Для вашей ситуации нужно знать api снятия звука с микрофона. Api будет выдавать порции звука кусками, допустим, по 1024 float'а. (При частоте дискретизации 44100 это будет 44100/1024 = 43 миллисекунды).
К этому куску нужно применить оконное быстрое преобразование Фурье (FFT), поищите где-нибудь нормальную статью, в котором оно объясняется (пригодится книжка по цифровой обработке сигналов). В интернете есть куча библиотечных функций.
Чтобы знать, что преобразование вообще делает, советую поставить Adobe^W Audition^W бесплатный аудиоредактор со спектроанализатором и посмотреть, что делается со звуком разных нот, на что влияет размер окна и т. п. Мозг сам по себе тоже работает со спектром, а не с самим сигналом, поэтому интуитивно все понимается на ура.

У FFT, чем больше данных, тем большее спектральное разрешение. Для нужного разрешения, может быть нужно FFT'ить 8192 байта, или около того. FFT выдаст массив из 8192 комплексных чисел, модуль каждого из этих чисел даст амплитуду спектра. При этом значения 4096-8191 будут зеркальной копией 0-4095, такова особенность алгоритма. У комплексных чисел можно получить амплитуду, фаза в данном случае не нужна, а амплитуда — sqrt(re^2+im^2). Ну а дальше поиском максимума в массиве.

Максимум будет относительной частотой (массив-то 0-4095, а частоты 0-44100/2). Чтобы перевести абсолютную в относительную, нужно по пропорции умножить на 44100/8192. Т.е. на частоту дискретизации деленную на размер окна FFT. И теперь перевести частоту в ноту. Там экспоненциальная зависимость (частота следующей ноты выше частоты предыдущей в корень двенадцатой степени из двух), с помощью таблички вида (A4 440; A#4 465.96] найти ближайшую не сложно.

Answer 2 · 2010-09-28 09:53:42

KiriKiri @KiriKiri Автор вопроса

Спасибо большое!

Ответ написан более трёх лет назад

Комментировать

Answer 3 · 2010-09-29 09:05:42

Мог бы посоветовать вам ещё книгу «Основы аналогового и цифрового звука». Прочесть краткое инфо о ней и места, где её можно купить — тут.

Answer 4 · 2010-09-29 14:00:44

Рекомендую прекрасный пример на Codeproject, рабочий тюнер, написанный на C#. Для быстрого преобразования Фурье как правило используют библиотеку FFTW

Алгоритмы для обработки и анализа звука

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт