Ищу алгоритм анализа нетривиальных данных

Контекст вопроса относится к звуку и психоакустике. Но сам вопрос связан с информацией и алгоритмами.

Сначала очень краткое описание контекста. Спектр ноты «нормального» музыкального инструмента состоит из
отдельных линий (гармоник), образующих арифметическую прогрессию по частоте



и спадающих примерно как ~1/f по амплитуде. («Нормальные» — это значит: не колокола, и даже не пан-флейта).
Несколько нот, взятые одновременно (аккорд), образуют «муаровый узор» гармоник:



Я разбираюсь с темой консонанса/диссонанса, т.е. степени «приятности» звучания аккорда.
Есть несколько гипотез, как вид спектра влияет на консонанс.

Одна из них гораздо больше связана с информацией и алгоритмами, а не акустикой.
Утверждается, что один из способов, которым слуховая кора ( и тем более фронтальная)
анализирует звук — когнитивный, т.е. спектр воспринимается как целое и мозг подбирает
«алгоритм описания» линейчатого узора.

Если этот алгоритм прост, компактен, то аккорд воспринимается как приятный, созвучный.
Если алгоритм получается «навороченный», то звук оценивается как немузыкальный,
некрасивый. Очевидно, речь идёт о т.н. Колмогоровской сложности.

На уровне описания мне понравилась эта гипотеза. Но хотелось бы получить количественные оценки!
Можно упрощенно сказать, что для любых сложных звуков наш слух инстинктивно пытается подобрать один тон.
Таким образом, можно попытаться оценить, насколько сложный узор аккорда «близок» к ряду гармоник одной ноты.

Проблема в том, что опыты показывают — основная частота «виртуальной ноты» может
вообще не принадлежать аккорду!
Вот тут я уже начал тормозить. И вопрос получается такой.
Есть набор данных вида { {f1, a1}, {f2, a2}, .....}, где f — частоты, а — амплитуды.
— Нужен алгоритм оценки, насколько этот набор близок к гармоническому { {f0, a0}, {2*f0, a0/2}, {3*f0, a0/3}, ....} с некоторой (заранее неизвестной) f0.
— Либо, количественная оценка алгоритмической сложности исходного набора

Прошу прощения за некоторую сумбурность, готов уточнить детали.
  • Вопрос задан
  • 4368 просмотров
Пригласить эксперта
Ответы на вопрос 4
m08pvv
@m08pvv
Первое что приходит в голову — вэйвлет-разложение с использованием подходящего материнского вэйвлета (например, в виде спектра ноты), после чего просто смотреть на коэффициенты.
Ответ написан
lesobrod
@lesobrod Автор вопроса
Я вот придумал совсем примитивный анализ. У ноты все расстояния между линиями одинаковые,
т.е их (расстояний) дисперсия равна нулю Можно взять все попарные расстояния между линиями в аккорде как набор данных, и посчитать всякие его стат. данные — дисперсию, симметрию и т.д.
Ответ написан
Комментировать
@Sayonji
А причем тут амплитуды? Я ведь верно понимаю, что амплитуды грубо говоря означают громкость? Тогда они практически не влияют на приятность ощущения. Скажем, можно взять обычный до-ми-соль, где до сильно отличается громкостью от ми, которая сильно отличается от соль. Получится вполне нормально звучащий аккорд, однако картинка совсем не будет похожа на первую в топике. А можно наоборот, взять до-до#-ре одинаковой интенсивности, тогда картинка будет ровной.
В общем, кажется роль играют только частоты, интуитивно то же кажется. Ведь, раз там арфиметические прогрессии, всё должно быть достаточно периодично и пофигу на эту гиперболу.
А насчет похожести на равномерность, мне ваша же идея кажется вполне подходящей.
Постройте, говоря простым языком, «зависимость колва полосочек слева от частоты», получится набор точек. А его можно методом наименьших квадратов аппроксимировать прямой (а прямая это как раз равномерное распределение), там уже все дисперсии давно посчитаны.
Ответ написан
@egorinsk
> Я разбираюсь с темой консонанса/диссонанса, т.е. степени «приятности» звучания аккорда.

Если я не ошибаюсь, она зависит не от соотношения амплитуд гармоник, а от соотношения частот входящих в него нот.

Вы знаете про соотношение частот нот (имеются в виду основная частота) в созвучных и несозвучных сочетаниях? Этим еще Пифагор занимался. Например, если ноты различаются на 12 полутонов, то это соотношение 2:1, если на 7 пт то 3:2, если на 5 пт то 5:4 (вроде так?). У таких «кратных нот» много совпадающих друг с другом гармоник. Они как бы сливаются при звучании.

Возьмем противоположный пример: ноты, различающиеся на 1пт. У сочетания таких нот, если изобразить спектр, гармоники не совпадают, выглядят сдвоенными палками, находятся близко друг к другу и звучат они не очень-то приятно.

В мажорном аккорде тоже есть какие-то соотношения между частотами звука отдельных нот.

Также, у меня есть ощущение, что мозг умеет объединять гармоники с основной частотой. Например, звуки музыкальных инструментов состоят из гармоник, но мы ведь слышим их как одну ноту, а не несколько. Потому, наверно, амплитуда отдельных гармоник (и характер их изменения во времени) определяет тембр звука, но не «приятность» звучания аккорда.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы