Транспонирование звука?

Question

Gol @Gol

Транспонирование звука?

Сижу вот, пишу сервер звуковых эффектов для виртурилки, нужен для эмитации звука движка машинки (а также клаксона и прочих звуков). Всё на базе ALSA.

Есть буфер, в который помещаю сэмпл звука двигателя. С микшированием звуков (например, бибикание одновременно со звуком двигателя) разобрался — тупо побайтовое сложение двух буферов сэмплов, двигателя и клаксона (с последующим ограничением по амплитуде чтоб треска не было). А вот сделать транспонирование звука двигателя что-то не получается. Транспонирование — изменение тональности, т.е. чем быстрее машинка едет — тем выше звук. Пробовал оставлять только каждый 2-й (или 3-й, 4-й) байт из буфера сэмпла, но получается какая-то фигня.

Подскажите, плиз, в каком направлении копать. Всё это дело должно производиться на лету. В голову лезут смутные воспоминания о FFT (быстрое преобразование Фурье), но конкретно не пойму как применить.

UPD> Всё, сделали, работает и даже не лагает.

Вопрос задан более трёх лет назад
3816 просмотров

Комментировать

Подписаться 5 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

1С-программист

10 месяцев

Далее
Skillbox

Профессия 1C-разработчик

8 месяцев

Далее
Hi-TECH Academy

KL 004.2.4 Kaspersky SD-WAN

2 дня

Далее

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

3 комментария

Gol @Gol Автор вопроса

В теории я это примерно представляю, ага. Но как конкретно математически (в виде операций надо байтами буфера) выразить — вот где засада :-(

Написано более трёх лет назад
MT @MTonly

См., например, статью «Noise: Creating a Synthesizer for Retro Sound Effects – Introduction» (англ.) или, применительно к генерации звука конкретно в браузере, статью «Creating a simple synth» на MDN.

Написано более трёх лет назад
Eddy_Em @Eddy_Em

Если есть возможность сделать БПФ, можно попробовать менять частоту с его помощью.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Arduino

+1 ещё

Средний
Почему в самописном приёмнике данные не принимаются без Serial.print()?
- 1 подписчик
- 19 дек.
- 69 просмотров
1

ответ
C

+4 ещё

Средний
Почему прошивка для STM32F103 не запускается после перехода с Keil на Cmake?
- 1 подписчик
- 11 дек.
- 114 просмотров
0

ответов
Программирование

Простой
Какие технологии/ИИ есть для клонирования русской речи?
- 12 подписчиков
- 02 дек.
- 706 просмотров
1

ответ
Микроконтроллеры

Простой
Какой модуль на основе ESP8266 выбрать для старта ребёнку 13 лет?
- 4 подписчика
- 25 нояб.
- 485 просмотров
4

ответа
Программирование

+2 ещё

Средний
Возможно ли написать программу, которая будет удалять все данные с дисков?
- 3 подписчика
- 19 нояб.
- 1052 просмотра
11

ответов
Обработка звука

Простой
Какое ПО использовать для озвучки?
- 3 подписчика
- 23 окт.
- 255 просмотров
2

ответа
Микроконтроллеры

+3 ещё

Средний
Как открыть таблицу регистров периферии в gdb (openocd)?
- 3 подписчика
- 24 сент.
- 130 просмотров
0

ответов
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 6 подписчиков
- 22 сент.
- 1521 просмотр
5

ответов
Обработка звука

Простой
Как на студии звукозаписи сделать, чтобы исполнитель в кабине слышал меня в своих наушниках? Это помимо микро для записи ещё один нужен?
- 1 подписчик
- 16 сент.
- 94 просмотра
0

ответов
JavaScript

+2 ещё

Простой
Можно ли заменить кликанье мышью по веб-интерфейсу cli-командой?
- 3 подписчика
- 13 сент.
- 1175 просмотров
2

ответа
Показать ещё Загружается…

Python Backend Developer

Hard Bootstrapping LLC. • Санкт-Петербург

от 175 000 до 350 000 ₽

Backend Developer

Playerok

от 400 000 ₽

nestjs backend developer

instat

от 120 000 до 240 000 ₽

Answer 1 · 2013-02-03 20:53:12

Если не боитесь читать исходники, возьмите libmodplug и посмотрите, как это сделано у них. Принцип вам MTonly уже описал.

То, что вы делали — «это слишком». Если брать каждый второй сэмпл получается примитивный частный случай (но совершенно правильный с точки зрения теории!) ресемплинга «на октаву выше». Не немного, сразу на октаву, т.к. частота вырастает сразу вдвое.

Если нужно не вдвое, ресемплинг нужно делать не так. В частности, брать не каждый второй, а допустим при проигрывании каждых очередных 100 отсчётов получать их из 101 исходного отсчёта. Таким образом вы сделаете звук чуть-чуть выше. Примитивный вариант для вас будет — линейная интерполяция: отсчёты расположены равномерно, но «решётки» не совпадают. Вычисляете, с какими весами должны входить два ближайших отсчёта.

Пример:
Пусть отсчёты PCM будут 15 123 53 234 54 52 35 151… Мы хотим сыграть их на квинту выше, т.е. для каждых трёх исходных мы должны воспроизвести два.
тогда на выходе будет:
15, (125+53)/2, 234, (54+52)/2, 35, и так далее. Я здесь «промежуточные» отсчёты, которые находились в тех точках, в которых в оригинале ничего не было, вычисляю при помощи линейной интерполяции. Поскольку новые отсчёты лежат точно посередине, два «соседних» входят с одинаковыми весами.
Другой пример с этой же последовательностью: мы хотим сделать из этих восьми отсчётов семь. На выходе:
15, (123*5+53*1)/6, (53*4+234*2)/6, (234*3+54*3)/6, (54*2+52*4)/6, (52*1+35*5)/6, 151,…
Или же, сдвиг на a=0.992:
15, 123*(1-a)+53*a, 53*(1-2a)+234*2a,… — осталось только научиться правильно обрабатывать момент, когда n*a становится больше единицы.
Стоит нарисовать «временнУю диаграмму» для того и другого количества отсчётов, а потом посмотреть, что и как вычислять.

Для аккуратной интерполяции есть более продвинутые алгоритмы, в частности, фильтры FIR (finite impulse response, КИХ, конечная импульсная характеристика) — они будут давать меньше «призвуков» при таком изменении тона.
А потом вы забьёте на реализацию этого самостоятельно и начнёте использовать библиотеку rubberband :)

Answer 2 · 2013-02-02 22:03:01

Общий принцип синтеза на основе сэмплов: чем выше нужен тон, тем с большей скоростью следует воспроизводить сэмпл. Увеличение скорости воспроизведение вдвое повышает высоту тона на октаву. Для промежуточных полутонов следует использовать дробный коэффициент.

Транспонирование звука?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт