Как устроент autotune?

Question

Robotex @Robotex

Как устроент autotune?

Много раз видел приложения, которые авоматически подстраивают пропетое в микрофон таким образом, чтобы голос попадал в ноты. Каким образом они устроены? Какие алгоритмы положены в их основу?

Вопрос задан более трёх лет назад
6640 просмотров

Комментировать

Подписаться 4 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Go-разработчик с нуля + нейросети

9 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

merlin-vrn @merlin-vrn

Да, забыл: когда вокалист реально поёт, переходы между частотами нот получаются короткие, но всё же плавные. Он не сразу перескакивает с одной на другую, а делает этакое короткое глиссандо. Также, голос всегда немного (иногда много) вибрирует, «гуляет» около некоторого центрального тона.

Если тон менять резко, звучит неестественно. Если тон будет очень стабильным, тоже звучит странно (у меня первая ассоциация — монотонная сирена).

Поэтому у нормального тюнера есть временные параметры (точно так же, как у динамического процессора), т.е. сдвиг между целевым тоном и реальным будет меняться постепенно; также часто подтягивают не «до конца», а оставляют небольшую ошибку, чтобы сохранить естественность.

Вообще стоит поиграться с gsnap из набора gvst (бесплатные фильтры, в linux отлично работают с fst). Он рисует графики «как было», «как стало», поддерживает два режима (автомат и midi), причём можно задать тональность для авторежима, при этом он в тональности ля-минор никогда не подтянет ноту до до-диеза — в тональности её нет, поэтому получится либо «до», либо «ре».

Написано более трёх лет назад

6 комментариев

track @track

Да, только за вычетом первой части, фон не отсекается, потому что фона нет. Автотюн включается в тот канал, в котором микрофон (или иной источник фальшака) и больше ничего. Потом идущий в нем сигнал в реалтайме автоматически подтягивается к частоте ближайшей точной ноты.

Написано более трёх лет назад
Robotex @Robotex Автор вопроса

А по какому алгоритму производится подтяжка?

Написано более трёх лет назад
65520 @65520

Обычно в композиции используются не все 12 полутонов (те самые 7 нот + альтерация), а существенно меньше. В пентатонике, например, будет использоваться всего 5 нот. Соответственно, алгоритм подтягивает к ближайшей из этих пяти. Если петь совсем коряво, то автотюнер не поможет. Тональность композиции обычно задаётся в настройках приложения.

Написано более трёх лет назад
Daemon_Hell @Daemon_Hell

Некоторым автотюнам можно по миди показывать куда тянуть.

Написано более трёх лет назад
merlin-vrn @merlin-vrn

Некоторым можно и аккорды давать, чтобы самому с собой хором петь

Написано более трёх лет назад
Eugene @Methos

здорово

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Математика

Простой
Опечатка или нет?
- 1 подписчик
- 17 июл.
- 145 просмотров
2

ответа
Математика

Средний
Что такое отношения в предикатной логике?
- 1 подписчик
- 05 июл.
- 155 просмотров
2

ответа
C++

+1 ещё

Простой
Как правильно посчитать UV координаты из локальных нормальных?
- 1 подписчик
- 20 июн.
- 118 просмотров
1

ответ
Алгоритмы

Простой
Стоит ли читать книгу «Грокаем алгоритмы»?
- 1 подписчик
- 27 мая
- 327 просмотров
0

ответов
Математика

Простой
Биекция в комбинаторике на конечных множествах?
- 1 подписчик
- 30 апр.
- 142 просмотра
1

ответ
Алгоритмы

Простой
Как реализовать поиск слов в файлах?
- 2 подписчика
- 06 апр.
- 393 просмотра
3

ответа
Математика

Простой
Расчет формулы метода Фулмера. Что делать если при расчете логарифма на входе получается отрицательное число?
- 2 подписчика
- 30 мар.
- 269 просмотров
3

ответа
Алгоритмы

Простой
Как распознавать полосу для робота на шахматной доске?
- 1 подписчик
- 19 мар.
- 222 просмотра
1

ответ
Программирование

+1 ещё

Простой
Стоит ли поступать в вуз на программу по математике, если в будущем хочешь иметь профессию, связанную с программированием?
- 4 подписчика
- 07 мар.
- 3579 просмотров
7

ответов
Математика

+1 ещё

Средний
Как решать задачу, пожалуйста?
- 1 подписчик
- 04 мар.
- 551 просмотр
2

ответа
Показать ещё Загружается…

Answer 1 · 2012-10-12 08:05:49

1. Гейт
Определяет, есть ли сигнал на входе. Обычно адаптивный. Если сигнала нет, логика анализа и изменения не срабатывает, сигнал со входа просто задерживается на алгоритмическую задержку (едицицы-десятки мс) и копируется на выход.

2. Анализ
Достаточно просто. FFT, разделяются тоновые части (гармоники связок) и форманты. Анализируется частота тона гармонической части.
Вычисляется, как нужно изменить эту частоту. (Здесь может быть несколько подходов.)

3. Операции
Тоновая часть смещается. Форманты остаются. Потом всё это собирается заново

Весь алгоритм даёт некоторую задержку, размер которой связан с размером окна FFT. Делают и перекрытие окон. В общем, задержка обычно больше окна раза в два.

Режимы функционирования такие:
— Автоматическая подтяжка, когда частота заменяется на частоту ближайшего точного тона. Например, если у вас звук на 1/8 выше ноты «До» первой октавы — его опустят до точного совпадения с этой нотой
— Подтяжка «по подсказке» (guided, midi mode). В программу посылают звук и MIDI-поток нот, к которым всё и притягивается. Так можно петь даже монотонно, а программа сделает из этого мелодию.
— Можно просто добавить копию «на три полутона выше». Вокалист поёт один, а звучит как «с подпевкой».
— Можно сделать и так: вы поёте один, а на MIDI-клавиатуре держите аккорд. Все ноты аккорда посылаются в программу. При этом запускается несколько процессов операции, а результат суммируется. Получается, что вы поёте хором сам с собой этот аккорд. При должном использовании результат завораживает.

Вообще этот подход — формантный синтез — применяется для искажения звука (вокодер), но поскольку в данном случае мы берём натуральный голос и форманты оставляем, то звук получается тоже больше похож на натуральный.

Как-то так.

Answer 2 · 2012-10-12 03:01:13

Как-то задумывался над этим вопросом, загуглить не удосужился, поэтому говорю от балды, если не прав — поправьте, пожалуйста.
Алгоритм примерно такой — берем запись, отсекаем фон, чтобы оставить только голос, дальше — преобразование Фурье, и гармоники, из которых голос состоит, подтягиваем до нужных частот, которые соответствуют ступеням звукоряда, которые хотим получить.

Как устроент autotune?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт