Как сделать эффект «бурундука» в реальном времени (pyaudio)?

Question

SuperZombi @SuperZombi

Обработка звука

Как сделать эффект «бурундука» в реальном времени (pyaudio)?

Идея: Прослушивать микрофон пользователя и в режиме реального времени (возможная задержка до 500 мс) изменять высоту звука и воспроизводить его на устройстве вывода (Virtual Audio Cable).

from librosa.effects import pitch_shift
...
def pitch_shift_callback(in_data, frame_count, time_info, status):
    pitch_value = 6
    audio_data = np.frombuffer(in_data, dtype=np.float32)
    shifted_audio_data = pitch_shift(audio_data, sr=44100, n_steps=pitch_value)
    out_data = shifted_audio_data.tobytes()
    return (out_data, pyaudio.paContinue)

...
p = pyaudio.PyAudio()
stream = p.open(format=pyaudio.paFloat32, channels=1, rate=44100,
        input_device_index=SETTINGS["INPUT_DEVICE"],
        output_device_index=SETTINGS["OUTPUT_DEVICE"],
        input=True, output=True,
        stream_callback=pitch_shift_callback,
        frames_per_buffer=2048)

У меня довольно мощный компьютер, но при обработке я получаю прерывистый эффект между чанками.
Я пробовал увеличивать и уменьшать размер чанков, но это не помогает.
Я также изучал, почему это происходит. Если вы оставите необработанный звук и просто установите time.sleep(0.05), то этот прерывистый эффект также появится.

def pitch_shift_callback(in_data, frame_count, time_info, status):
    time.sleep(0.01)
    return (in_data, pyaudio.paContinue)

Скорее всего это связано с тем, что между чанками появляются "дырки" длительностью по 0,01сек и этого достаточно, чтобы запороть аудиодорожку.
Кто-то знает как это можно пофиксить? (возможно использовать какой-то другой алгоритм)

Вопрос задан более двух лет назад
226 просмотров

1 комментарий

Подписаться 1 Средний 1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Машинное обучение

+2 ещё

Средний
Как обучить локальную модель своему голосу?
- 1 подписчик
- 26 янв.
- 280 просмотров
1

ответ
Электроника

+4 ещё

Средний
Как правильно сдвинуть амплитуду аудио сигнала выше нуля?
- 1 подписчик
- 24 янв.
- 336 просмотров
5

ответов
Компьютеры

+3 ещё

Средний
Цифровой шум ( писк ), как бороться?
- 1 подписчик
- 17 янв.
- 564 просмотра
2

ответа
Искусственный интеллект

+2 ещё

Сложный
Управление презентацией PowerPoint голосом?
- 1 подписчик
- 20 нояб. 2024
- 104 просмотра
0

ответов
Обработка звука

Простой
Adobe Audition: где расположен ползунок громкости внутри редактора?
- 1 подписчик
- 15 окт. 2024
- 59 просмотров
1

ответ
Аудио

+1 ещё

Простой
Какой софтиной можно определить в каком аудио формате RAW данные?
- 2 подписчика
- 08 окт. 2024
- 178 просмотров
1

ответ
Обработка звука

Простой
Как правильно совместить оригинальную дорожку и чистый голос озвучки?
- 1 подписчик
- 02 окт. 2024
- 87 просмотров
1

ответ
Нейронные сети

+1 ещё

Средний
Транскрибирующие все что есть — программы и нейросети — есть ли такие?
- 1 подписчик
- 11 сент. 2024
- 144 просмотра
1

ответ
Машинное обучение

+2 ещё

Простой
С помощью какой AI модели можно локально обработать аудио-файлы (русский голос)?
- 4 подписчика
- 10 сент. 2024
- 464 просмотра
1

ответ
Аудио

+2 ещё

Простой
Есть ли решение проблемы в работе USB DAC?
- 1 подписчик
- 06 сент. 2024
- 146 просмотров
0

ответов
Показать ещё Загружается…

Intern It-recruiter

Wanted.

от 60 000 до 120 000 ₽

Intern It-recruiter

Wanted. • Москва

от 60 000 до 120 000 ₽

HR manager

MakeDifference

от 50 000 до 100 000 ₽

Такого не должно быть. Насколько я знаю эффект питча сдвигает голосовой спектр в более высокие частоты - но на выходе мы должны получать ту-же самую частоту семплирования. И никаких технических sleep ставить не надо.

Как сделать эффект «бурундука» в реальном времени (pyaudio)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт