Как повысить тон голоса без увеличения скорости (например, как в приложении Talking Tom Cat)?

Question

yeputons @yeputons

Как повысить тон голоса без увеличения скорости (например, как в приложении Talking Tom Cat)?

Наткнулся на приложение Talking Tom Cat — кот на экране Android'а слушает микрофон и, если что-нибудь сказать, то он повторяет эту фразу, но повышает тон голоса. Получается забавный «мультяшный» голос, как у бурундучков. Очевидный способ добиться такого — воспроизвести звук немного быстрее, но тогда увеличится темп, чего не хотелось бы.

Вопрос: как добиться такого же эффекта? Интересуют алгоритм(ы), но и готовая библиотека для такого рода фигни будет полезна. Буду рад, если посоветуете литературу/статьи/сайт, где можно подсмотреть решение этой задачи.

Что-то слышал про применимость преобразования Фурье. Попытался сделать следующее: применяю прямое преобразование ко всему куску звука, «сдвигаю» результат (data[i — off] = data[i]), заполняя пустоты нулями, делаю обратное преобразование и воспроизвожу вещественную часть (округлив). Получилось что-то похожее, но с кучей искажений. Если применять не к куску, а разделить на несколько непересекающихся и применить по отдельности, результат не лучше.

Вопрос задан более трёх лет назад
6097 просмотров

Комментировать

Подписаться 11 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Математика для Data Science

4 месяца

Далее
ProductStar

Математика и статистика для аналитика на Python

1 месяц

Далее
Яндекс Практикум

Математика для анализа данных

6 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 3

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Математика

Простой
Необходимость сохранения инвариантов при мат. индукции?
- 2 подписчика
- 18 дек.
- 97 просмотров
1

ответ
Аудио

+1 ещё

Средний
Почему постоянно слышны щелчки и посторонние звуки в наушниках Nothing Ear 2 (2024)?
- 1 подписчик
- 05 дек.
- 123 просмотра
1

ответ
Аудио

Простой
Разделение аудио на инструментал и вокал в Logic Pro или где угодно?
- 1 подписчик
- 29 нояб.
- 82 просмотра
0

ответов
Видео

+3 ещё

Средний
Как скачать видеозапись Zoom со второй аудиодорожкой (не той, что по умолчанию)?
- 1 подписчик
- 25 нояб.
- 145 просмотров
2

ответа
Математика

Простой
Правильное ли док-во существования функции?
- 1 подписчик
- 10 нояб.
- 182 просмотра
1

ответ
Математика

Простой
Почему не используется простая таблица истинности?
- 1 подписчик
- 07 нояб.
- 152 просмотра
1

ответ
Математика

Простой
Как решается такое задание?
- 1 подписчик
- 02 нояб.
- 213 просмотров
2

ответа
Обработка звука

Простой
Какое ПО использовать для озвучки?
- 3 подписчика
- 23 окт.
- 255 просмотров
2

ответа
Математика

Простой
Нужно ли это доказывать в обратную сторону?
- 1 подписчик
- 17 окт.
- 179 просмотров
1

ответ
Математика

+1 ещё

Простой
Хороший учебник/статья/книга по производным и началам матанализа?
- 2 подписчика
- 08 окт.
- 335 просмотров
3

ответа
Показать ещё Загружается…

Стажер Аналитик

ПСБ цифровая лаборатория • Москва

от 30 000 до 60 000 ₽

Frontend / Product Engineer (Tauri + Vue) — Solo Role

Poker Training

от 250 000 до 300 000 ₽

Deep Learning Engineer (GigaChat Prod)

Сбер • Москва

от 350 000 ₽

Answer 1 · 2012-10-08 21:06:05

rubberband

есть консольная утилита, есть либа

А вообще, для голоса — теория такая: там есть тон, а есть форманты. При смещении тона форманты смещаться не должны. Они отрезаются формантным фильтром, остаток смещается, потом старые (несмещённые) форманты накладываются. Если хотите поменять «пол» голоса, то форманты тоже придётся преобразовать — у мужчин и женщин они чуть разные.

По-моему, в rubberband это встроено. Если нет, могу назвать gvst, в котором есть gsnap, который умеет правильно.

Answer 2 · 2012-10-08 23:41:13

doxtarzlo @doxtarzlo

Попробуйте определить частоту основного тона и повысить ее до нужной.

Ответ написан более трёх лет назад

Комментировать

Answer 3 · 2012-10-08 23:11:06

Dormidont @Dormidont

en.wikipedia.org/wiki/Pitch_shift

Ответ написан более трёх лет назад

Комментировать

Answer 4 · 2018-02-28 13:16:32

4ainik @4ainik

начинал с бейсика на 286 в 1994

А как из этого

data[i — off] = data[i]

сделать обратное преобразование Фурье?

Ответ написан более трёх лет назад

Комментировать

Как повысить тон голоса без увеличения скорости (например, как в приложении Talking Tom Cat)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт