rubberband
есть консольная утилита, есть либа
А вообще, для голоса — теория такая: там есть тон, а есть форманты. При смещении тона форманты смещаться не должны. Они отрезаются формантным фильтром, остаток смещается, потом старые (несмещённые) форманты накладываются. Если хотите поменять «пол» голоса, то форманты тоже придётся преобразовать — у мужчин и женщин они чуть разные.
По-моему, в rubberband это встроено. Если нет, могу назвать gvst, в котором есть gsnap, который умеет правильно.