Похоже речь идет о преобразовании text-to-speech. Я-бы разделил на 2 части.
1) Преобразование текста в wave-form (почти все синтезаторы работают с волновой формой как с форматом выхода звука) $ espeak -f file.txt -w output.wav
2) Сконвертить waveform в mp3. $ lame output.wav ....
Средствами Python наверное можно сделать тоже самое если поискать native библиотеки для этого.