Ну никто не мешает сделать записи отдельных слов и воспроизводить их.
Разбиваешь текст на слова, находишь соответсвующие файлы этим словам, добавляешь паузы если их нет и воспроизводишь полученный список через pygame или коммандную строку.
Если слова нет - можно по слогам произнести