Лучше сразу делать качественно с нейронными сетями.
Изучайте Python и НС.
Применяйте нужные библиотеки и пишите код.
Пакет от NVIDIA:
OpenSeq2Seqmachine translation (GNMT, Transformer, ConvS2S, …)
speech recognition (DeepSpeech2, Wave2Letter, Jasper, …)
speech commands (RN-50, Jasper)
speech synthesis (Tacotron2, WaveNet…)
language model (LSTM, …)
sentiment analysis (SST, IMDB, …)
image classification (ResNet-50)
Озвучка (TTS) :
Tacotron 2
Лекции:
Лекции 1Лекции 2
PS:
Синтез и перевод - разные вещи.
Синтез - это текст в звук.
А перевод - это с одного разговорного языка на другой.