Здравствуйте. Интересует тема синтеза речи из текста с использованием нейронных сетей. Озвучиваемый язык - узбекский - его синтезом никто не занимался. Вот уже пару-тройку дней читаю статьи на тему TTS, курю доки))
Наткнулся на этот
ресурс. Думаю проделать, что там написано, но чую, что очень всё поверхностно. Есть ли кто вплотную занимается text-to-speech? Правильно ли я выбрал инструмент Torch для машинного обучения? Посоветуйте статейки для базового синтеза речи "нового" языка.