upd.
https://github.com/myshell-ai/OpenVoice
https://github.com/jasonppy/VoiceCraft
но ты не очень контролируешь эмоции, полагаю тут это тюнингом нужно делать
---------------
Эмоциональной речью хвастались openai, но чужие голоса тюнить не дают, мало того они отключили один из своих, только за подозрения в похожести голоса на чей то популярный.
Сам не пользовался, но по отзывам говорят звучит шикарно,.. русский само собой с акцентом.
Серая юридическая зона! очень страшно влить миллионы в тюнинг модели и получить судебный запрет из-за копирастии всех своих продуктов... это не то что хочется получить, если у тебя на кону сотни миллиардов.
p.s. еще этим занимались
alibaba qwen, у них точно были gpt модели, где голос был на входе и на выходе, но там английский и китайский, я тоже не смотрел
Ну и facebook чем то таким занимается, полистай их публичный архив, там есть audio-audio трансформер, но там явно без каких то значимых результатов, что бы сравнивать с топами, но все открыто
тупо первое
попавшееся, кажется это переводчик голос-голос