Что можете посоветовать для клонирования голоса на русском языке?

Question

kletochka @kletochka

Что можете посоветовать для клонирования голоса на русском языке?

Добрый день!

Ищу инструмент для клонирования голоса.

Есть довольно много аудио файлов в так-себе качестве (голосовые сообщения) с речью на русском языке.
Хочется научиться в text-to-speach именно этим голосом и именно на русском языке.
Возможно ли это? Какое качество можно ожидать?

Я натыкался на одно решение (вроде это https://github.com/sovaai/sova-tts). Там есть возможность подать на вход короткое аудио и текст и оно должно озвучить этот текст голосом из аудио файла. Но в моем случае оно работало очень плохо. В большинстве случаев невозможно было распознать речь вообще. Что говорить о похожести голоса и т.д.

В качестве решения хотелось бы видеть синтезатор речи (будь то ML или что-то еще), который изначально хорошо генерит речь на русском языке. Но которому так же можно "скормить" дополнительные аудио с голосом, чтобы "подтюнить" / "дообучить" его на конкретный голос и т.д.

Существуют ли решения без TTS, а изменение звучания 1 аудиозаписи в сторону похожести на голос другого человека?

Буду рад любым ссылкам по теме!

Вопрос задан более двух лет назад
2233 просмотра

Комментировать

Подписаться 2 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Специалист по Data Science плюс

17 месяцев

Далее
Skillbox

Нейросети: практический курс

3 месяца

Далее
Нетология

Бизнес-аналитик

7 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Системное администрирование

+2 ещё

Средний
Сервер с GPU предназначен ли для запуска фронтенда/бэкенда или он для вычислений?
- 1 подписчик
- 08 нояб.
- 279 просмотров
1

ответ
Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- 26 окт.
- 127 просмотров
1

ответ
Нейронные сети

Простой
Как надиктовывать текст голосом в Cursor?
- 1 подписчик
- 24 окт.
- 102 просмотра
1

ответ
Нейронные сети

Средний
Имеют ли нейросети или надстройки над ними возможность анализа «полноты» вопроса?
- 1 подписчик
- 23 окт.
- 90 просмотров
2

ответа
Нейронные сети

Сложный
Как организовать разбивку по таймкодам текста из 30000 слов?
- 1 подписчик
- 18 окт.
- 74 просмотра
0

ответов
JavaScript

+1 ещё

Простой
Есть ли js-библиотека для офлайн-распознавания русской речи?
- 1 подписчик
- 12 окт.
- 199 просмотров
2

ответа
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент.
- 98 просмотров
1

ответ
Нейронные сети

Средний
Каков объём данных, передаваемых между узлами ComfyUI и где они хранятся (RAM/VRAM/...)?
- 1 подписчик
- 28 сент.
- 84 просмотра
1

ответ
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 6 подписчиков
- 22 сент.
- 1428 просмотров
5

ответов
Нейронные сети

Простой
Отечественные нейронки для кодинга и не только сентябрь 2025?
- 1 подписчик
- 22 сент.
- 262 просмотра
4

ответа
Показать ещё Загружается…

SRE/DevOps инженер

Сбер • Москва

от 200 000 до 300 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

Менеджер по качеству (эквайринг, терминалы, ККТ, банкоматы, АДМ)

ИТ-Холдинг Т1 • Санкт-Петербург

До 130 000 ₽

Answer 1 · 2023-03-28 23:29:43

https://github.com/vlomme/Multi-Tacotron-Voice-Cloning
Но с установкой есть определённые нюансы, да и автор проекта похоже прекратил поддержку, потому всё выглядит слегка сыроватым :) Но лучше я пока не нашел нечего для Русского языка, сам проект основан на "Real-Time-Voice-Cloning-master"

Что можете посоветовать для клонирования голоса на русском языке?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт