Как реализовать синтез речи?

Question

dBegginer @dBegginer

Как реализовать синтез речи?

Хотелось летом заняться интересным проектом и остановился на синтезе речи. На выходе надеюсь получить что-то на уровне google-translate bot. Сначала без нейронных сетей, а потом уже с использованием глубокого обучения. Что можете посоветовать?

Вопрос задан более трёх лет назад
1392 просмотра

1 комментарий

Подписаться 5 Средний 1 комментарий

Решения вопроса 1

11 комментариев

Пригласить эксперта

Ответы на вопрос 2

6 комментариев

xmoonlight @xmoonlight

Я вот что думаю:
А ему точно нужен готовый код? Он вроде сам хотел разобраться.... (как я понял)

Написано более трёх лет назад
Люда MARMALADKA @tiwi

xmoonlight, лучший способ узнать как чтото писать, это смотреть как другие это пишут, более того, там он может найти связь с людьми которые это делают, и они могут помочь ему обучиться, если захотят, гитхаб это же не тостер, где тебя вечно посылают в гугл инфопомои глотать, ещё читать книги или мануалы написанные какимито ботаниками на понятном только им языке

Написано более трёх лет назад
xmoonlight @xmoonlight

Люда MARMALADKA, Вот кто так учится без понимания теории на исходниках - тот так и кодит потом...
Не нужно советовать плохого!

Написано более трёх лет назад
xmoonlight @xmoonlight

Люда MARMALADKA,
и самому врядли удастся добиться похожего результата в синтезе речи
По вашему совету - однозначно! ;)

Написано более трёх лет назад
Люда MARMALADKA @tiwi

xmoonlight,
По вашему совету - однозначно! ;)

Да, и не двузначно.

Написано более трёх лет назад
Люда MARMALADKA @tiwi

hint000, там ему быстро объяснят что к чему

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

+2 ещё

Простой
Можно ли закешировать результат загрузки gguf модели в Forge?
- 1 подписчик
- 16 часов назад
- 17 просмотров
1

ответ
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 43 просмотра
0

ответов
Нейронные сети

Простой
Как подключить Context7 к claude.ai?
- 1 подписчик
- 23 июл.
- 42 просмотра
0

ответов
Нейронные сети

+2 ещё

Средний
Как правильно подобрать модель, VAE и T5 чтобы запустить Flux1 gguf версию?
- 1 подписчик
- 16 июл.
- 44 просмотра
2

ответа
Python

+2 ещё

Простой
Как сделать символьные вычислениями в питоне для поиска стационарных точек системы диффуров?
- 1 подписчик
- 16 июл.
- 229 просмотров
0

ответов
Нейронные сети

+2 ещё

Простой
Что мешает создать сугубо инженерную генеративную нейросеть?
- 1 подписчик
- 14 июл.
- 180 просмотров
3

ответа
Нейронные сети

+2 ещё

Простой
Требуется ли junior deep learning инженеру знание математики?
- 1 подписчик
- 13 июл.
- 96 просмотров
1

ответ
Машинное обучение

+1 ещё

Простой
Reverse engineering black box ML-модели?
- 1 подписчик
- 10 июл.
- 134 просмотра
3

ответа
Нейронные сети

Простой
Flowise, как подключить эмбендингс?
- 1 подписчик
- 05 июл.
- 58 просмотров
1

ответ
Нейронные сети

Простой
Flowise error 500?
- 1 подписчик
- 04 июл.
- 68 просмотров
0

ответов
Показать ещё Загружается…

Software Engineer (Humanoid Robots)

Яндекс • Москва

Аналитик-разработчик в команду релевантности ответов Алисы

Яндекс • Москва

Программист С++

KeenTools • Ереван

Answer 1 · 2019-07-27 03:29:59

Лучше сразу делать качественно с нейронными сетями.
Изучайте Python и НС.
Применяйте нужные библиотеки и пишите код.

Пакет от NVIDIA: OpenSeq2Seq

machine translation (GNMT, Transformer, ConvS2S, …)
speech recognition (DeepSpeech2, Wave2Letter, Jasper, …)
speech commands (RN-50, Jasper)
speech synthesis (Tacotron2, WaveNet…)
language model (LSTM, …)
sentiment analysis (SST, IMDB, …)
image classification (ResNet-50)

Озвучка (TTS) : Tacotron 2

Лекции:
Лекции 1
Лекции 2

PS:
Синтез и перевод - разные вещи.
Синтез - это текст в звук.
А перевод - это с одного разговорного языка на другой.

Answer 2 · 2019-07-27 04:43:48

Люда MARMALADKA @tiwi

Почитайте исходный код файлов тут: https://github.com/Olga-Yakovleva/RHVoice

Ответ написан более трёх лет назад

6 комментариев

Answer 3 · 2019-07-27 09:34:13

Сначала изучить теорию, затем посмотреть методы реализации, далее написать алгоритм.

Например, вы можете воспроизводить отдельные буквы, или фонемы, или слова, или словосочетания. Вы можете записать это все заранее или с генерировать робовойс как в телефоне. И ещё много чего.

Сейчас вы делаете как: "дайте мне ссылку на api гугла, я буду текст воспроизводить."

Как реализовать синтез речи?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт