Как создать автоэнкодер аудио с голосами / систему deepfake на аудио данных?

Question

MaxBat @MaxBat

Как создать автоэнкодер аудио с голосами / систему deepfake на аудио данных?

Хочу создать модели автоэнкодеров такого типа.

Аудио человека 1 -------> encoder -------> latent space 1 -------> decoder 1 -------> Аудио человека 1
Aудио человека 2 -------> encoder -------> latentspace 2 -------> decoder 2 -------> Aудио человека 2

Мне потребуется впоследствии поменять декодеры местами, поэтому они должны быть как бы "мобильными", если так можно сказать.

Пока перерыл кучу информации и не понимаю даже за что браться. Подскажите, с чего начать, как и с помощью чего это можно реализовать и т.д.

Вопрос задан более трёх лет назад
178 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Режиссёр монтажа

8 месяцев

Далее
Яндекс Практикум

Режиссёр монтажа

9 месяцев

Далее
GB (GeekBrains)

Профессия Режиссёр монтажа

9 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

MacBook

+2 ещё

Простой
Mac для машинного обучения, стоит ли брать?
- 1 подписчик
- 9 минут назад
- 3 просмотра
0

ответов
Хранение данных

+3 ещё

Средний
Как организовать обучение нейронной сети?
- 1 подписчик
- 07 июл.
- 147 просмотров
2

ответа
Машинное обучение

+1 ещё

Средний
Как устроены Нейрохам и подобные ему боты с точки зрения ML?
- 1 подписчик
- 24 июн.
- 497 просмотров
2

ответа
Машинное обучение

+1 ещё

Простой
Какие темы в статистике нужно изучить прежде всего, чтобы начать решать простые задачи машинного обучения?
- 2 подписчика
- 25 мая
- 224 просмотра
2

ответа
IT-образование

+1 ещё

Простой
Важны ли алгоритмы и структуры данных для ML-инженера?
- 2 подписчика
- 25 мая
- 514 просмотров
2

ответа
Карьера в IT

+1 ещё

Простой
Стоит ли беспокоится, если иду в NLP, но я плох на числовых табличных данных?
- 1 подписчик
- 11 мая
- 468 просмотров
1

ответ
Python

+3 ещё

Средний
Как перенести позу SMPL модели на игровую 3д модель?
- 2 подписчика
- 10 мая
- 370 просмотров
1

ответ
Аудио

+1 ещё

Простой
Пищат сатиллиты от акустики A330U?
- 1 подписчик
- 26 февр.
- 176 просмотров
0

ответов
Аудио

+2 ещё

Простой
Почему могут возникать проблемы с записью звука?
- 1 подписчик
- 25 февр.
- 142 просмотра
1

ответ
Аудио

+1 ещё

Средний
Почему ухудшается звук собеседника при переключении на микрофон веб-камеры?
- 1 подписчик
- 11 февр.
- 157 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2021-08-10 21:19:57

В общем-то непонятна суть вопроса.
Тем более, что вы перерыли кучу информации и ничего не нашли(???)
Вы ищете информацию по автоенкодерам? По обработке звука? Или вообще - "с чего начать"?
Ну давайте начнем с автоенкодера. Хорошей литературы я не припомню, но вот статей на тему хватает:
https://towardsdatascience.com/autoencoders-overvi...
https://towardsdatascience.com/introduction-to-aut...
С использованием ТensorFlow:
https://www.machinelearningmastery.ru/implementing...
https://russianblogs.com/article/28481357544/
С использованием PyTourch
https://towardsdatascience.com/beginner-guide-to-v...
С примерами практической реализации:
https://towardsdatascience.com/autoencoders-introd...
Даже отдельные обсуждения на тему Как отдельно использовать кодер автоэнкодера в keras и Tensorflow есть:
https://coderoad.ru/39551478/Как-отдельно-использо...
https://coderoad.ru/51566573/Tensorflow-Keras-испо...
Так что неясно, чего именно вы не нашли.
В приведенных ссылках есть что изучать, особенно если вы даже "не понимаете за что браться". Вот, изучите. А потом попробуйте более конкретно сформулировать свой вопрос.

Как создать автоэнкодер аудио с голосами / систему deepfake на аудио данных?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт