Задать вопрос
@tatarrr95

Как распознать речь резделяя голоса в одноканальном аудио?

Такая задача, есть одноканальные wav дорожки записи разговора двух людей. Надо перевести речь в текст, но разделяя владельцев голоса. Сейчас использую яндекс speechkit, но он все голоса переводит в текст сплошняком. Как разделить текст по владельцам . автоматизировано? Не важно . на каком языке программирования.
  • Вопрос задан
  • 258 просмотров
Подписаться 1 Сложный 1 комментарий
Помогут разобраться в теме Все курсы
  • Нетология
    Data Scientist: расширенный курс
    13 месяцев
    Далее
  • GB (GeekBrains)
    Специалист по внедрению ИИ
    6 месяцев
    Далее
Решения вопроса 1
@tatarrr95 Автор вопроса
Google speech смог, называется это diarization, прилагаю ссылку на пример, авось кому поможет.
https://cloud.google.com/speech-to-text/docs/multi...
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы