@tatarrr95

Как распознать речь резделяя голоса в одноканальном аудио?

Такая задача, есть одноканальные wav дорожки записи разговора двух людей. Надо перевести речь в текст, но разделяя владельцев голоса. Сейчас использую яндекс speechkit, но он все голоса переводит в текст сплошняком. Как разделить текст по владельцам . автоматизировано? Не важно . на каком языке программирования.
  • Вопрос задан
  • 163 просмотра
Решения вопроса 1
@tatarrr95 Автор вопроса
Google speech смог, называется это diarization, прилагаю ссылку на пример, авось кому поможет.
https://cloud.google.com/speech-to-text/docs/multi...
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы