Как распознать речь резделяя голоса в одноканальном аудио?
Такая задача, есть одноканальные wav дорожки записи разговора двух людей. Надо перевести речь в текст, но разделяя владельцев голоса. Сейчас использую яндекс speechkit, но он все голоса переводит в текст сплошняком. Как разделить текст по владельцам . автоматизировано? Не важно . на каком языке программирования.