Есть ли библиотеки распознавания речи нескольких голосов?
Доброго дня!
Начну с примерной постановки задачи: распознавание речи множества голосов (до полутора десятка голосов за сессию, большинство которых не звучали в предыдущих сессиях, и скорее всего не прозвучат в следующих), говорить будут поочередно, одновременная речь будет редко и ею можно пренебречь. Говорить будут на русском языке (60-90%% времени), распознавание иноязычной речи необязательно.
Сессия длится до 4-х часов, строго в помещении, количество микрофонов на которые ведется запись от одного до 5-6. Некоторые голоса могут быть тихими, особенно в удалении от микрофонов, и наоборот рядом с микрофонами могут находиться голосистые товарищи. Посторонние шумы: городской шум, шумы в помещении (кашель, звонки и т.д.).
Доступа к Интернету нет и не будет, программа будет работать на десктопе (в основном Windows 7).
Преобразование в текст необязательно прямо с микрофонов, после завершения сессии будут доступны записи (по кол-ву микрофонов). Время обработки записи некритично, но по возможности не дольше чем длительность самой записи.
Пока остановил свой выбор на PocketSphinx, но может быть есть варианты менее трудоемкие и более подходящие к задаче?