Quarc
@Quarc
Delphi, Python, C++\Qt

Есть ли библиотеки распознавания речи нескольких голосов?

Доброго дня!

Начну с примерной постановки задачи: распознавание речи множества голосов (до полутора десятка голосов за сессию, большинство которых не звучали в предыдущих сессиях, и скорее всего не прозвучат в следующих), говорить будут поочередно, одновременная речь будет редко и ею можно пренебречь. Говорить будут на русском языке (60-90%% времени), распознавание иноязычной речи необязательно.
Сессия длится до 4-х часов, строго в помещении, количество микрофонов на которые ведется запись от одного до 5-6. Некоторые голоса могут быть тихими, особенно в удалении от микрофонов, и наоборот рядом с микрофонами могут находиться голосистые товарищи. Посторонние шумы: городской шум, шумы в помещении (кашель, звонки и т.д.).
Доступа к Интернету нет и не будет, программа будет работать на десктопе (в основном Windows 7).
Преобразование в текст необязательно прямо с микрофонов, после завершения сессии будут доступны записи (по кол-ву микрофонов). Время обработки записи некритично, но по возможности не дольше чем длительность самой записи.

Пока остановил свой выбор на PocketSphinx, но может быть есть варианты менее трудоемкие и более подходящие к задаче?
  • Вопрос задан
  • 774 просмотра
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы