Есть ли библиотеки распознавания речи нескольких голосов?

Question

Quarc @Quarc

Delphi, Python, C++\Qt

Есть ли библиотеки распознавания речи нескольких голосов?

Доброго дня!

Начну с примерной постановки задачи: распознавание речи множества голосов (до полутора десятка голосов за сессию, большинство которых не звучали в предыдущих сессиях, и скорее всего не прозвучат в следующих), говорить будут поочередно, одновременная речь будет редко и ею можно пренебречь. Говорить будут на русском языке (60-90%% времени), распознавание иноязычной речи необязательно.
Сессия длится до 4-х часов, строго в помещении, количество микрофонов на которые ведется запись от одного до 5-6. Некоторые голоса могут быть тихими, особенно в удалении от микрофонов, и наоборот рядом с микрофонами могут находиться голосистые товарищи. Посторонние шумы: городской шум, шумы в помещении (кашель, звонки и т.д.).
Доступа к Интернету нет и не будет, программа будет работать на десктопе (в основном Windows 7).
Преобразование в текст необязательно прямо с микрофонов, после завершения сессии будут доступны записи (по кол-ву микрофонов). Время обработки записи некритично, но по возможности не дольше чем длительность самой записи.

Пока остановил свой выбор на PocketSphinx, но может быть есть варианты менее трудоемкие и более подходящие к задаче?

Вопрос задан более трёх лет назад
778 просмотров

Комментировать

Подписаться 6 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Разработчик на C++

12 месяцев

Далее
Академия Эдюсон

Разработчик игр на Unreal Engine + ИИ

9 месяцев

Далее
Stepik

Профессия: Разработчик C++ (Junior)

2 месяца

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C++

Простой
Как сделать скриншот второго монитора на С++?
- 1 подписчик
- вчера
- 82 просмотра
4

ответа
C++

Простой
Возможно ли сделать скрин действующего окна через Alt + PrtSc на С++?
- 1 подписчик
- 08 июл.
- 128 просмотров
2

ответа
C++

Простой
Как можно через ООП сериализировать в разные форматы в едином стиле?
- 1 подписчик
- 07 июл.
- 72 просмотра
2

ответа
C++

+1 ещё

Простой
Почему компилятор подчёркивает импортируемый класс как ошибку «индификатор не определён»?
- 1 подписчик
- 04 июл.
- 107 просмотров
1

ответ
C++

Сложный
Концепт проверки совместимости с шаблонным конструктором?
- 1 подписчик
- 25 июн.
- 96 просмотров
1

ответ
C++

Простой
Я единственный у кого cppreference.com через раз падает с ERR_TIMED_OUT?
- 1 подписчик
- 21 июн.
- 181 просмотр
2

ответа
C++

+1 ещё

Простой
Как правильно посчитать UV координаты из локальных нормальных?
- 1 подписчик
- 20 июн.
- 109 просмотров
1

ответ
C++

+3 ещё

Простой
Почему бинарник скомпилированный через CMake весит больше, чем напрямую скомпилированный через clang++?
- 1 подписчик
- 11 июн.
- 331 просмотр
1

ответ
C++

+2 ещё

Простой
Как настроить clangd на видимость всех файлов, чтобы не указывать относительные пути в include?
- 1 подписчик
- 10 июн.
- 105 просмотров
1

ответ
Программирование

+4 ещё

Простой
Выбор между изучением c++ и Golang, что изучать?
- 3 подписчика
- 09 июн.
- 1376 просмотров
10

ответов
Показать ещё Загружается…

Есть ли библиотеки распознавания речи нескольких голосов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт