Задать вопрос
@DromHour

UniMRCP + Yandex SR. Это платно?

Нужно организовать потоковое распознавание при звонке через FreeSwitch, распознавание от Яндекса. В официальной документации, Яндекс просто предлагает покупать плагин UniSpeech по 30$ за канал. В течение года, планируется более 5000 каналов, что означает, что за год потребуется заплатить минимум 150000$ (без учёта самого распознавания).
В то же время, UniMRCP - opensource проект, но плагины для них платные. Теперь появляется вопрос, а этот плагин, он платный или как?
Если платный, то есть ли нормальный способ организовать потоковое распознавание FreeSwitch - Yandex Speech Kit?
  • Вопрос задан
  • 326 просмотров
Подписаться 2 Простой Комментировать
Пригласить эксперта
Ответы на вопрос 2
Не знаю, что за UniSpeech (загуглил, но не нашёл ни слова об ограничениях в виде 30$ на канал), но Yandex SpeechKit платный. Судя по тому что прочитал в руководстве - за яндекс нужно будет платить отдельно.
Минимальная цена - четверть копейки за секунду:
https://cloud.yandex.ru/docs/speechkit/pricing#pri...
Потоковое - дороже (15 копеек в секунду)

Если нет требования в виде распознавания в реальном времени (тем более что яндекс позволяет в реальном времени не больше 4х минут распознавать)
И нет требования в обязательном использовании этого Unispeech / UniMRCP, то можно поступить примерно так:
1. Сохраняем запись звонка как обычно
2. Асинхронно закидываем её в яндекс
3. Асинхронно получаем результат после распознавания и прикрепляем его к записи.
Ответ написан
@nshmyrev
И за яндекс и за unimrcp придётся платить. Причём за яндекс даже больше.

Можете бесплатный Воск попробовать:

https://github.com/alphacep/vosk-api

и https://github.com/alphacep/freeswitch/tree/master...

либо через Vosk Unimrcp https://github.com/alphacep/unimrcp-vosk-plugin
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы