UniMRCP + Yandex SR. Это платно?

Question

DromHour @DromHour

UniMRCP + Yandex SR. Это платно?

Нужно организовать потоковое распознавание при звонке через FreeSwitch, распознавание от Яндекса. В официальной документации, Яндекс просто предлагает покупать плагин UniSpeech по 30$ за канал. В течение года, планируется более 5000 каналов, что означает, что за год потребуется заплатить минимум 150000$ (без учёта самого распознавания).
В то же время, UniMRCP - opensource проект, но плагины для них платные. Теперь появляется вопрос, а этот плагин, он платный или как?
Если платный, то есть ли нормальный способ организовать потоковое распознавание FreeSwitch - Yandex Speech Kit?

Вопрос задан более трёх лет назад
399 просмотров

Комментировать

Подписаться 2 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Data Scientist: расширенный курс

20 месяцев

Далее
GB (GeekBrains)

Специалист по внедрению ИИ

6 месяцев

Далее
Skillbox

Нейросети с нуля: ваш ИИ-ассистент для жизни и работы

2 месяца

Далее

Пригласить эксперта

Ответы на вопрос 2

7 комментариев

DromHour @DromHour Автор вопроса

Безусловно, я в курсе оплаты для Яндекса. Сейчас у нас стоит Asterisk, и YSR настраивался готовым бесплатным плагином. Но FreeSwitch не настолько популярен, чтобы взять и найти "готовый гайд для всего, что вам нужно". Поэтому собираю информацию по крупицам.

На странице с плагином YSR

В "подвале" сайта находим ссылку на unispeech.io, где есть страница с YSR, по калькулятору, для продакшена с бесконечной лицензией, нужно 30$ за канал.

Написано более трёх лет назад
DromHour @DromHour Автор вопроса

Вы отредактировали ответ, внесу немного ясности - распознавание используется для ivr-меню, что подразумевает обязательное потоковое распознавание, ведь ответ робота зависит от слов пользователя, а каждый раз записывать фразу и распознавать - прошлый век. Мы максимум слушаем пользователя 30 секунд, но он может сказать конкретное стоп-слово, которое нужно нормально распознать.

Написано более трёх лет назад
Василий Банников @vabka

DromHour, ок, тогда действительно только потоковое распознавание.

Написано более трёх лет назад
Василий Банников @vabka

DromHour, а что прямо сразу 5000 каналов/одновременных звонков будет?
Кажется, что на таких масштабах уже не такие уж и большие это деньги

Написано более трёх лет назад
DromHour @DromHour Автор вопроса

Василий Банников, АТС есть АТС. Сейчас у нас примерно 3000 линий в общей сумме, планируется расширение и достаточно большое. 18кк рублей (по текущему курсу) для российской компании просто за право использования - достаточно большие деньги, учитывая, что оплату распознавания никто не отменял. Долго рассказывать не буду, но годовой доход компании за последний год составил чуть выше 20кк рублей, что уж говорить о прибыли.
Если уж единственный готовый вариант - покупать плагин, то проще и дешевле нанять специалистов дополнительно и заплатить им - в общей сумме выйдет в десятки раз дешевле, а решение будет более гибким

Написано более трёх лет назад
Василий Банников @vabka

DromHour, тоже так думаю. Задача вроде не дико сложная - максимум может на серваки придётся раскошелиться.

Написано более трёх лет назад
DromHour @DromHour Автор вопроса

Василий Банников, прикол плагина именно в том, что покупатель в буквальном смысле платит за воздух. Это слишком высокая цена просто за право использования. Сервера остаются на нём, плюс нужен будет license сервер, который будет распределять выделенные каналы на кластер серверов uniMRCP (если их много).

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

+1 ещё

Простой
Диктовалки (speech to text) под Линукс?
- 2 подписчика
- 23 янв.
- 356 просмотров
2

ответа
JavaScript

+1 ещё

Простой
Есть ли js-библиотека для офлайн-распознавания русской речи?
- 1 подписчик
- 12 окт. 2025
- 215 просмотров
1

ответ
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент. 2025
- 120 просмотров
1

ответ
Машинный перевод с одного языка на другой

+1 ещё

Простой
Надёжный распознаватель речи в текст на разных языках?
- 2 подписчика
- 06 мая 2025
- 1200 просмотров
2

ответа
Системное администрирование

+4 ещё

Средний
Настройка Coturn и Freeswitch за отдельным Nginx reverse proxy?
- 3 подписчика
- более года назад
- 1961 просмотр
0

ответов
Windows

+1 ещё

Простой
Как на компе с виндой набивать голосом текст на русском языке, с качеством не хуже чем у клавиатуры gboard для Android?
- 1 подписчик
- более года назад
- 247 просмотров
2

ответа
Windows

+1 ещё

Простой
Насколько хороша Cortana встроенная в Win11 для распознавания русской речи?
- 1 подписчик
- более года назад
- 207 просмотров
1

ответ
C++

+2 ещё

Простой
Как обучить акустическую модель?
- 2 подписчика
- более года назад
- 160 просмотров
0

ответов
Нейронные сети

+1 ещё

Сложный
Какой использовать стек для создания полностью локального STT-LLM-TTS русско-английского голосового ассистента?
- 3 подписчика
- более года назад
- 1808 просмотров
2

ответа
Нейронные сети

+1 ещё

Простой
Как сделать голосовой командный интерфейс?
- 1 подписчик
- более года назад
- 69 просмотров
0

ответов
Показать ещё Загружается…

Разработчик WebRTC-сервисов на Go в видеоплатформу

Яндекс • Москва

от 300 000 до 490 000 ₽

Руководитель IT / Head of IT

Сигма • Волгоград

от 160 000 до 200 000 ₽

Менеджер по качеству (эквайринг, терминалы, ККТ, банкоматы, АДМ)

ИТ-Холдинг Т1 • Санкт-Петербург

До 130 000 ₽

Answer 1 · 2022-03-11 12:17:35

Не знаю, что за UniSpeech (загуглил, но не нашёл ни слова об ограничениях в виде 30$ на канал), но Yandex SpeechKit платный. Судя по тому что прочитал в руководстве - за яндекс нужно будет платить отдельно.
Минимальная цена - четверть копейки за секунду:
https://cloud.yandex.ru/docs/speechkit/pricing#pri...
Потоковое - дороже (15 копеек в секунду)

Если нет требования в виде распознавания в реальном времени (тем более что яндекс позволяет в реальном времени не больше 4х минут распознавать)
И нет требования в обязательном использовании этого Unispeech / UniMRCP, то можно поступить примерно так:
1. Сохраняем запись звонка как обычно
2. Асинхронно закидываем её в яндекс
3. Асинхронно получаем результат после распознавания и прикрепляем его к записи.

Answer 2 · 2022-12-06 20:44:16

И за яндекс и за unimrcp придётся платить. Причём за яндекс даже больше.

Можете бесплатный Воск попробовать:

https://github.com/alphacep/vosk-api

и https://github.com/alphacep/freeswitch/tree/master...

либо через Vosk Unimrcp https://github.com/alphacep/unimrcp-vosk-plugin

UniMRCP + Yandex SR. Это платно?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт