UniMRCP + Yandex SR. Это платно?

Question

DromHour @DromHour

UniMRCP + Yandex SR. Это платно?

Нужно организовать потоковое распознавание при звонке через FreeSwitch, распознавание от Яндекса. В официальной документации, Яндекс просто предлагает покупать плагин UniSpeech по 30$ за канал. В течение года, планируется более 5000 каналов, что означает, что за год потребуется заплатить минимум 150000$ (без учёта самого распознавания).
В то же время, UniMRCP - opensource проект, но плагины для них платные. Теперь появляется вопрос, а этот плагин, он платный или как?
Если платный, то есть ли нормальный способ организовать потоковое распознавание FreeSwitch - Yandex Speech Kit?

Вопрос задан более трёх лет назад
378 просмотров

Комментировать

Подписаться 2 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Data Scientist: расширенный курс

13 месяцев

Далее
GB (GeekBrains)

Специалист по внедрению ИИ

6 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

7 комментариев

DromHour @DromHour Автор вопроса

Безусловно, я в курсе оплаты для Яндекса. Сейчас у нас стоит Asterisk, и YSR настраивался готовым бесплатным плагином. Но FreeSwitch не настолько популярен, чтобы взять и найти "готовый гайд для всего, что вам нужно". Поэтому собираю информацию по крупицам.

На странице с плагином YSR

В "подвале" сайта находим ссылку на unispeech.io, где есть страница с YSR, по калькулятору, для продакшена с бесконечной лицензией, нужно 30$ за канал.

Написано более трёх лет назад
DromHour @DromHour Автор вопроса

Вы отредактировали ответ, внесу немного ясности - распознавание используется для ivr-меню, что подразумевает обязательное потоковое распознавание, ведь ответ робота зависит от слов пользователя, а каждый раз записывать фразу и распознавать - прошлый век. Мы максимум слушаем пользователя 30 секунд, но он может сказать конкретное стоп-слово, которое нужно нормально распознать.

Написано более трёх лет назад
Василий Банников @vabka

DromHour, ок, тогда действительно только потоковое распознавание.

Написано более трёх лет назад
Василий Банников @vabka

DromHour, а что прямо сразу 5000 каналов/одновременных звонков будет?
Кажется, что на таких масштабах уже не такие уж и большие это деньги

Написано более трёх лет назад
DromHour @DromHour Автор вопроса

Василий Банников, АТС есть АТС. Сейчас у нас примерно 3000 линий в общей сумме, планируется расширение и достаточно большое. 18кк рублей (по текущему курсу) для российской компании просто за право использования - достаточно большие деньги, учитывая, что оплату распознавания никто не отменял. Долго рассказывать не буду, но годовой доход компании за последний год составил чуть выше 20кк рублей, что уж говорить о прибыли.
Если уж единственный готовый вариант - покупать плагин, то проще и дешевле нанять специалистов дополнительно и заплатить им - в общей сумме выйдет в десятки раз дешевле, а решение будет более гибким

Написано более трёх лет назад
Василий Банников @vabka

DromHour, тоже так думаю. Задача вроде не дико сложная - максимум может на серваки придётся раскошелиться.

Написано более трёх лет назад
DromHour @DromHour Автор вопроса

Василий Банников, прикол плагина именно в том, что покупатель в буквальном смысле платит за воздух. Это слишком высокая цена просто за право использования. Сервера остаются на нём, плюс нужен будет license сервер, который будет распределять выделенные каналы на кластер серверов uniMRCP (если их много).

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

JavaScript

+1 ещё

Простой
Есть ли js-библиотека для офлайн-распознавания русской речи?
- 1 подписчик
- 12 окт.
- 174 просмотра
2

ответа
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент.
- 94 просмотра
1

ответ
Машинный перевод с одного языка на другой

+1 ещё

Простой
Надёжный распознаватель речи в текст на разных языках?
- 2 подписчика
- 06 мая
- 1177 просмотров
2

ответа
Системное администрирование

+4 ещё

Средний
Настройка Coturn и Freeswitch за отдельным Nginx reverse proxy?
- 3 подписчика
- 30 апр.
- 1909 просмотров
0

ответов
Windows

+1 ещё

Простой
Как на компе с виндой набивать голосом текст на русском языке, с качеством не хуже чем у клавиатуры gboard для Android?
- 1 подписчик
- 03 мар.
- 240 просмотров
2

ответа
Windows

+1 ещё

Простой
Насколько хороша Cortana встроенная в Win11 для распознавания русской речи?
- 1 подписчик
- 12 февр.
- 182 просмотра
1

ответ
C++

+2 ещё

Простой
Как обучить акустическую модель?
- 2 подписчика
- 18 дек. 2024
- 158 просмотров
0

ответов
Нейронные сети

+1 ещё

Сложный
Какой использовать стек для создания полностью локального STT-LLM-TTS русско-английского голосового ассистента?
- 2 подписчика
- 11 дек. 2024
- 1250 просмотров
2

ответа
Нейронные сети

+1 ещё

Простой
Как сделать голосовой командный интерфейс?
- 1 подписчик
- более года назад
- 66 просмотров
0

ответов
Node.js

+1 ещё

Простой
Как перевести аудио в текст в Яндекс SpeechKit v3?
- 2 подписчика
- более года назад
- 338 просмотров
1

ответ
Показать ещё Загружается…

Руководитель проектов по цифровому развитию клиентов в сфере недвижимости (CSM)

Сбер • Санкт-Петербург

от 200 000 ₽

Java Developer (Клик)

Сбер • Москва

от 400 000 ₽

Системный аналитик (Мои Сервисы)

Сбер • Москва

от 300 000 ₽

Answer 1 · 2022-03-11 12:17:35

Не знаю, что за UniSpeech (загуглил, но не нашёл ни слова об ограничениях в виде 30$ на канал), но Yandex SpeechKit платный. Судя по тому что прочитал в руководстве - за яндекс нужно будет платить отдельно.
Минимальная цена - четверть копейки за секунду:
https://cloud.yandex.ru/docs/speechkit/pricing#pri...
Потоковое - дороже (15 копеек в секунду)

Если нет требования в виде распознавания в реальном времени (тем более что яндекс позволяет в реальном времени не больше 4х минут распознавать)
И нет требования в обязательном использовании этого Unispeech / UniMRCP, то можно поступить примерно так:
1. Сохраняем запись звонка как обычно
2. Асинхронно закидываем её в яндекс
3. Асинхронно получаем результат после распознавания и прикрепляем его к записи.

Answer 2 · 2022-12-06 20:44:16

И за яндекс и за unimrcp придётся платить. Причём за яндекс даже больше.

Можете бесплатный Воск попробовать:

https://github.com/alphacep/vosk-api

и https://github.com/alphacep/freeswitch/tree/master...

либо через Vosk Unimrcp https://github.com/alphacep/unimrcp-vosk-plugin

UniMRCP + Yandex SR. Это платно?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт