Не знаю, что за UniSpeech (загуглил, но не нашёл ни слова об ограничениях в виде 30$ на канал), но Yandex SpeechKit платный. Судя по тому что прочитал в руководстве - за яндекс нужно будет платить отдельно.
Минимальная цена - четверть копейки за секунду:
https://cloud.yandex.ru/docs/speechkit/pricing#pri...
Потоковое - дороже (15 копеек в секунду)
Если нет требования в виде распознавания в реальном времени (тем более что яндекс позволяет в реальном времени не больше 4х минут распознавать)
И нет требования в обязательном использовании этого Unispeech / UniMRCP, то можно поступить примерно так:
1. Сохраняем запись звонка как обычно
2. Асинхронно закидываем её в яндекс
3. Асинхронно получаем результат после распознавания и прикрепляем его к записи.