Есть ли возможность конвертировать AudioStream в text?
Доброго времени суток.
Возник интересный вопрос. Есть webrtc, через него передается audio поток от другого пользователя (при этом звонок может быть сделан не только с пк, но и с телефона), соответственно на выходе имеем аудио поток. Вопрос: есть ли возможность в режиме потока распознавать голос и преобразовывать его в текст?
есть SpeechRecognition и в принципе проблемы не возникнет если делать преобразование на клиенте, но как поступить если есть audioStream? Кто сталкивался с таким и как решали? Гуглить видимо не умею, потому что натыкаюсь на один и тот же пример
Возникла идея писать audio поток с инетрвалом в 5 секунд. через сокет слать на сервер, на сервере с помощью google speech api делать распознование. и отправлять обратно ответ. как то так, какие подводные камни?