Как реализовать видеосвязь через браузер с распознаванием речи одного из собеседника?

Question

Самир Курбанов @kurbanov_samir

Как реализовать видеосвязь через браузер с распознаванием речи одного из собеседника?

Здравствуйте аудитория Тостера! Укажите пожалуйста путь, дайте напутствие, рекомендации, советы по реализации видео-связи через браузер между двумя пользователями и параллельному распознаванию речи одного из собеседника (и преобразование его в текст (Google Speech API или Yandex SpeechKit)) ? короче если: мне нужна видеосвязь с субтитрами)
В процессе раскопок в инете нашел следующее:

библиотеки sip.js, jsSIP, PeerJS
сплетни о необходимости использования Stun/Turn серверов

в общем документации о реализации видеосвязи полно.
Мне же нужна помощь в выборе технологии, библиотеки, концепции создания видеосвязи в браузере с одновременным распознаванием речи.
Как возможно отделить аудио от видео, чтобы его потом по API передавать в сервис распознавания

Вопрос задан более трёх лет назад
146 просмотров

2 комментария

Подписаться 2 Средний 2 комментария

Помогут разобраться в теме Все курсы

Нетология

Режиссёр монтажа

8 месяцев

Далее
Яндекс Практикум

Режиссёр монтажа

9 месяцев

Далее
GB (GeekBrains)

Профессия Режиссёр монтажа

9 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Компьютерные сети

+1 ещё

Простой
Возможно ли пофиксить уязвимость проброса трафика в WebRTC?
- 6 подписчиков
- 29 апр.
- 716 просмотров
2

ответа
Видеотрансляция

Простой
Какой принцип работы старого WebSocket и нового WebSocket в OBS?
- 1 подписчик
- 18 апр.
- 110 просмотров
2

ответа
Видеотрансляция

+1 ещё

Простой
Как зайти со смартфона на ip моей видео конференций?
- 1 подписчик
- 05 апр.
- 206 просмотров
1

ответ
Видеотрансляция

+1 ещё

Средний
Как подключить к одному ПК много телевизоров?
- 1 подписчик
- 13 февр.
- 408 просмотров
4

ответа
Системное администрирование

+2 ещё

Простой
Возможна ли такая постоянная трансляция экрана сотрудников на работе?
- 3 подписчика
- 06 февр.
- 1183 просмотра
11

ответов
Linux

+1 ещё

Простой
Диктовалки (speech to text) под Линукс?
- 2 подписчика
- 23 янв.
- 358 просмотров
2

ответа
Видеотрансляция

Средний
Экшн-камера SJCAM SJ10 Pro Dual Screen как Веб-камера?
- 2 подписчика
- 19 дек. 2025
- 158 просмотров
2

ответа
Linux

+2 ещё

Простой
В shinobi отображаются видео только за 24 часа, как увидеть все?
- 3 подписчика
- 27 нояб. 2025
- 327 просмотров
0

ответов
JavaScript

+1 ещё

Простой
Есть ли js-библиотека для офлайн-распознавания русской речи?
- 1 подписчик
- 12 окт. 2025
- 216 просмотров
1

ответ
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент. 2025
- 122 просмотра
1

ответ
Показать ещё Загружается…

параллельному распознаванию речи одного из собеседника
Нужно распознать речь человека сидящего в собеседнике?
АртемЪ, Нужно распознать речь одного из говорящего по видеосвязи.

Answer 1 · 2018-11-20 17:33:28

У Microsoft были библиотеки DirectShow и Media Foundation по работе с аудио и видео (интерфейсы реализуют граф), но я не припомню сетевого входа и документации последних лет.
Вот книги:
1) Mark D. Pesce. Programming MS DirectShow for digital video and television
2) Turcan, Wasson. Fundamentals of Audio and Video Programming for Games
3) Anton Poligner. Developing MS Media Foundation Applications

Как реализовать видеосвязь через браузер с распознаванием речи одного из собеседника?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт