Задать вопрос

tatarrr95 @tatarrr95

распознавание-речи

Распознавание речи

Как распознать речь резделяя голоса в одноканальном аудио?

Такая задача, есть одноканальные wav дорожки записи разговора двух людей. Надо перевести речь в текст, но разделяя владельцев голоса. Сейчас использую яндекс speechkit, но он все голоса переводит в текст сплошняком. Как разделить текст по владельцам . автоматизировано? Не важно . на каком языке программирования.

Вопрос задан более трёх лет назад
263 просмотра

1 комментарий

Подписаться 1 Сложный 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Data Scientist: расширенный курс

13 месяцев

Далее
GB (GeekBrains)

Специалист по внедрению ИИ

6 месяцев

Далее

Решения вопроса 1

tatarrr95 @tatarrr95 Автор вопроса

Google speech смог, называется это diarization, прилагаю ссылку на пример, авось кому поможет.
https://cloud.google.com/speech-to-text/docs/multi...

Ответ написан более трёх лет назад

Комментировать

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

JavaScript

+1 ещё

Простой
Есть ли js-библиотека для офлайн-распознавания русской речи?
- 1 подписчик
- 12 окт.
- 202 просмотра
2

ответа
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент.
- 104 просмотра
1

ответ
Машинный перевод с одного языка на другой

+1 ещё

Простой
Надёжный распознаватель речи в текст на разных языках?
- 2 подписчика
- 06 мая
- 1187 просмотров
2

ответа
Windows

+1 ещё

Простой
Как на компе с виндой набивать голосом текст на русском языке, с качеством не хуже чем у клавиатуры gboard для Android?
- 1 подписчик
- 03 мар.
- 241 просмотр
2

ответа
Windows

+1 ещё

Простой
Насколько хороша Cortana встроенная в Win11 для распознавания русской речи?
- 1 подписчик
- 12 февр.
- 191 просмотр
1

ответ
C++

+2 ещё

Простой
Как обучить акустическую модель?
- 2 подписчика
- более года назад
- 158 просмотров
0

ответов
Нейронные сети

+1 ещё

Сложный
Какой использовать стек для создания полностью локального STT-LLM-TTS русско-английского голосового ассистента?
- 3 подписчика
- более года назад
- 1442 просмотра
2

ответа
Нейронные сети

+1 ещё

Простой
Как сделать голосовой командный интерфейс?
- 1 подписчик
- более года назад
- 69 просмотров
0

ответов
Node.js

+1 ещё

Простой
Как перевести аудио в текст в Яндекс SpeechKit v3?
- 2 подписчика
- более года назад
- 352 просмотра
1

ответ
Python

+1 ещё

Простой
Ошибка UNAUTHORIZED при работе с Yandex SpeechKit API: Как правильно передать API-ключ?
- 1 подписчик
- более года назад
- 405 просмотров
1

ответ
Показать ещё Загружается…

SRE/DevOps инженер

Сбер • Москва

от 200 000 до 300 000 ₽

Database Administrator / DBA

Playerok

от 300 000 ₽

Backend Developer

Playerok

от 400 000 ₽