С помощью какой AI модели можно локально обработать аудио-файлы (русский голос)?

Question

Дмитрий Голов @Gold_68

С помощью какой AI модели можно локально обработать аудио-файлы (русский голос)?

Есть задача перевести в текст большой объем записей телефонных разговоров сотрудников с клиентами. Есть ли модели, хорошо работающие с русским языком, которые можно поставить локально (есть железо с видеокартой RTX 4090).
Знаю, что неплохо обученная модель у transkriptor.com, но мне нужен оффлайн т.к. объем записей огромный.

Вопрос задан более года назад
734 просмотра

1 комментарий

Подписаться 4 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Data Scientist с нуля

10 месяцев

Далее
Академия Эдюсон

Machine Learning: тариф Базовый

7 месяцев

Далее
Бруноям

Data Scientist

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Хранение данных

+3 ещё

Средний
Как организовать обучение нейронной сети?
- 1 подписчик
- 15 часов назад
- 55 просмотров
2

ответа
Боты

+1 ещё

Простой
Как создать бота ВК на иностранных мозгах?
- 1 подписчик
- 30 июн.
- 213 просмотров
2

ответа
Обработка изображений

+1 ещё

Простой
Через какой ИИ можно массово редактировать изображения?
- 2 подписчика
- 30 июн.
- 315 просмотров
3

ответа
Машинное обучение

+1 ещё

Средний
Как устроены Нейрохам и подобные ему боты с точки зрения ML?
- 1 подписчик
- 24 июн.
- 379 просмотров
2

ответа
Веб-разработка

+2 ещё

Средний
Как избежать вездесущего agentic coding и остаться в IT?
- 7 подписчиков
- 01 июн.
- 3683 просмотра
12

ответов
Машинное обучение

+1 ещё

Простой
Какие темы в статистике нужно изучить прежде всего, чтобы начать решать простые задачи машинного обучения?
- 2 подписчика
- 25 мая
- 217 просмотров
2

ответа
IT-образование

+1 ещё

Простой
Важны ли алгоритмы и структуры данных для ML-инженера?
- 2 подписчика
- 25 мая
- 499 просмотров
2

ответа
Карьера в IT

+1 ещё

Простой
Стоит ли беспокоится, если иду в NLP, но я плох на числовых табличных данных?
- 1 подписчик
- 11 мая
- 460 просмотров
1

ответ
Python

+3 ещё

Средний
Как перенести позу SMPL модели на игровую 3д модель?
- 2 подписчика
- 10 мая
- 361 просмотр
1

ответ
Обработка звука

Простой
Кто нибудь получал ELASTIQUE PRO SDK от zplane.technology?
- 1 подписчик
- 27 апр.
- 76 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2024-09-27 06:45:51

whisper от openai (apache2.0 лицензия) и его производные, на текущий момент лучшая модель общего назначения. Лицензия позволяет пользоваться этим но при включении его в тиражируемые продукты, лицензия на исходный код этих производных продуктов так же должен быть открыт.

Так же модели по работе со звуком есть у всех топовых компаний, например у мозиллы deepspeech и у фейсбука, и у гугла, и у китайского qwen и т.п. но под вопросом качество русского языка, полистай, осторожно тут все в кучу свалено, не только прямая трансляция но и к примеру токенизаторы, векторизаторы и т.п.

С помощью какой AI модели можно локально обработать аудио-файлы (русский голос)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт