Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
Vla
@sfl_vlad
Обработка звука
Распознавание речи
Каким приложением можно перевести аудио в текст?
Товарищи, необходимо переводить аудио (речь) в текст. Есть какие-то программные решения, чтобы можно было бы аудиофайл загрузить, а текстовый файл на выходе получить? Это необходимо для учёбы, мне трудно немецкий язык распознавать.
Вопрос задан
более трёх лет назад
182 просмотра
Комментировать
Подписаться
2
Простой
Комментировать
Facebook
Вконтакте
Twitter
Решения вопроса
0
Пригласить эксперта
Ответы на вопрос
2
Umpiro
@Umpiro
Попробуйте
DeepSpeech
. Хотя для немецкого вам понадобится его натренировать самому. Датасеты для обучения там тоже есть.
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Facebook
Вконтакте
Twitter
nshmyrev
@nshmyrev
Если не хочется ничего тренировать попробуйте библиотеку для распознавания речи с открытым исходным кодом "Воск". Немецкий поддерживается.
https://github.com/alphacep/vosk-api
Для распознавания проще всего можно запустить сервер из docker, проект здесь:
https://github.com/alphacep/vosk-server
Запускается одной командой:
docker run -d -p 2700:2700 alphacep/kaldi-de:latest
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Facebook
Вконтакте
Twitter
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Обработка звука
Простой
Как на студии звукозаписи сделать, чтобы исполнитель в кабине слышал меня в своих наушниках? Это помимо микро для записи ещё один нужен?
1 подписчик
16 сент.
78 просмотров
0
ответов
JavaScript
+2 ещё
Средний
WEBAUDIO Почему сигнал с искажениями как настоящий?
5 подписчиков
29 авг.
789 просмотров
1
ответ
Windows
+2 ещё
Простой
Чем записывать аудио поток на компьютере?
1 подписчик
22 июл.
225 просмотров
3
ответа
Аудио
+1 ещё
Простой
Как починить очень плохую аудиозапись?
3 подписчика
05 июл.
877 просмотров
1
ответ
Обработка звука
+2 ещё
Простой
Почему фоновое гудение даже на обработанном звуке на моменте разговора blue yeti?
1 подписчик
29 июн.
52 просмотра
0
ответов
Аудио
+2 ещё
Средний
ИИ и создание музыкальных композиций (песен)?
1 подписчик
04 июн.
255 просмотров
2
ответа
Машинный перевод с одного языка на другой
+1 ещё
Простой
Надёжный распознаватель речи в текст на разных языках?
2 подписчика
06 мая
1174 просмотра
2
ответа
Windows
+1 ещё
Простой
Как на компе с виндой набивать голосом текст на русском языке, с качеством не хуже чем у клавиатуры gboard для Android?
1 подписчик
03 мар.
239 просмотров
2
ответа
Windows
+1 ещё
Простой
Насколько хороша Cortana встроенная в Win11 для распознавания русской речи?
1 подписчик
12 февр.
176 просмотров
1
ответ
Машинное обучение
+2 ещё
Средний
Как обучить локальную модель своему голосу?
1 подписчик
26 янв.
534 просмотра
1
ответ
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Специалист технической поддержки
Right Line
До 130 000 ₽
Support manager / Инженер технической поддержки (ОФИС)
TIGER SMS
•
Москва
от 70 000 до 100 000 ₽
Руководитель направления
Selecty
•
Москва
от 280 000 до 350 000 ₽
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама