Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
Vla
@sfl_vlad
Обработка звука
Распознавание речи
Каким приложением можно перевести аудио в текст?
Товарищи, необходимо переводить аудио (речь) в текст. Есть какие-то программные решения, чтобы можно было бы аудиофайл загрузить, а текстовый файл на выходе получить? Это необходимо для учёбы, мне трудно немецкий язык распознавать.
Вопрос задан
более трёх лет назад
180 просмотров
Комментировать
Подписаться
2
Простой
Комментировать
Facebook
Вконтакте
Twitter
Решения вопроса
0
Пригласить эксперта
Ответы на вопрос
2
Umpiro
@Umpiro
Попробуйте
DeepSpeech
. Хотя для немецкого вам понадобится его натренировать самому. Датасеты для обучения там тоже есть.
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Facebook
Вконтакте
Twitter
nshmyrev
@nshmyrev
Если не хочется ничего тренировать попробуйте библиотеку для распознавания речи с открытым исходным кодом "Воск". Немецкий поддерживается.
https://github.com/alphacep/vosk-api
Для распознавания проще всего можно запустить сервер из docker, проект здесь:
https://github.com/alphacep/vosk-server
Запускается одной командой:
docker run -d -p 2700:2700 alphacep/kaldi-de:latest
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Facebook
Вконтакте
Twitter
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Windows
+1 ещё
Простой
Насколько хороша Cortana встроенная в Win11 для распознавания русской речи?
1 подписчик
12 февр.
144 просмотра
1
ответ
Машинное обучение
+2 ещё
Средний
Как обучить локальную модель своему голосу?
1 подписчик
26 янв.
208 просмотров
0
ответов
Электроника
+4 ещё
Средний
Как правильно сдвинуть амплитуду аудио сигнала выше нуля?
1 подписчик
24 янв.
285 просмотров
5
ответов
Компьютеры
+3 ещё
Средний
Цифровой шум ( писк ), как бороться?
1 подписчик
17 янв.
480 просмотров
2
ответа
C++
+2 ещё
Простой
Как обучить акустическую модель?
2 подписчика
18 дек. 2024
145 просмотров
0
ответов
Нейронные сети
+1 ещё
Сложный
Какой использовать стек для создания полностью локального STT-LLM-TTS русско-английского голосового ассистента?
2 подписчика
11 дек. 2024
372 просмотра
2
ответа
Искусственный интеллект
+2 ещё
Сложный
Управление презентацией PowerPoint голосом?
1 подписчик
20 нояб. 2024
89 просмотров
0
ответов
Обработка звука
Простой
Adobe Audition: где расположен ползунок громкости внутри редактора?
1 подписчик
15 окт. 2024
56 просмотров
1
ответ
Нейронные сети
+1 ещё
Простой
Как сделать голосовой командный интерфейс?
1 подписчик
10 окт. 2024
58 просмотров
0
ответов
Аудио
+1 ещё
Простой
Какой софтиной можно определить в каком аудио формате RAW данные?
2 подписчика
08 окт. 2024
165 просмотров
1
ответ
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Стажер в отдел IT-рекрутинга
Wanted.
•
Санкт-Петербург
от 80 000 до 150 000 ₽
Intern It-recruiter
Wanted.
•
Санкт-Петербург
До 120 000 ₽
Intern It-recruiter
Wanted.
от 60 000 до 120 000 ₽
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама