Как исправить ошибку ValueError: Audio file could not be read as PCM WAV, AIFF/AIFF-C?

Question

Jesus_Christophe @Jesus_Christophe

Python
WAV

Как исправить ошибку ValueError: Audio file could not be read as PCM WAV, AIFF/AIFF-C?

У меня есть аудио файл типа wav, который мне необходимо перевести в текст с помощью SpeechRecognition.

import speech_recognition as sr

r = sr.Recognizer()
sample_audio = sr.AudioFile('voice.wav')
print(type(sample_audio))
with sample_audio as audio_file:
     audio_content = r.record(audio_file)
print(type(audio_content))
q = r.recognize_google(audio_content)
print(f"You've said: {q}")

Однако выходит ошибка:

raise ValueError("Audio file could not be read as PCM WAV, AIFF/AIFF-C, or Native FLAC; check if file is corrupted or in another format")
ValueError: Audio file could not be read as PCM WAV, AIFF/AIFF-C, or Native FLAC; check if file is corrupted

Вопрос задан более трёх лет назад
1428 просмотров

6 комментариев

Подписаться 1 Простой 6 комментариев

PavelMos @PavelMos

А спросить поисковик что такое формат WAV и попросить переводчик перевести ошибку на русский ?
https://ru.wikipedia.org/wiki/WAV

Написано более трёх лет назад
Jesus_Christophe @Jesus_Christophe Автор вопроса

PavelMos, прошу без язвительности. Если вас раздражает мой вопрос или вы не знаете решения, то проигнорируйте.

Написано более трёх лет назад
PavelMos @PavelMos

Jesus_Christophe, потому что ты совсем нубовский вопрос задаешь.
1. Ошибка - файл не может быть прочитан как файл формата ...., далее перечисляются кодеки.
2. WAV это формат файла - контейнер, где звук может быть сохранён с помощью разных кодеков, в т.ч. не поддерживаемых этим модулем.

В контейнере может быть аудио и видео с разными кодеками, к примеру, в одном фильме в MP4 видео может быть сжато одним кодеком, в другом - другим. И если кодека нет в системе, то один файл воспроизведётся, а второй - нет.

Написано более трёх лет назад
Jesus_Christophe @Jesus_Christophe Автор вопроса

PavelMos, будьте вежливее, прошу. Я не могу понять, почему именно файл не может быть прочитан, когда с ним нет проблем и прошу помощи, что в этом плохого?

Написано более трёх лет назад
PavelMos @PavelMos

Jesus_Christophe, файл не может быть прочитан не вообще, а конкретно этим модулем питон. Он может воспроизводиться на компьютере , т .к. на компьютере есть нужный кодек.

Посмотреть что там за кодек это в виндах см. свойства файла и должна быть вкладка медиа или как-то так. Там будет кодек, битрейт и прочее.

Далее нужно с помощью какой-нибудь утилиты или сайта перекодировать его в один из кодеков, поддерживаемых speech_recognition, и сохранить в формате файла, поддерживаемым speech_recognition.

Скорей всего, проблема в этом.

Написано более трёх лет назад
shurshur @shurshur

Jesus_Christophe, надо для начала проверить, что внутри файла. Он может оказаться не wav, а в каком-то другом формате (даже raw pcm), и кодеком у него может оказаться не pcm, а что-то другое, в том числе даже mp3. Библиотека-то прямо говорит, что не понимает содержимое.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Сложный
Как решить задачу на 3D DP?
- 1 подписчик
- 22 июл.
- 154 просмотра
2

ответа
Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- 19 июл.
- 100 просмотров
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 113 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 377 просмотров
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 244 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 685 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 558 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 311 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 582 просмотра
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 231 просмотр
2

ответа
Показать ещё Загружается…

А спросить поисковик что такое формат WAV и попросить переводчик перевести ошибку на русский ?
https://ru.wikipedia.org/wiki/WAV
PavelMos, прошу без язвительности. Если вас раздражает мой вопрос или вы не знаете решения, то проигнорируйте.
Jesus_Christophe, потому что ты совсем нубовский вопрос задаешь.
1. Ошибка - файл не может быть прочитан как файл формата ...., далее перечисляются кодеки.
2. WAV это формат файла - контейнер, где звук может быть сохранён с помощью разных кодеков, в т.ч. не поддерживаемых этим модулем.

В контейнере может быть аудио и видео с разными кодеками, к примеру, в одном фильме в MP4 видео может быть сжато одним кодеком, в другом - другим. И если кодека нет в системе, то один файл воспроизведётся, а второй - нет.
PavelMos, будьте вежливее, прошу. Я не могу понять, почему именно файл не может быть прочитан, когда с ним нет проблем и прошу помощи, что в этом плохого?
Jesus_Christophe, файл не может быть прочитан не вообще, а конкретно этим модулем питон. Он может воспроизводиться на компьютере , т .к. на компьютере есть нужный кодек.

Посмотреть что там за кодек это в виндах см. свойства файла и должна быть вкладка медиа или как-то так. Там будет кодек, битрейт и прочее.

Далее нужно с помощью какой-нибудь утилиты или сайта перекодировать его в один из кодеков, поддерживаемых speech_recognition, и сохранить в формате файла, поддерживаемым speech_recognition.

Скорей всего, проблема в этом.
Jesus_Christophe, надо для начала проверить, что внутри файла. Он может оказаться не wav, а в каком-то другом формате (даже raw pcm), и кодеком у него может оказаться не pcm, а что-то другое, в том числе даже mp3. Библиотека-то прямо говорит, что не понимает содержимое.

Answer 1 · 2022-04-21 03:16:56

Jesus_Christophe @Jesus_Christophe Автор вопроса

Для решения необходимо было просто установить ffmpeg для корректной конвертации аудиофайла .ogg в wav.

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2022-04-10 20:20:10

Проще всего будет конвертировать его в mp3, и уже с ним работать дальше

import pydub 
sound = pydub.AudioSegment.from_wav('''Путь к wav''') 
sound.export("*Путь для нового файла*//*Желаемое название для файла*.mp3", format="mp3")

Как исправить ошибку ValueError: Audio file could not be read as PCM WAV, AIFF/AIFF-C?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт