@Jesus_Christophe

Как исправить ошибку ValueError: Audio file could not be read as PCM WAV, AIFF/AIFF-C?

У меня есть аудио файл типа wav, который мне необходимо перевести в текст с помощью SpeechRecognition.
import speech_recognition as sr

r = sr.Recognizer()
sample_audio = sr.AudioFile('voice.wav')
print(type(sample_audio))
with sample_audio as audio_file:
     audio_content = r.record(audio_file)
print(type(audio_content))
q = r.recognize_google(audio_content)
print(f"You've said: {q}")


Однако выходит ошибка:

raise ValueError("Audio file could not be read as PCM WAV, AIFF/AIFF-C, or Native FLAC; check if file is corrupted or in another format")
ValueError: Audio file could not be read as PCM WAV, AIFF/AIFF-C, or Native FLAC; check if file is corrupted
  • Вопрос задан
  • 1092 просмотра
Решения вопроса 1
@Jesus_Christophe Автор вопроса
Для решения необходимо было просто установить ffmpeg для корректной конвертации аудиофайла .ogg в wav.
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
@Joni_Straponi
Проще всего будет конвертировать его в mp3, и уже с ним работать дальше
import pydub 
sound = pydub.AudioSegment.from_wav('''Путь к wav''') 
sound.export("*Путь для нового файла*//*Желаемое название для файла*.mp3", format="mp3")
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы