Как из картинки power spectogram получить аудио файл?

Question

Maruto @Maxim_Baturo

Python

Как из картинки power spectogram получить аудио файл?

Добрый день. Я преобразую аудио в картинку следующим кодом, не переводя stft в абсолютные числа, чтобы не потерять данные. Как я понимаю, вообще ничего не теряю, чтобы восстановить первоначальный звук, поправьте, если не так.

path = '/content/drive/MyDrive/originalputin/2.mp3.wav'

audio, sr = librosa.load(path)

print('length of the audio:',len(audio)/sr)

audio_stft = librosa.stft(audio)

audio_stft_db = librosa.power_to_db(audio_stft)

print('audio_stft.shape:',audio_stft.shape)
print('audio_stft_db.shape:',audio_stft_db.shape)

import matplotlib.pyplot as plt
import librosa.display

fig, ax = plt.subplots()
img = librosa.display.specshow(audio_stft_db, y_axis='log', x_axis='time', ax=ax)
ax.set_title('Power spectrogram')
fig.colorbar(img, ax=ax, format="%+2.0f dB")

На выходе получаю картинку. Что-то типа этой.

Вопросы.

1) Как мне без потери качества скачать только картинку этой spectogram? Чтобы без рамок, без шкалы. Главное, без потери качества вообще.

2) Как мне из этой картинки без потери качества получить снова исходный аудио файл?

Спасибо.

Вопрос задан более трёх лет назад
54 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 2

Комментировать

5 комментариев

Maruto @Maxim_Baturo Автор вопроса

А где я ее теряю?

Написано более трёх лет назад
Maruto @Maxim_Baturo Автор вопроса

В переводе в дб?

Написано более трёх лет назад
U235U235 @U235U235

Исходный действительный сигнал, делается преобразование Фурье (оконное, не важно), получаете комплексный Фурье образ. Мощность это модуль комплексного Фурье-образа.
Числа 2+3j и 3+2j разные, а модуль у них один и тот же. Зная модуль вы не можете однозначно сказать какое комплексное число ему соответствует.
Как-то так...

Написано более трёх лет назад
Maruto @Maxim_Baturo Автор вопроса

U235U235, librosa.stft, то есть обычное stft ведь выдает комплексные числа, а не их модуль, верно?

Написано более трёх лет назад
U235U235 @U235U235

Maruto, верно. Но power_to_db выдает предупреждение warning и предварительно берет модуль.

Написано более трёх лет назад