Дискретное преобразование Фурье для WAV файла. Как огрубить результат?

Question

aibb @aibb

Дискретное преобразование Фурье для WAV файла. Как огрубить результат?

Имеется wav файл. Из него я получаю байтовый массив, затем получаю float64 массив сэмплов и передаю его ДПФ.
Использую библиотеку github.com/mjibson/go-dsp/fft.

func main() {
	file, err := os.ReadFile("/home/aleksey/temp/ideal/7.wav_8k_stereo_s16_128kb.wav")
	if err != nil {
		log.Fatal(err)
	}
	rr := bytes.NewReader(file)

	wav, err := wavdsp.New(rr)
	if err != nil {
		log.Fatal(err)
	}

	wavTemp, _ := wav.ReadFloats(wav.Samples)

	wavResult := make([]float64, 0)
	for _, v := range wavTemp {
		wavResult = append(wavResult, float64(v))
	}

	fftWindowSize := 1024

	complexArray := make([]complex128, 0)

	blocksCount := len(wavResult) / fftWindowSize
	for i := 0; i < blocksCount; i++ {
		complexArray = fft.FFTReal(wavResult[i*fftWindowSize : i*fftWindowSize+fftWindowSize])
	}

В массиве complexArray находятся комплексные числа с действительной и мнимой часть float64.
Пример элемента массива: (512.5040206313133+0i) (0.5936806295286904-0.01702782107152339i)

1) Я правильно понимаю что это представление частоты и амплитуды первого сэмпла?

Мне необходимо в дальнейшем получить аудиоотпечаток из этого массива, но текущий complexArray я так понимаю не подходит, его необходимо дополнительно обработать.

2) Собственно вопрос как обработать каждый элемент массива, чтобы получить более грубые данные о каждом сэмпле?

Вопрос задан более трёх лет назад
264 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Go-разработчик с нуля

9 месяцев

Далее
Skillfactory

Профессия Backend-разработчик на Go

12 месяцев

Далее
Яндекс Практикум

Go-разработчик с нуля

8 месяцев

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Go

Простой
Как должна выглядит правильная структура «внедрение зависимостей»?
- 1 подписчик
- 04 нояб.
- 203 просмотра
2

ответа
Обработка звука

Простой
Какое ПО использовать для озвучки?
- 3 подписчика
- 23 окт.
- 212 просмотров
2

ответа
Go

Простой
Как пропустить поле при конвертации структуры в JSON?
- 1 подписчик
- 15 окт.
- 120 просмотров
0

ответов
Go

Простой
Можно ли получить исходное имя файла до переименования из fsnotify?
- 3 подписчика
- 09 окт.
- 212 просмотров
0

ответов
Go

+1 ещё

Простой
Какой наиболее привычный путь для удаленного хранения настроек линтинга в Go?
- 1 подписчик
- 30 сент.
- 155 просмотров
1

ответ
Go

Простой
GO + FYNE GUI как запустить скрипт после подтверждения в диалоговом окне dialog.ShowConfirm?
- 1 подписчик
- 24 сент.
- 121 просмотр
1

ответ
Go

Простой
GO + FYNE GUI — какой макет — Layout выбрать для desktop приложения? Как сделать сайдбар и контентную часть?
- 2 подписчика
- 22 сент.
- 108 просмотров
1

ответ
Железо

+2 ещё

Средний
Что делать если после поломанных наушников стали некорректно играть и колонки?
- 2 подписчика
- 18 сент.
- 242 просмотра
0

ответов
Обработка звука

Простой
Как на студии звукозаписи сделать, чтобы исполнитель в кабине слышал меня в своих наушниках? Это помимо микро для записи ещё один нужен?
- 1 подписчик
- 16 сент.
- 92 просмотра
0

ответов
Аудио

Простой
Расстановка акустики 5.1.4 в домашнем кинотеатре?
- 1 подписчик
- 14 сент.
- 194 просмотра
1

ответ
Показать ещё Загружается…

Senior GO разработчик

SMALL

от 220 000 до 300 000 ₽

Разработчик PHP/Go

ЭТП ГПБ / VESNA

До 220 000 ₽

Go-разработчик / Backend Developer (Golang)

Karma8

До 500 000 ₽

Answer 1 · 2022-05-19 11:19:57

1) нет, понимаете неправильно. То что получилось - это комплексное число (в википедию, если не ясно), в котором спрятаны амплитуда и фаза самой низкой частоты в преобразовании. Дальнейшие элементы массива - это тоже комплексные числа с амплитудами-фазами.

Чтобы вытащить из них амплитуды, нужно найти модуль комплексного числа (опять же, см. википедию, как это считать). Для вытаскивания фаз, нужно найти аргумент комплексного числа.

Учтите, что из математических свойств преобразования Фурье над вещественными данными, итоговый массив после вычисления амплитуд окажется зеркально симметричным относительно центра - так то половину результата вам надо выкинуть.

2) А тут надо почитать базовые учебники по ML. Нишант Шакла, написал хороший, например.

Дискретное преобразование Фурье для WAV файла. Как огрубить результат?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт