Нашел интересный исходник на гитхабе для автоматической коррекции вокала но не разобрался с тем как подготовить файлы для автокоррекции. Вот что пишет автор:
Data pre-processing
The program requires frame- and note-wise pYIN pitch analyses. Please check directory ./Intonation/realworld_data/pyin for examples of these. The outputs of the Sonic Visualizer are converted from seconds to frame indices.
То есть нужен csv файл с данными о высоте нот и нужен numpy файл wav файла для запуска
https://github.com/sannawag/autotuner