Прежде всего, не существует абсолютно корректного способа конвертировать сложный аудио сигнал в его алгоритмическое описание (MIDI файл не содержит звука, он содержит описание гармонической, динамической и временной структуры, а так же некоторые элементы исполнения и набор стандартных тембров, т.е. ноты, их громкость, время начала и конца, опционально артикуляцию и тип инструмента. Эти данные используются синтезатором миди для синтеза звука). Это примерно то же, что переводить фото живописи в вектор.
Вы можете найти ноты нужного произведения и перевести их в MIDI, можете самостоятельно на слух записать, а можете проанализировать файл и получить более-менее аккуратную структуру. Чаще всего ее все равно нужно будет подправить вручную.
Для редактирования MIDI подойдет любая DAW, например
reaper.fm .
Для детального анализа сложных полифонических композиций можно воспользоваться замечательным бесплатным
sonicvisualiser.org и плагинами к нему.