Суть такова, что ШИМ — это эквивалент напряжения. Т.е. если сважность равна нулю то напряжение на выходе равно нулю, а если скважность равна 100%, то это 3,3 (или 5 вольт, в зависимости от логики контроллера). На выходе ШИМ обычно ставят ФВЧ (фильтр высоких частот), отсекая сам сигнал ШИМ, и в результате получают сглаженный сигнал. Чтобы получить некий звук, например синус, надо менять скважность по синусоиде (от нуля до 100% и потом обратно, можно использовать готовые таблицы). Частота звучания зависит от скорости изменения по синусу. Комбинируя звуки различных частот можно получить музыку.
Картинка с википедии (
читать тут)
Как-то так.