Я вот тоже озаботился данным вопросом... Оказалось не так всё просто как может показаться на первый взгляд.
Практически во всех обсуждениях для того чтоб дёргать WinAPI советуют использовать решения на основе node-ffi, а она, в свою очередь, требует наличия на компе всего необходимого для ребилда node-gyp, а это - питон и visual studio (несколько гигов). Есть ещё варианты типа
win-audio, но там те же грабли шизофреничные — для компиляции нужен node-gyp со всеми вытекающими...
Короче, тут один энтузиаст переписал
node-ffi на расте, и там все эти костыли не нужны, хотя поставить компилятор G++ всё же придётся, но он работает без танцев с бубном и весит всего сотню метров.
Я для себя сделал вот такое, возможно кому-то пригодится:
https://github.com/Psychosynthesis/AudioManager