Ну, для начала вам нужно определиться с технологией двухсторонней связи с браузером. Обычно, операции работы браузера с веб-серверами ограничиваются схемой работы "запрос - ответ". Вам же необходимо, чтобы веб-сервер передал команду проиграть звук по событию в заранее неизвестную секунду времени. Для этого можно использовать одну из четырех технологий:
- бесконечный iframe;
- long-pooling;
- web-socket;
- push-уведомление.
Проиграть звук можно с помощью заранее добавленного на страницу (можно js) тега
audio:
document.querySelector('audio').play()