Если актуально, конечно, еще.
Что есть " на сервер воспроизведения звука на динамик" - откуда динамик у сервера? Опишите задачу изначально, что нужно получить.
В реализации, что бы "воспроизводится стрим", и одновременно что бы там был живой человек вам подойдет использование конференции на asterisk. Вам нужно создать конференцию, куда может позвонить ваш X-LITE и туда же направить вызов вашего "стрим сервера", который будет в конференцию что то вещать.
Если актуально, попробую более подробно описать решение.