Зависит от реализации. Можно всё посылать через один сокет. Установить TCP соединение, послать заголовок пакета, в котором будет указан тип данных (голос или текст) и размер данных, затем передать сами данные.
С другой стороны сервер будет принимать заголовок, смотреть, сколько за ним принимать данных, принимать сами данные и ждать новый заголовок.