В основном зависит от канала связи и от возможности аппаратного декодирования видео. А аппаратное декодирование зависит от наличия в терминальном сервере видюхи или чего-то такого. Причём не вообще в сервере, а именно в том, куда вы заходите. Оно может быть, как железка, но не быть проброшена в виртуалку.
Еще админы могут запретить проброс usb, ну на всякий случай...
Но даже если сервер терминалов на железе или там проброшена Quadro и если сделаны правильно на нем настройки использования видеокарты (даже если это встройка в процессор), то кодирование всего видео со всего экрана и отдача этого потока может потреблять до 4х ядер процессора полностью и 20+ мегабит канала.
А если вы удумали провести так конференцию скажем для 10 человек - вот и считайте, какое на VPS на вас пойдет оборудование, чтоб тянуть.