Flussonic c
WebRTC или
MSE проигрыванием.
Захват экрана можно написать самому или прихватить что-то вроде
этого.
Верно ли понимаю, что это надо будет делать из браузера? Если приложение всё-равно писать, то будет проще.
О каким мобильных устройствах речь? Про WebRTC в браузере можно забыть на iOS. Так что остаётся MSE или fragmented-mp4