Поискал, почитал. Как я понял, Skype получает кадры с камеры снятые в течение 1 секунды, сжимает, кодирует и в виде пакета кидает в поток. Сжатие происходит в виде выбора опорного кадра, который передается целиком, и изменения остальных кадров от опорного. Обычно на 10 кадров 1 опорный. Выходит, что видеофайл не формируется, а формируется сжатый, кодированный пакет с кадрами.