файлы в форматах .pdf/.doc/.xml
Попробуйте взять и заархивировать чем угодно PDF.
Сюрприз - скорее всего, файл станет только больше за счет заголовков архиватора.
Если DOC - не DOC, а DOCX - то затея проваливается по тому же сценарию.
А XML у вас прямо такие залежи, что архивация высвободит уйму места? Что-то с трудом такое представляю. Зачем?..
Вообще, я бы сначала оценил, что именно жрет место. Если это именно PDF - вполне вероятно, что там навалены какие-нибудь сканы документов с диким разрешением, и их можно просто взять и пожать, скажем, ps2pdf -dPDFSETTINGS=/ebook (ну, или /print, а то и /screen, уж какое там качество на самом деле нужно).