При попытке сжать большие (~2Гб) файлы. Это backup postgresql базы данных, его делаю так: pg_dump -F c -b -U postgres -f 1 MyDB), но для чистоты эксперимента я взял 2 одинаковых.
[user@comp test_compress]$ md5sum 1 2
8b6582a7fa0250692c9c0e1747878aa1 1
8b6582a7fa0250692c9c0e1747878aa1 2
[user@comp test_compress]$ du -sh *
1,8G 1
1,8G 2
При добавление их в архив tar:
[user@comp test_compress]$ tar -cf all.tar 1 2
и последующего сжатия (пробовал gzip, xz и bzip2) размер не уменьшается (ожидал увидеть 1.8, но не как не 3.5, ведь фалы одинаковые)
[user@comp test_compress]$ du -sh all*
3,6G all.tar
3,6G all.tar.bz2
3,5G all.tar.gz
3,5G all.tar.xz
В чем причина, и как можно эффективного сжимать близкие по содержимому большие файлы?