Есть два одинаковых "плохо" сжимаемых файла размером m байт.
Если мы их архивируем winrar или 7zip, то получаем размер архива незначительно отличающийся от 2*m байт.
Существуют ли архиваторы предусматривающие дедуплекацию данных между файлами внутри архива?
В WinRar и 7zip есть функция "непрерывный архив" С включенной функцией, и приличным размером словаря будет что то похожее на дедупликацию.
Только в вашем случае размер словаря должен быть сравним с m.
Психанул и снес свои ответы козлам, не отмечающим…
Если не путаю, раньше 7-Zip умел хранить ссылку на идентичный по содержимому файл, это даже как-то отображалось в его проводнике (колонка "метод сжатия").