Ответы пользователя по тегу Архивация данных
  • Как запаковать несколько идентичных файлов в архив, чтобы они весили меньше чем 1 файл?

    @rPman
    Используй формат архива wim (поддерживается 7z) он учитывает дубликацию файлов (никогда не пользовался, но пишут что да).

    Если речь идет о просто одинаковых кусках данных (файлы например отличаются только частью или содержат общие данные) то в пределах размера словаря (точнее там есть понятие окно или блока сжатия) можно включить solid mode (раньше была опция в интерфейсе, теперь только в командной строке -ms=on (почитай документацию там много вариантов), но это сработает только для файлов, которые попадут в оперативную память, достаточную для распаковки (там это сложно посчитать по параметрам, даже есть опция - какой процент памяти использовать).

    При распаковки solid архива будет считываться и распаковываться весь архив (до тех пор пока не достигнет места хранения требуемого файла), когда как из обычного архива файл извлекается сразу вне зависимости от размера всего архива
    Ответ написан
  • Как быстро извлечь большой файл из .zst?

    @rPman
    .zst это скорее всего Zstandard compress, нормальная поддержка есть у 7z а так же одноименной консольной утилиты zstd. Кстати там же можно выбрать использование многопоточности (но лично я не помню чтобы у меня распаковка упиралась по процессору).

    К сожалению в зависимости от настроек упаковки, для распаковки могут быть повышенные требования к оперативной памяти (буквально десятки гигабайт) и если ее не достаточно то получится именно так как у тебя.
    Ответ написан
  • Как распокавать многотомный архив при помощи TAR в windows?

    @rPman
    у tar нет поддержки многотомных архивов, идеологически если ее и реализуют то делят итоговый архив просто на части без какого либо формата (порядок в именах файлах)

    гугли поддержку zip, она точно реализована для старых версий .net и в любом случае это оверкил, тебе нужен просто любой способ хранения файлов внутри других файлов с поддержкой томов (кстати тоже не обязательно, если файлы внутри архива никогда не превышают размер тома, то можно приблизительно собирать файлы в тома, чтобы влезали без их разделения).

    Почему современные 'программисты' пасуют перед очень простыми задачами и при этом пилят достаточно сложные приложения. Эту задачу должны делать как курсовая в на первом курсе обучения - создать свой архиватор без поддержки сжатия, только имена файлов и несколько томов. Кода тут кот наплакал. А если допустить хранение списков файлов и порядка разделения на тома в отдельном файле (тебе же без разницы) то формат становится ну очень простым.

    Предлагаю запилить такой формат как сериализованная метаинформация об архиве (количество и размер томов с именами файлов в нужном порядке + список файлов в архиве, для каждого файла crc+список кусков где он находится - это номер тома + смещение+размер куска, да это избыточно но просто). А файлы хранить просто линейно друг за другом, разделяя по окончанию места в томе.
    Ответ написан
  • Есть wayback machine с заточкой для продактов?

    @rPman
    погугли: web archive alternatives
    там куча продуктов, но мне кажется они не такие крупные

    сомневаюсь что такая узкая задача будет реализована, так как веб архив достаточно дорогое удовольствие.ю Что именно тебе нужно (что такое 'профильная заточка') у web.archive.org точно знаю есть api, возможно можно реализовать что то поверх него?
    Ответ написан
  • Как заархивировать папку по частям и отправить на почту(разную)?

    @rPman
    Отправка архивов на почту - худшая форма передачи данных, неужели нельзя по другому?

    Автоматизировать - значит написать приложение, вариантов 100500, бери делай, это не сложно
    Вот к примеру как отправить почту с вложениями с помощью PowerShell
    Ответ написан
    Комментировать
  • Чем заархивировать файлы с определенными условиям на UBUNTU?

    @rPman
    Одновременно все пункты мне не известно какой архиватор умеет такое, но по отдельности можно собрать их разных утилит. Самые сложные пункты 2 и 3.

    3 пункт есть к примеру у parchive, собственно отдельная утилита для разбиения на тома и добавления информации для восстановления.

    Есть утилиты (например rdfind), создающие символические или хард линки для идентичных файлов, а уже после можно.

    Т.е. упаковываете файл tar-ом (он умеет линки но не упаковывает), сжимаете его bzip-ом после разбиваете на тома parchive и все это через пайпы одновременно, минуя промежуточное хранение файлов на диске.
    Ответ написан
    2 комментария
  • Как узнать какие файлы сжаты lzx сжатием?

    @rPman
    Утилита linux - file. поставляется с кучей стандартных тулкитов портированных на windows хоть msys от mingw хоть cygwin, хоть используйте штатную Windows subsystem for linux

    Утилита в командной строке позволяет указать файл, выводит его mime type по содержимому.
    Ответ написан
    4 комментария
  • Архиватор win 32 со словарем 2-4 ГБ?

    @rPman
    Я вам уже ответил ранее.

    Вы просто попробуйте пройтись по текстовому sql-дампу diff-ом, результат вас удивит, ни один архиватор так эффективно не ужмет.

    Кстати сам по себе diff по sql не очень эффективный, но если воспользоваться специализированным инструментом, заточенным именно на выявление разницы в данных БД, то можно получить еще больший профит (т.е. патч будет равен ровно тем данным, что были изменены).

    К сожалению готовые инструменты чаще всего затачивают под конкретную базу данных, и это явно будет не firebird. Посмотрите утилиты от dbForge data compare, возможно оно вам подойдет (правда оно для вашей задачи избыточно), кажется там была возможность подключиться к любой базе.

    Совсем правильно, поищите программиста, который вам запилит command line утилиту именно для этой задачи, делов то на неделю кодинга, может меньше.
    Ответ написан
    3 комментария
  • Эффективное сжатие БД firebierd?

    @rPman
    Попробуйте bzdiff или лучше по эффективнее по памяти vbindiff (или обычный diff для текстовых)

    upd. оригинальная утилита сильно потребляет оперативную память, нужно искать версии не такие требовательные

    Можно хранить первоначальную версию и потом серию последовательных патчей, недостаток - для восстановления последней версии потребуется последовательное принятие всех патчей, очень длительная операция (фактически при каждом применения патча копируется весь файл)

    Когда то давно я на основе этого делал резервное копирование, а чтобы не пришлось через год сотни патчей применять, храню только последние N патчей, старательно подготавливая N+1 версию (применяя старый патч и сохраняя результат, удаляя старую версию)
    Ответ написан
    Комментировать
  • Как максимально сильно сжать игру для тату?

    @rPman
    У вас только два варианта - либо кодируйте цветом High Capacity Color Barcode что даст вам примерно пятикратную оптимизацию по площади, либо размещайте код ссылку вместо самого кода, но это не так интересно, само собой.

    Не вздумайте сделать глупость и нанести настоящее тату под кожу, те, рисуйте тату сверху с помощью переводных наклеек (точно знаю есть возможность печатать такие на принтере). Интересно и весело вам сейчас и максимум ближайшие несколько лет, а испорченная кожа - это на всю жизнь, так что допускаются только смываемые варианты.
    Ответ написан
    2 комментария
  • Как извлечь множество вложенных архивов?

    @rPman
    так как в тегах 7z значит команда будет с его использованием
    for /l %a in (10000,-1,1) do @"C:\Program Files\7-Zip\7z.exe" x -aos %a.zip
    Ответ написан
    Комментировать
  • Как автоматически вытащить из архивов нужный файл?

    @rPman
    создаете список ваших архивов в виде текстового файла, каждый файл в новой строке
    создаете xxx.bat файл:
    @echo off
    for /f %%a in (путь_и_имя_файла_со_списком_файлов) do "c:\program files\7-zip\7z.exe" e "%%a" *.pdf

    все pdf будут распакованы в текущую директорию без каталогов в архивах, если имена файлов будут совпадать, будет выдаваться запрос на перезапись, если это критично, нужно дополнять код например созданием каталога по имени архива, например.

    7z.exe x ... - будет распаковать файлы с каталогом в архиве, в котором они находятся

    for /r c:\dir %%a in (*.7z) do .... - будет искать все архивы в каталоге c:\dir и его подкаталогах (т.е. файл со списком архивов не надо будет создавать)
    Ответ написан
    6 комментариев
  • Есть ли возможность в поисковых системах искать по названиям файлов архивов (zip, rar и др.) и содержимому архивов

    @rPman
    Все зависит от технологии хранении и передачи информации и типа архивов.
    Например если torrent считать 'архивом' (это контейнер для нескольких файлов) то есть отличный поисковик btdigg.org ищет все торренты по их именам и файлам в них, публикуемых в DHT сети.
    Ответ написан
  • Формат архива с индексированным поиском

    @rPman
    Любой крупный архиватор (без режима 'solid') собственно так и делает. тот же rar или 7z.
    p.s. чем собственно tar не устраивает?
    Ответ написан
    3 комментария