@DVoropaev
Ставлю + к карме на хабре за ответы на вопросы

Как на сервере (linux) сэкономить место при хранении PDF файлов?

Файл добавляется скриптом на python, а выгружается php. При архивации допустимо сжатие с потерями.
Каждый из файлов представляет несколько отсканированных страниц a4.
Пробовал ImageMagic, zip, rar, но почему то размер только увеличивался.
Есть вариант хранить все файлы в одном архиве, но тогда вопрос:
Время извлечения/добавления одного файла зависит от количества файлов в архиве?
  • Вопрос задан
  • 49 просмотров
Решения вопроса 1
Adamos
@Adamos
PDF - уже архивный формат. Архиваторы его, как правило, только увеличивают.
Если у вас внутри отсканированные страницы, то размер можно лихо уменьшить, уменьшив / ухудшив эти картинки до допустимых параметров. Часто народ тупо херачит со сканера 400 dpi в цвете - для договора, где в цвете только печать на одной странице, и документа, который никто заново печатать не будет, только на экране смотрят. Да еще и сканер не особенно старается что-то сжать.
В общем, изучайте ключи утилиты ps2pdf - и, возможно, будет вам счастье. Очень мощный инструмент для выжимки из PDF реально нужного.

Для разгона можно попробовать просто
ps2pdf -dPDFSETTINGS=/ebook ВАША.pdf Сжатая.pdf
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
2ord
@2ord
Чтобы уменьшить размер PDF, можно уменьшить резолюцию отсканированного изображения либо количество цветов. Ну и сохранять в формате JPEG или другом, в зависимости от требований к цвету (CCITT для двутональных).
https://www.prepressure.com/pdf/basics/compression
https://gist.github.com/firstdoit/6390547
(наподобие совета Adamos)
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы