@posters

Как редактировать PDF файлы на php?

Можно ли как-то получить содержимое pdf файла и отредактировать его, используя php? PDF представляет собой текст с иллюстрациями (не скан печатного документа).
  • Вопрос задан
  • 2335 просмотров
Решения вопроса 2
Stalker_RED
@Stalker_RED
Сохранить в pdf в целом можно, хотя придется прилично пошаманить чтобы получить удобоваримое оформление.

А вот прочиттать... вообще можно, есть PDFParser и некоторые другие библиотеки (больше десятка вариаций pdf2text, например). Еще можно в картинку конвертировать (с этим все ок) и через тессеракт прогнать, хоть он и питоновский внутре. Ну или файнридер.

Проблема в том, что все эти читалки-распознавалки дают весьма посредственное качество на выходе. Если только форматирование рассыпется - это вам повезло. Если вдруг нужно табличку распарсить - страдания практически гарантированы.
Ответ написан
dyuriev
@dyuriev
A posteriori
Редактировать/читать pdf крайне сложно не только на php и идеального способа не существует.
Подробнее о проблеме

Если вы хотите на php генерировать pdf файлы и придумываете велосипед то:
  1. php-imagick умеет генерировать svg в pdf
  2. можете использовать chromium (--headless) или wkhtmltopdf для конвертации html в pdf
  3. Библиотека FPDF для генерации PDF
  4. Модуль php-ps для примерно того же
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы