Как преобразовывать PDF в Excel?

Question

Pavel Pavel @pavelzabavin

Как преобразовывать PDF в Excel?

Всем привет!

Есть задача: необходимо в автоматическом (фоновом) режиме производить конвертацию PDF-файлов в формат Excel в конкретной папке. Операционная система — Windows 10.

Какие идеи проходят у вас? Может быть есть софт, который максимально корректно всё преобразует (важно, чтобы в автоматическом режиме работало). Буду рад оптимальным вариантам. Заранее спасибо!

Вопрос задан более двух лет назад
143 просмотра

1 комментарий

Подписаться 1 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Специалист по информационной безопасности + нейросети

12 месяцев

Далее
Merion Academy

Администрирование MS Windows Server

1 месяц

Далее
Skillbox

Специалист по кибербезопасности 2.0/ Этичный хакер

12 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 3

Комментировать

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Windows

+1 ещё

Средний
Как сделать постоянно активную сессию RDP?
- 1 подписчик
- вчера
- 202 просмотра
4

ответа
Windows

+1 ещё

Средний
Почему не создается логическая репликация на Windows 10 и падает воркер?
- 5 подписчиков
- 17 нояб.
- 213 просмотров
1

ответ
Windows

Простой
Как ассоциировать файл .fb2 с okular?
- 1 подписчик
- 17 нояб.
- 164 просмотра
1

ответ
PHP

+2 ещё

Простой
Как сконвертировать файл в формате excel в pdf?
- 3 подписчика
- 14 нояб.
- 282 просмотра
4

ответа
Excel

+2 ещё

Простой
Как в Excel 2016 быстро, по всем ячейкам дописать нужные строки?
- 2 подписчика
- 14 нояб.
- 145 просмотров
3

ответа
Windows

+1 ещё

Простой
Удаление кэшированного пароля Windows — как?
- 5 подписчиков
- 14 нояб.
- 479 просмотров
4

ответа
Excel

Простой
Почему не работают ссылки Excel в Р7-Офис?
- 2 подписчика
- 11 нояб.
- 135 просмотров
0

ответов
Windows

Простой
Как решить ошибку StartupRepairOffline если она появилась из-за сна на клавиатуре?
- 1 подписчик
- 10 нояб.
- 117 просмотров
0

ответов
Windows

Простой
Какую в Windows стороннюю программу для копирования использовать?
- 2 подписчика
- 06 нояб.
- 369 просмотров
6

ответов
Windows

Средний
При запуске приложений их окна полностью черные Win 10, в чем проблема и как решить?
- 3 подписчика
- 05 нояб.
- 220 просмотров
1

ответ
Показать ещё Загружается…

Специалист первой линии поддержки

Ай Ти без проблем • Санкт-Петербург

от 55 000 до 90 000 ₽

Инженер по безопасности ИТ-инфраструктуры

SMALL

от 2 800 до 3 800 $

Специалист технической поддержки (чат)

WebSoft

от 50 000 до 70 000 ₽

https://qna.habr.com/q/1238470
https://qna.habr.com/q/1168214

Answer 1 · 2023-03-10 15:55:28

Идея такая: проследить, откуда берутся эти PDF, и получить там более вменяемый исходник. Это перспективно, в отличие от любых костылей, которые вам удастся нагородить для решения задачи в том виде, как она поставлена сейчас.

Answer 2 · 2023-03-10 15:52:40

В общем случае никак, кроме OCR.
Консольне OCR вполне себе существуют, у файнридера вот есть модуль заточенный на PDF
https://pdf.abbyy.com/how-to/convert-compare-pdfs-...

В некоторых распознавалках можно шаблоны создать, которые позволят распознать не что-попало, а как-то осмысленно разбить PDF на поля. https://help.parseur.com/en/articles/5796344-creat...

Если опишете задачу подробнее может еще что-то подскажу, я с этой напастью довольно долго возился и довел до того, что успешно распознавалось около 80% плетежек.

Вам сильно повезло, если все ваши PDF-ки однотипные, из одного источника, и среди них не попадаются экземпляры типа "распечатали, отсканировали, переслали как PDF".

Answer 3 · 2023-03-10 15:54:30

ну "в папке" тут самое легкое
если в PDF не картинки, то ищите библиотеки https://pypi.org/project/tabula-py/ или софт поверх них
либо внешний сервис https://pdftables.com/ с платным или условно бесплатным API

Как преобразовывать PDF в Excel?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт