В общем случае никак, кроме OCR.
Консольне OCR вполне себе существуют, у файнридера вот есть модуль заточенный на PDF
https://pdf.abbyy.com/how-to/convert-compare-pdfs-...
В некоторых распознавалках можно шаблоны создать, которые позволят распознать не что-попало, а как-то осмысленно разбить PDF на поля.
https://help.parseur.com/en/articles/5796344-creat...
Если опишете задачу подробнее может еще что-то подскажу, я с этой напастью довольно долго возился и довел до того, что успешно распознавалось около 80% плетежек.
Вам сильно повезло, если все ваши PDF-ки однотипные, из одного источника, и среди них не попадаются экземпляры типа "распечатали, отсканировали, переслали как PDF".