Да, понял это когда разирался в струтуре PDF, но сейчас целый день пробую новый метод, но он тоже еще не стабилен. PDF -> JPEG -> OCR => Text
Но все равно текст иногда прыгает
Алексей Черемисин, Ну вообще, получается вытащить информацию. По средствам конвертации пдфа в более удобные форматы, где можно брать информацию удобнее!
А не подскажешь, каким образом можно выделить нужную информацию из pdfa и вывести только ее?
Потому, что извлекая ее в текст данные прыгают со строки на строку
Ой дествительно, про документацию забыл, заработался и первое что пришло в голову это задать вопрос!