Задача:
Сканировать datamatrix коды из файла пдф и сохранять их в csv.
Файл
Конечный результат:
010466010514027621)ZPTsFWoUgqe,91009492ZCUruNv8/rQRlZyH/mZhkRY11D5aW4aLjpVn3DVxFIi7l9gV/pvguWxiVnpTRI0SFkNx1dPavcQYjiQ6DCSnNw==
Не могу сформировать в голове структуру этого кода.
Начал изучать библиотеки для работы с пдф файлами, конкретно PyPDF2 но столкнулся с проблемой. PyPDF2 не находит в файле абсолютно ничего. Пытался найти последовательность в коде пдф файла но ничего не понял.
Помогите разобраться с любым фрагментом этого кода(кроме записи в csv).
Может получится вытянуть из пдф информацию и без рендеринга в изображение так как большие объемы кодов и скорость кода играет роль.
Если есть люди знающие структуру пдф подскажите, получится ли вытянуть местоположение каждого пикселя(черного квадратика) datamatrix кода и получится ли все это перевести в конечный вид.
Буду благодарен за любую информацию. Спасибо.