arselongo
@arselongo
Python Django html css

Скан datamatrix из пдф и сейв в csv?

Задача:
Сканировать datamatrix коды из файла пдф и сохранять их в csv.

Файл

Конечный результат:
010466010514027621)ZPTsFWoUgqe,91009492ZCUruNv8/rQRlZyH/mZhkRY11D5aW4aLjpVn3DVxFIi7l9gV/pvguWxiVnpTRI0SFkNx1dPavcQYjiQ6DCSnNw==

Не могу сформировать в голове структуру этого кода.

Начал изучать библиотеки для работы с пдф файлами, конкретно PyPDF2 но столкнулся с проблемой. PyPDF2 не находит в файле абсолютно ничего. Пытался найти последовательность в коде пдф файла но ничего не понял.

Помогите разобраться с любым фрагментом этого кода(кроме записи в csv).
Может получится вытянуть из пдф информацию и без рендеринга в изображение так как большие объемы кодов и скорость кода играет роль.

Если есть люди знающие структуру пдф подскажите, получится ли вытянуть местоположение каждого пикселя(черного квадратика) datamatrix кода и получится ли все это перевести в конечный вид.

Буду благодарен за любую информацию. Спасибо.
  • Вопрос задан
  • 388 просмотров
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы