@demon123
developer

Как распарсить xml в java object, который сгенерирован abbyy ocr sdk?

Здравствуйте, вопрос заключается в следующем, мне нужно распарсить xml который сгенерирован ocr sdk по команде:
java TestApp recognize test.pdf result.xml --lang=russian


И из xml вытащить нужную информацию, не всю, а например мне надо узнать информацию из документа какой банк является получателем(в примере это АО "Народный банк казахстана'). Пытался определять по координатам(bottom, right, left, top), но погрешность очень большая, потому-что документ может от сканирован не ровно или не так.

Возможно ли это сделать?

ссылка на полученный xml: https://www.dropbox.com/s/iofy6i4xjesrsyj/result.x...
ссылка на pdf: https://www.dropbox.com/s/girz3it2ntt10fm/test.pdf?dl=0
  • Вопрос задан
  • 193 просмотра
Пригласить эксперта
Ответы на вопрос 1
@coden55
Банк получатель можно искать по БИК (он всегда одной длины) и по нему уже определять наименование банка из бд
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы