Несовсем понятно к каким именно цифрам вы хотите/должны извлечённую информацию превести.
В общем задача похожа на проблемы которые решает NER
https://en.wikipedia.org/wiki/Named-entity_recognition
Изветные инструменты:
https://en.wikipedia.org/wiki/OpenNLP
nlp.stanford.edu/software/CRF-NER.shtml
https://en.wikipedia.org/wiki/General_Architecture...
https://ru.wikipedia.org/wiki/UIMA
Могу представить, что UIMA это чего вам более чем хватит.