есть технология ABBYY Compreno, которая как раз специализируется на анализе текста. У неё есть API, выдающий в ответ не особо сложный XML.
https://www.abbyy.com/ru-ru/isearch/compreno/
Можно поспрашать у них, глядишь не придётся велосипед изобретать. Только возможно это будет стоить денюжку. Но за спрос-то, денег не берут)