В проекте (PHP) стоит задача извлекать данные (ФИО, телефон, почта, образование, опыт работы...) из русскоязычных файлов резюме. В идеале это должен быть парсер .doc, .pdf файлов в формат HR-XML. Рассматриваем варианты покупки или разработки. Поиск на эту тему дал несколько вариантов англоязычных парсеров (sovren, rchilli...). Русскоязычных найти не удалось.
Возможно, мы плохо искали и такой парсер есть? Если нет, возможно люди с опытом подобных разработок смогут что-то посоветовать?