Итак. Подведу итоги своих изысканий.
NLP — это не совсем то что нужно. Для частных случаешь работает прекрасно, но для разнообразного множества — не подходит.
Я выбрал направление машинного обучения.
В этом случае мне не придется самому создавать шаблоны, находить зависимости и т.д.
Поэтому записался на 2 курса в coursera.org:
Machine Learning —
www.coursera.org/course/ml
Web Intelligence and Big Data —
www.coursera.org/course/bigdata