Готовых бесплатных решений вы вряд ли найдёте. Соответственно надо писать своё. Как писать - зависит от того какие именно объёмы данных надо обрабатывать, должна ли быть это пакетная обработка или потоковая, если второе, то какой уровень латентности требуется, какой именно подход к анализу текста вы собираетесь применять и т.д. и т.п.