Нечеткий поиск + части речи...
Это совокупность методов для кластеризации данных на основе выбранных правил.
Самый простой вариант (в плане реализации) - это вхождение корней в текст новости с проверкой через regex-выражения... (но и самый неудачный)