Самое простое решение поднять поисковой движок sphinx/lucene(elasticsearch, Solr) и индексировать все статьи, при добавлении новой статьи отправить в поисковик запрос указав поля тело = тело, заголовок=заголовок и смотреть на размер вхождений.
Высокое значение вхождений — Статья похожа