Необходимо разработать анти спам для комментариев, машинное обучение не подходит, так как спам может быстро измениться и машина не успеет переучиться. Кто нибудь пробовал вычислять хеши текста, находить пересечение md5 между комментариями, бить слова на суммы хешей и с ними оперировать?
Какие правила использовали?
По поводу ссылок и телефонов - вопросов нет, с ними проще.