Это если решение совсем примитивное. Если же проходить по тексту нечётким поиском и убирать слова с большим скоррингом, маленький скорринг игнорировать, а о часто возникающих словах со средним в текстах некоторого пользователя сигналить модераторам, то результат вполне действенный выходит.
Можно даже без звёздочек. Достаточно найти в таблице кодировки непечатаемые символы, диактрические знаки, символы или визуально похожие на кириллические аналоги.