Подскажите как эффективнее сделать фильтр мата — чтобы поменьше ему уделять ручного внимания, но и качество фильтрации было одно из лучших. В распоряжении есть СУБД с полнотекстовым поиском.
Как я понял — варианта по сути два: 1. Список запрещенных слов и список исключений для тупого сравнения слов целиком 2. Нечеткий поиск
Первый наверняка довольно затратен по ведению, второй скорее всего будет промахиваться в случаях типа «три рубля» или «подстрахуй», что в принципе можно вылечить одним списком исключений.
У меня на нескольких проектах используется вот это: sourceforge.net/projects/php-matotest/files/php-matotest/1.0/
Уже давно и довольно неплохо работает, правда я словари уже давно переделал под себя, в связи со спецификой, но, для начала это взять вполне можно :)
Да, в SMF, к примеру. Он opensourse, можете покопаться. Там как раз реализован фильтр замены мата на любое слово. Например, бывает так: подстра<цензура>!