Как лучше всего очищать пользовательский html?
делаю так:
1. Удаляю все теги, кроме разрешенных
2. Удаляю атрибуты рег. выражением: ~\s*(on*).*\=.*\".*\"~is
что посоветуете? и на сколько убожественно рег. выражение?
Потому что основная идея идет как раз в создании невалидного html, для использования в своих целях. Регулярными выражениями можно уверено контролировать только "хороший" html код.