Очистка html атрибутов

Здравствуйте!

Как лучше всего очищать пользовательский html?
делаю так:
1. Удаляю все теги, кроме разрешенных
2. Удаляю атрибуты рег. выражением:
~\s*(on*).*\=.*\".*\"~is

что посоветуете? и на сколько убожественно рег. выражение?
  • Вопрос задан
  • 2991 просмотр
Решения вопроса 1
rdifb0
@rdifb0
Программист, реалист
HTML Purifier или аналоги. Либо навелосипедить пересбор дерева с помощью DOMDocument. Регулярные выражение не подойдут - беспомощны в случае XSS.
Ответ написан
Пригласить эксперта
Ответы на вопрос 2
Почему с аттрибутами не поступить так же - удалить все, кроме разрешенных, а разрешенные проверять на валидность?
Ответ написан
Alexufo
@Alexufo
противоречивый, сложный, весь компьютерный.
посмотрите в tinymce код регулярок. Там на счет этого настраивается все что душе угодно. Отличный визуальник.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы