Защита от XSS

Question

Степан Зубашев @faiwer

frontend-developer

XSS

Защита от XSS

Доброго времени суток. Написав систему комментариев, я всерьёз задумался о защите от XSS. Немного погуглив на эту тему мои глаза приняли такой вид «О_О». Что есть на данный момент:

1. Пишу на javascript, используя nodeJS
2. Текст полученный от браузера проходит следующие метаморфозы:

а) формируется DOM-древо (jsdom)
б) подключается jQuery
в) пробегаю $( '*' ) по каждому тегу и провожу его сквозь парсер. Повторяю пробеги до тех пор пока не искоренятся все проблемы, либо число пробегов превысит разумные нормы (в этом случае выкидываю ошибку).

Парсер тега работает примерно по такому принципу:

1) если тег не входит в список доступных пользователю тегов (i, b, s, strong, em, ul, ol, li, p, pre, span, br, img, a), заменяю его SPAN-тегом
2) пробегаюсь по всем атрибутам тега, удаляя все не доступные (оставил только width, height, src для image и href для a).
3) в годных атрибутах прохожусь регуляркой по значению ( .replace( /[^\d]+/, '' ) для width, height ).

Остаются такие аттрибуты как src и href. Я думал в них достаточно срезать начальную 'javasript:', но почитав эту статью, я понял, что нужно как то очень хитро подойти к этому вопросу.

Собственно вопросы:

1. Какие у описанной выше схемы есть изъяны? Что стоило бы добавить?
2. Каким образом фильтровать атрибуты вроде href и src

Интересует именно HTML, а не BB коды или другая разметка. + планирую эту наработку использовать не только в системе комментариев.

Вопрос задан более трёх лет назад
8636 просмотров

1 комментарий

Подписаться 17 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 5

3 комментария

Степан Зубашев @faiwer Автор вопроса

Спасибо за готовое решение, возьму на заметку, но в данный момент мне важнее понять и написать самому. Проект не коммерческий, а для личного профессионального роста, и моя задача самому пройти через все грабли, какие есть. Через 625 строк чужого искомый опыт получить, ИМХО, малореально :)

Написано более трёх лет назад
nekitosp @NekitoSP

Это же клиентская сторона… то есть плохие данные все же лучше отсеивать еще на сервере, и по возможности банить от этого нехороших пользователей =) иначе при глобальной смене шаблона сайта можно попросту забыть про эту библиотеку…

Написано более трёх лет назад
Степан Зубашев @faiwer Автор вопроса

NekitoSP, в моём случае никто не мешает запустить этот код на сервере :)

Написано более трёх лет назад

Комментировать

1 комментарий

3 комментария

nekitosp @NekitoSP

… будь то <а>...</а> мы удаляем
теги скушались…

Написано более трёх лет назад
Степан Зубашев @faiwer Автор вопроса

Вы правы, я действительно запутался.

1. Спасибо, *ушёл искать способы конвертации*

2. Я пропускаю html через DOM-древо, с которым в дальнейшем и работаю. Итоговый код получаю через .innerHTML. Я правильно понимаю — второй пункт могу игнорировать? Или такая схема может пропустить какую-нибудь не attr-based уязвимость? Просто в моей схеме отсутствует ручной парсинг HTML-строки вне конкретного тега. Насколько это безопасно?

3. Не могли бы привести пример ссылки, которая бы обошла /^javascript:/i, и при этом была бы опасной? Насколько я понимаю, если выполнить пункт первый выполнить всякие премудрости вроде java%бред-какойнибудь%scrIpt: отпадут сами собой?

Написано более трёх лет назад
nekitosp @NekitoSP

тогда последним пунктом скорее всего надо как-то декодированные данные из первого пункта вернуть на место… (то есть значения у параметров href, src, а так же текст внутри тегов, чтобы он нормально отобразился на странице)
3) вполне возможно что этот бред отпадет и можно будет нормально отсеять все javascript:, если оставить только a-zA-Z0-9а-яА-Я"':/ пример привести не могу — особо не в теме =) все что написано выше — лишь мой возможный ход действий в подобной ситуации.

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

XSS

Средний
Есть ли на сайте XSS уязвимость?
- 1 подписчик
- более года назад
- 120 просмотров
0

ответов
Информационная безопасность

+2 ещё

Средний
Есть ли здесь реальная reflected XSS или это false positive (безопасно ли включать URL запроса в код страницы)?
- 1 подписчик
- более двух лет назад
- 276 просмотров
2

ответа
PHP

+2 ещё

Сложный
Есть ли XSS уязвимости в самописном санитайзере?
- 1 подписчик
- более двух лет назад
- 188 просмотров
2

ответа
Spring

+1 ещё

Средний
Как предотвращать XSS в Spring?
- 1 подписчик
- более двух лет назад
- 144 просмотра
1

ответ
Django

+2 ещё

Простой
Уязвим ли плагин CKEditor в Django к XSS атакам?
- 1 подписчик
- более трёх лет назад
- 112 просмотров
2

ответа
JavaScript

+2 ещё

Простой
Как превратить HTML вместе с тегами в строку?
- 1 подписчик
- более трёх лет назад
- 254 просмотра
2

ответа
WebSocket

+1 ещё

Простой
Надо ли чистить данные, которые пришли от websocket?
- 1 подписчик
- более трёх лет назад
- 182 просмотра
1

ответ
JavaScript

+2 ещё

Средний
Что за скрипт и откуда он появился?
- 1 подписчик
- более трёх лет назад
- 277 просмотров
1

ответ
JavaScript

+2 ещё

Простой
Считается ли это xss (или другой) уязвимостью?
- 1 подписчик
- более трёх лет назад
- 183 просмотра
1

ответ
React

+1 ещё

Простой
Помогает ли библиотека dompurify предотвратить xss атаку когда используешь dangerouslySetInnerHTML?
- 1 подписчик
- более трёх лет назад
- 1465 просмотров
1

ответ
Показать ещё Загружается…

Большая просьба: перед тем как ответить «я использую эти 3 строчки кода» или «используй ~~силу, Люк~~белый список», или «нельзя парсить на javascript-е» — внимательно прочитайте топик-вопрос.

Answer 1 · 2012-01-04 19:21:31

Weageoo @Weageoo

Html sanitizer на js.

Ответ написан более трёх лет назад

3 комментария

Answer 2 · 2012-01-04 18:23:55

Если по «правильному», то защита от XSS сводиться к элементарной проверке входящих данных на сервере. Желательно использовать белый список.

Answer 3 · 2012-01-04 19:01:58

Только на javascript фильтровать нельзя, т.к. firebug`ом можно обойти.

Вообще, на стороне PHP есть хороший способ:

$find = array ('/data:/i', '/about:/i', '/vbscript:/i', '/onclick/i', '/onload/i', '/onunload/i', '/onabort/i', '/onerror/i', '/onblur/i', '/onchange/i', '/onfocus/i', '/onreset/i', '/onsubmit/i', '/ondblclick/i', '/onkeydown/i', '/onkeypress/i', '/onkeyup/i', '/onmousedown/i', '/onmouseup/i', '/onmouseover/i', '/onmouseout/i', '/onselect/i', '/javascript/i', '/javascript/i' );
$replace = array ("data:", "about:", "vbscript<b></b>:", "onclick", "onload", "onunload", "onabort", "onerror", "onblur", "onchange", "onfocus", "onreset", "onsubmit", "ondblclick", "onkeydown", "onkeypress", "onkeyup", "onmousedown", "onmouseup", "onmouseover", "onmouseout", "onselect", "javascript" );

$txt = preg_replace( $find, $replace, $txt );
$txt = preg_replace( "#<iframe#i", "<iframe", $txt );
$txt = preg_replace( "#<script#i", "<script", $txt );
$txt = str_replace( "<?", "<?", $txt );
$txt = str_replace( "?>", "?>", $txt );

Answer 4 · 2012-01-04 19:20:30

Прочитав статью с того сайта вы похоже до сих пор немного не разобрались как действовать. Моя идея фильтрации данных на стороне сервера такова:
1) для начала декодируем все данные, заменяя все подобные вещи

на нормальные символы, с которыми далее будем работать
3) далее при нахождении границ тега, будь то ... мы удаляем все непечатаемые(?) символы (в т.ч. и переносы строк) в параметрах тега а так же между открывающим и закрывающим. Проблема будет лишь с \0, но если работать с данными как с массивом символов, а не как со строкой — то наверное удастся их обойти.
3) затем работа с параметрами тега, соответственно убираем всё, что не является нормальным URL-адресом, и по возможности, избавляемся от тега, если вдруг URL «небезопасный» (безопасными URL я думаю стоит считать лишь те, которые начинаются с http:// или https://, ну и на крайний случай — ... в общем вам решать)

Answer 5 · 2018-07-12 00:53:08

https://www.owasp.org/index.php/XSS_(Cross_Site_Sc...
И на всякий случай после проверки исходников прогнать поверх сканером.
Например https://metascan.ru

Защита от XSS

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт