Задать вопрос
L0k1
@L0k1

Regex — как выбрать текст вне html тегов?

Ребята! Есть некая строка, которая может содержать любой html код. Мне нужно все двойные кавычки заменить на &.quot;, но естественно оставить те, которые могут быть внутри тегов. Танцую над регуляркой и у меня ничего не выходит

вот пример текста:
""<p>"Lorem<span style="color: rgb(51, 51, 102); font-family: arial, helvetica, sans-serif; font-size: 15px;">&amp;#34;</span>ipsum dolor sit amet, consectetur adipiscing elit. Aenean euismod bibendum laoreet. Proin gravida dolor sit amet lacus accumsan et vive@@@""""'''rra justo commodo. Proin sodales pulvinar tempor. Cum sociis natoque penatibus et magnis dis parturient montes mus.</p>


я двигался в сторону определения тегов - /(<[^>]*>)/g
и по логике /(?!<[^>]*>)/g - вот так должно было быть все, за исключением тегов, но чето оно не работает.

Может кто сталкивался, камрады?
  • Вопрос задан
  • 703 просмотра
Подписаться 2 Оценить Комментировать
Пригласить эксперта
Ответы на вопрос 1
@tommy_13
замени кавычки в атрибутах на одинарные, потом замени двойные на сущности, и одинарные на двойные
действия в итоге три, но проще
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы