Задать вопрос

artr_lr @artr_lr

регулярные-выражения

Регулярные выражения

Парсинг html-кода с помощью regexp?

Приходят данные в виде строки, которые представляют из себя html-код (довольно большой).
Как из этой строки извлечь содержимое например блока <div class="content"></div> ?
Первое пришедшее решение было типо такого /(<div class="content">)([\s\S]*?)<\/div>/ .
Но оно берёт и сам тэг и не работает если в блоке есть другие блоки-дивы! Идея с ленивыми/жадными квантификаторами как-то не выглядит хорошей. В первом случае будет браться до самого последнего закрывающего дива, во втором до первого же... А как сделать, чтобы учитывались внутренние блоки и не бралась основная обёртка?

Вопрос задан более трёх лет назад
1480 просмотров

1 комментарий

Подписаться 1 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

ProductStar × РБК

Профессия: Java-разработчик + ИИ

9 месяцев

Далее
Stepik

Поколение Python: курс для профессионалов

1 неделя

Далее
Хекслет

Java-разработчик

10 месяцев

Далее

Решения вопроса 1

DevMan

DevMan @DevMan

для пасинга html давно придуманы dom-парсеры.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий

Пригласить эксперта

Ответы на вопрос 1

Roman K @deliro

YOU CAN'T PARSE HTML WITH REGEX

Большие файлы парсятся SAX парсерами. Но реально большие, а не 5мб страничка.

Ответ написан более трёх лет назад

Комментировать

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+1 ещё

Средний
Почему некорректно работает регулярное выражение в PHP?
- 1 подписчик
- 06 окт. 2025
- 344 просмотра
3

ответа
Регулярные выражения

+1 ещё

Простой
Как убрать все точки из текстового файла с помощью регулярных выражений в Notepad++?
- 1 подписчик
- 03 сент. 2025
- 294 просмотра
1

ответ
Регулярные выражения

+1 ещё

Средний
Почему один регэксп работает, а второй нет?
- 1 подписчик
- 03 сент. 2025
- 320 просмотров
4

ответа
Регулярные выражения

Простой
Как работает ленивость в регулярных выражениях?
- 2 подписчика
- 31 авг. 2025
- 270 просмотров
2

ответа
Регулярные выражения

Простой
Как удалить часть слов?
- 1 подписчик
- более года назад
- 268 просмотров
1

ответ
Регулярные выражения

Простой
Как оставить в строке при помощи регулярки (+еще)?
- 1 подписчик
- более года назад
- 176 просмотров
1

ответ
PHP

+1 ещё

Простой
Как в PHP найти строку, которая содержит или не содержит символ?
- 1 подписчик
- более года назад
- 283 просмотра
2

ответа
Регулярные выражения

+1 ещё

Средний
Как сделать замену текста по ssh?
- 1 подписчик
- более года назад
- 191 просмотр
0

ответов
ВКонтакте

+1 ещё

Простой
Как с помощью регулярного выражения получить oid и id видео из ссылки?
- 1 подписчик
- более года назад
- 173 просмотра
2

ответа
Регулярные выражения

Простой
Как захватить элементы по отдельности?
- 2 подписчика
- более года назад
- 327 просмотров
2

ответа
Показать ещё Загружается…