@Senseich

Как отобрать только нужные ссылки из html кода?

Всем привет!

Возможно ли с помощью регулярного выражения удалить всё лишнее, кроме нужных ссылок заключенных в тэги.

Например, есть такой html код:
<Лишний код>
<Лишний код>
<h2 itemprop="name"><a href="https://site.ru/1page.html">Page1</a></h2>
<Лишний код>
<Лишний код>
<Лишний код>
<h2 itemprop="name"><a href="https://site.ru/2page.html">Page2</a></h2>
<Лишний код>
<Лишний код>

Мне необходимо оставить только ссылки:
<h2 itemprop="name"><a href="https://site.ru/1page.html">Page1</a></h2>
<h2 itemprop="name"><a href="https://site.ru/2page.html">Page2</a></h2>
  • Вопрос задан
  • 201 просмотр
Решения вопроса 1
@dodo512
https://regex101.com/r/7p9ffF/1
Find: .*?(<h2 itemprop="name">\s*<a.*?</h2>|$)
Replace: $1
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы