Как на вебстранице найти предложения содержащие URL?

Задача такая: найти в html разметке все предложения, которые содержат хотя бы одну URLподобную подстроку.
url могут быть вида aaa.bbb....(/dir/page/?asdf) - для них подходит такое выражение \S*?\.([a-z.])+(/.*?\s)?) .
Разница между ссылками и не ссылками не важна, предложения могут содержать теги и пр.

Хочу понять, можно ли с помощью регулярных выражений (и без дополнительного кодирования на языке) реализовать такой алгоритм:
нахожу URL, например по указанному шаблону, затем делаю поиск назад до первого сочетания точки+пробельный символ и поиск вперед до такого же сочетания, и все что оказалось между этими позициями получаю в результат.
PS. Использую Python, но в подойдет любой совместимый движок.
  • Вопрос задан
  • 96 просмотров
Пригласить эксперта
Ответы на вопрос 1
@lyeskin
Вам нужно сделать регулярное выражение для "все что оказалось между" и обернуть его в скобки.
/\.\s(%ваша регулярка)\.\s/
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
Wanted. Санкт-Петербург
До 450 000 ₽
Wanted. Санкт-Петербург
До 100 000 ₽
Wanted. Санкт-Петербург
До 120 000 ₽
22 нояб. 2024, в 22:26
3500 руб./за проект
22 нояб. 2024, в 21:47
3000 руб./за проект
22 нояб. 2024, в 21:44
50000 руб./за проект