Задать вопрос

Как на вебстранице найти предложения содержащие URL?

Задача такая: найти в html разметке все предложения, которые содержат хотя бы одну URLподобную подстроку.
url могут быть вида aaa.bbb....(/dir/page/?asdf) - для них подходит такое выражение \S*?\.([a-z.])+(/.*?\s)?) .
Разница между ссылками и не ссылками не важна, предложения могут содержать теги и пр.

Хочу понять, можно ли с помощью регулярных выражений (и без дополнительного кодирования на языке) реализовать такой алгоритм:
нахожу URL, например по указанному шаблону, затем делаю поиск назад до первого сочетания точки+пробельный символ и поиск вперед до такого же сочетания, и все что оказалось между этими позициями получаю в результат.
PS. Использую Python, но в подойдет любой совместимый движок.
  • Вопрос задан
  • 96 просмотров
Подписаться 1 Оценить Комментировать
Пригласить эксперта
Ответы на вопрос 1
@lyeskin
Вам нужно сделать регулярное выражение для "все что оказалось между" и обернуть его в скобки.
/\.\s(%ваша регулярка)\.\s/
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
Wanted. Санкт-Петербург
До 450 000 ₽
ПРОДИС.НДТ Малаховка, пгт
от 70 000 ₽
Wanted. Санкт-Петербург
До 120 000 ₽