@bravecollector

Как извлечь URL с помощью XPath?

Всем привет.
Мне нужно вытащить http://site.ru/ из следующего кода:

<div class="one">
<dl>
<dt class="two">
<span class="name">Site</span>
</dt>
<dd class="three">
<span class="js-pseudo-link" data-url="rAnDoMlEtTeRsAnDnUmBeRs" style>
<a href="http://site.ru/" class rel="nofollow" target="_blank" style> http://site.ru/ </a>
</span>
</dd>
</dl>
</div>


Делаю так: //div//dl//dd//span//a/@href
Ничего не выходит.

С XPath знакомство начал недавно, т.ч. может вопрос очевидный, но толкового ответа не находил.
  • Вопрос задан
  • 104 просмотра
Решения вопроса 1
alekciy
@alekciy
Вёбных дел мастер
Делаю так: //div//dl//dd//span//a/@href

Для приведенного куска кода это работающее выражение. У вас в другом проблема. Вероятнее всего причина в том, что на сайте в исходном коде страницы нет этого кода и текст подтягивается через JS по AJAX. В этом случае стоит использовать selemiun web driver.
Ответ написан
Пригласить эксперта
Ответы на вопрос 2
Rsa97
@Rsa97
Для правильного вопроса надо знать половину ответа
Достаточно //a/@href
xpather.com/8rf5k32K
Ответ написан
@krypt3r
//div/dl/dd/span/a/@href
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы