@ValentinWebStd
веб мастер

Как парсить html, который постоянно видоизменяется/морфируется (структура, теги, классы и т.д.) при каждом запросе?

Например:
<div class="DFsfE5qr">
	<div class="etgF_2">UAH 300</div>
	<div class="etgFsdf">USB фонарик</div>
</div>


Может быть так:
<div class="DFghrtqr">
	<div></div>
	<div class="eerg_2">UAH 300</div>
	<div class="etergf">USB фонарик</div>
</div>


Может быть и так:
<span class="grr">
	<span class="grs56-rg">
		<div class="grs56-rg">
			<div class="eegrdfg"><span class="dsf">UAH</span>300</div>
			<div class="ekdf">USB фонарик</div>
		</div>
	</span>
</span>
  • Вопрос задан
  • 658 просмотров
Пригласить эксперта
Ответы на вопрос 2
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
1. То, что постоянно - то есть ID.
2. По структуре ID - делаем НС.
3. По НС - получаем поля.
4. GOTO 3
Ответ написан
on1k
@on1k
Ищи по структуре html, а не по названиям классов, если конечно структура документа не меняется.
XPath хорошо с этим справляется.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы