Как парсить html, который постоянно видоизменяется/морфируется (структура, теги, классы и т.д.) при каждом запросе?

Question

Валентин @ValentinWebStd

веб мастер

Как парсить html, который постоянно видоизменяется/морфируется (структура, теги, классы и т.д.) при каждом запросе?

Например:

<div class="DFsfE5qr">
	<div class="etgF_2">UAH 300</div>
	<div class="etgFsdf">USB фонарик</div>
</div>

Может быть так:

<div class="DFghrtqr">
	<div></div>
	<div class="eerg_2">UAH 300</div>
	<div class="etergf">USB фонарик</div>
</div>

Может быть и так:

<span class="grr">
	<span class="grs56-rg">
		<div class="grs56-rg">
			<div class="eegrdfg"><span class="dsf">UAH</span>300</div>
			<div class="ekdf">USB фонарик</div>
		</div>
	</span>
</span>

Вопрос задан более трёх лет назад
704 просмотра

2 комментария

Подписаться 3 Простой 2 комментария

Помогут разобраться в теме Все курсы

Яндекс Практикум

Профессиональная вёрстка на HTML и CSS

3 месяца

Далее
Stepik

Основы HTML и CSS

2 недели

Далее
Бруноям

Вёрстка на HTML и CSS

3 месяца

Далее

Пригласить эксперта

Ответы на вопрос 2

8 комментариев

Валентин @ValentinWebStd Автор вопроса

ID тоже может меняться?? что такое НС??

Написано более трёх лет назад
xmoonlight @xmoonlight

Валентин, НС - это нейросеть.
ID - это не HTML-ный DOM ID!
Это та "опора", по которой Вы ищите нужное поле.
Например, текст (НЕ ТЕГИ!), идущий за "UAH" в виде цирфы - это есть цена.
Цепочка - это поле цены.
И т.д.

Написано более трёх лет назад
AWEme @AWEme

xmoonlight, разбирать html с помощью нейросетей? Это шутка какая-то?

Написано более трёх лет назад
xmoonlight @xmoonlight

AWEme, к сожалению, это уже реальность...

Написано более трёх лет назад
AWEme @AWEme

xmoonlight, нет, это шиза.

Написано более трёх лет назад
xmoonlight @xmoonlight

AWEme, почему? как тогда находить инфу в динамической разметке?

Написано более трёх лет назад
Валентин @ValentinWebStd Автор вопроса

xmoonlight, возможно регулярными выражениями специально сформированными?

Написано более трёх лет назад
xmoonlight @xmoonlight

Валентин, зачем?
1. Если переделают на сайте - регексы уже могут не срабатывать.
2. Зачем писать регексы заведомо зная, что они могут перестать работать?

Написано более трёх лет назад