@Nurshat

Как спарсить сообщение с форума?

Появилась необходимость парсить сообщения с одного форума, и вслед за задачей появилась проблема, дело в том что сообщение в форуме может строится следующим образом:
<div class="сообщение">

<div class="цитата">цитата</div>
комментарий к цитате 
<div class="цитата">цитата 2</div>
комментарий к цитате 2
<img src="картинка">
комментарий к картинке

</div>


в самом парсинге проблем нет, проблема в сохранении порядка элементов. Так вот как это добро парсить так чтоб можно было сохранить порядок элементов?
Для парсинга использую simple html dom.

Объясню немного:
Если я напишу просто $html->find(".сообщение")->plaintext; то в качестве ответа получу "комментарий к цитате комментарий к цитате 2 комментарий к картинке" - то есть не будет понятно какой из комментариев к какой цитате относится.
  • Вопрос задан
  • 246 просмотров
Пригласить эксперта
Ответы на вопрос 1
AlexXYZ
@AlexXYZ
O Keep Clear O
Сразу брать plaintext неправильно. Вместо plaintext надо воспользоваться children(), чтобы получить набор потомков. Потом пройтись по ним циклом. Если встретился div, то предполагаем, что это сообщение. Если следующий элемент - текст, то это уже комментарий к сообщению.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы