Задать вопрос
@xuxubla

Как парсить страницу, с URL на основе запроса?

Пытаюсь парсить интернет-магазин помощью sipmle html dom. В некоторых категориях большое количество товаров, на одну страницу не влезает. Поэтому товары отображаются на несколькиз по 30 штук.
К примеру, первая страница имеет URL */catalogue/2119/;
Вторая имеет URL */catalogue/2119/?SECTION_ID=2119&PAGEN_20=2.
В результате, парсится всегда вместо нужной страницы первая (т.е */catalogue/2119/).
Ни у кого нед предположений, почему это может быть? И как от этого избавиться?

Добавляю исходный код:
<?php
include_once 'simple_html_dom.php';
$url='http://www.felix.ru/catalogue/4675/';
$html = new simple_html_dom();
$html2 = new simple_html_dom();
$html -> load_file($url);
foreach ($html -> find('div.Pages a[!class]') as $a3) {
                        $step4 = 'http://www.felix.ru' . $a3->href;
                        $html2 -> load_file($step4);
                        echo $step4 . '<br>';
                        foreach ($html2 -> find('a.ItemLink') as $a4) {
                            echo '------' . $a4->href . '<br>';
                            $step5 = $url . $a4->href;
                        }
}
$time2 = time()-$time1;


Сейчас отдельно сделал парсинг нужной страницы, на удивление все работает. Это меня еще больше запутало.
<?php
include_once 'simple_html_dom.php';
$url='http://www.felix.ru/catalogue/4675/?SECTION_ID=4675&PAGEN_24=4';
$html = new simple_html_dom();
$html -> load_file($url);
foreach ($html -> find('a.ItemLink') as $a4) {
    echo '------' . $a4->href . '<br>';
    $step5 = $url . $a4->href;
}
  • Вопрос задан
  • 1511 просмотров
Подписаться 1 Оценить Комментировать
Пригласить эксперта
Ответы на вопрос 2
viktorvsk
@viktorvsk
Потому что парсер сам не умеет догадываться, что нужно по страницам переходить?)
Где код ?
Ответ написан
Mike77
@Mike77
lamp sf2 yii разработчик
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы