Пытаюсь парсить интернет-магазин помощью sipmle html dom. В некоторых категориях большое количество товаров, на одну страницу не влезает. Поэтому товары отображаются на несколькиз по 30 штук.
К примеру, первая страница имеет URL
*/catalogue/2119/;
Вторая имеет URL
*/catalogue/2119/?SECTION_ID=2119&PAGEN_20=2.
В результате, парсится всегда вместо нужной страницы первая (т.е
*/catalogue/2119/).
Ни у кого нед предположений, почему это может быть? И как от этого избавиться?
Добавляю исходный код:
<?php
include_once 'simple_html_dom.php';
$url='http://www.felix.ru/catalogue/4675/';
$html = new simple_html_dom();
$html2 = new simple_html_dom();
$html -> load_file($url);
foreach ($html -> find('div.Pages a[!class]') as $a3) {
$step4 = 'http://www.felix.ru' . $a3->href;
$html2 -> load_file($step4);
echo $step4 . '<br>';
foreach ($html2 -> find('a.ItemLink') as $a4) {
echo '------' . $a4->href . '<br>';
$step5 = $url . $a4->href;
}
}
$time2 = time()-$time1;
Сейчас отдельно сделал парсинг нужной страницы, на удивление все работает. Это меня еще больше запутало.
<?php
include_once 'simple_html_dom.php';
$url='http://www.felix.ru/catalogue/4675/?SECTION_ID=4675&PAGEN_24=4';
$html = new simple_html_dom();
$html -> load_file($url);
foreach ($html -> find('a.ItemLink') as $a4) {
echo '------' . $a4->href . '<br>';
$step5 = $url . $a4->href;
}