Задать вопрос

Почему на rutracker.org не удается спарсить результаты поиска по разделу?

Например вот такой поиск rutracker.org/forum/tracker.php?f=189. Парсинг через curl. Я могу получить первую страницу результатов отдельно. Могу получить любую другую страницу результатов (3, 7-ю и т.п.), но только отдельно. Когда я начинаю брать их подряд, через любой таймаут, то корректно возвращается только первая страница в очереди, а потом все время сбрасывает на первую страницу результатов поиска.

Не пойму в чем причина. По идее что-то не так в curl. Перепробовал все варианты и виды настроек curl. Пролистал весь github по слову rutracker.

Все сделано как у всех и все равно никак.

П.С.
Разумеется все в порядке с простыми вещами типа авторизации, куками, search_id и т.п.

В чем может быть причина?
  • Вопрос задан
  • 4178 просмотров
Подписаться 3 Оценить 3 комментария
Решения вопроса 1
alekseysolo
@alekseysolo Автор вопроса
Приношу всем извинения, проблема решилась банальным html_entity_decode. В ссылке на следующую страницу амперсанд был прописан как &
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
Курл инициализируйте только раз. А дальше только давайте ексек на получение нужного урла.

А вообще, советую использовать pear http client. С ним это займет несколько строчек. И никаких заморочек с кукисами.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы