@nikita-slb

Почему при парсинге возвращается неактуальная версия страницы?

Парсю страницу сайта на которую добавляется информация постоянно примерно раз в минуту.

По какой причине при получении этой страницы средствами php я получаю ее устаревший вариант?

Пробовал и через curl и через file_get_contents, но получаю упорно старый вариант страницы, это видно по контенту.
Если зайти с браузера, то контент уже новый, а при получении средствами php старый, притом отставание больше часа...

У кого-нибудь есть идеи?
  • Вопрос задан
  • 221 просмотр
Решения вопроса 1
Нашёл у них страницу https://otvet.mail.ru/api/v2/questlist где в json хранятся и, что важно для вас, своевременно обновляются все вопросы.

То есть достаточно этого кода:
json_decode(file_get_contents('https://otvet.mail.ru/api/v2/questlist'), true)


И получите в массиве последние 100 записей
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
glebovgin
@glebovgin
Full Stack Web Developer
Можете попробовать использовать опцию:
curl_setopt($curl, CURLOPT_FRESH_CONNECT, TRUE);
что позволит всегда использовать новое соединение.
Если дело в кэше, то должно решить задачу.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы