Задать вопрос
tmman
@tmman
Обои из семерки наконец-то пригодились!

Curl: обращение к microsoft.com?

$userAgent = 'Mozilla/5.0 (Windows NT 5.1; rv:31.0) Gecko/20100101 Firefox/31.0';
    
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);    
    curl_setopt($ch, CURLOPT_NOBODY, 1);// 
    curl_setopt($ch, CURLOPT_HEADER, 1);// 
    curl_setopt($ch, CURLOPT_MAXREDIRS, $max_redirects); // установим максимальное число возможных редиректов на 10
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true); //следовать редиректам
    curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); //
    curl_setopt($ch, CURLOPT_USERAGENT, $userAgent ); // прикинемся не курлом, а файерфоксом
    curl_exec($ch);


Вот так обращение к www.microsoft.com/ru-ru/DigitalLiteracy/curriculum... завершается ошибкой 503 (получаю только заголовок). Подменил user agent. Грешу на доп параметры curl. Что еще надо указать, чтобы страница отдавалась нормально как браузеру (с кодом 200)?
  • Вопрос задан
  • 131 просмотр
Подписаться 1 Оценить Комментировать
Решения вопроса 1
tmman
@tmman Автор вопроса
Обои из семерки наконец-то пригодились!
curl_setopt($ch, CURLOPT_NOBODY, 1);

Нужно читать все тело. В противном случае их сайт отдает ошибку 503
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
@vladimirkostenko96
Нужно добавить все заголовки

accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
accept-encoding: gzip, deflate, sdch, br
accept-language: en-US,en;q=0.8
cookie: ....
и т.д.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы