@Ic2d
Самоучка:)

Как парсить сайт, который защищен от парсинга с помощью PHP?

Раньше висел парсер на сайте, который успешно работал. Последнее время смотрю что тишина, открываю, а там все логи в ошибках 403.
Попробовал разные методы найденные в гугл, выдает или ошибку 403, или "Пожалуйста подождите пока мы проверяем ваш браузер"...
Сейчас использую такой код, но он не работает...
<?php
$url = 'https://www.osta.ee/ru/zavershajutsja';
$options = [
  'http'=> [
    'user_agent' => 'Mozilla/5.0 (Windows NT 10.0; rv:78.0) Gecko/20100101 Firefox/78.0',
    'protocol' => 1.1,
    'header' => [
        'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
        'Accept-Language: ru-RU,ru;q=0.8,en-US;q=0.5,en;q=0.3',
        'Upgrade-Insecure-Requests: 1',
        'Host: www.osta.ee',
    ]
  ]
];
$context = stream_context_create($options);
$html = file_get_contents($url, false, $context);
?>
  • Вопрос задан
  • 193 просмотра
Пригласить эксперта
Ответы на вопрос 3
@zkrvndm
Софт для автоматизации
Прекрасно все открывает, пробовал с других стран, все открывает. Если у вас не так, вам надо использовать прокси, видимо ip адрес вашего сайта в бане.
Ответ написан
ThunderCat
@ThunderCat Куратор тега PHP
{PHP, MySql, HTML, JS, CSS} developer
открыть браузером, посмотреть заголовки, перенести в код.
Ответ написан
coderisimo
@coderisimo
Можно попробовать безголовые браузеры
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы