RomanticOS
@RomanticOS
webDeveloper

Не могу получить данные парсером с конкретного сайта, используя SimpleDomHTML PHP, но что не так?

Друзья, привет! Есть небольшая проблемка с получением данных с сайта. В общем открываю любой сайт, кроме этого "https://investmint.ru/", использую simplehtmldom. Можете попробовать этот код, подсказать способ получить хоть любые данные с этой страницы, просто уже ради интереса хочется понять что не так и получить результат.


include("simplehtmldom/simple_html_dom.php");
$url = "https://investmint.ru/";
//создаём DOM-объект
$html = new simple_html_dom();
$html->load_file($url);
echo $html;


У меня получается пустая страница (( Что не так? Но любой другой сайт, кроме "investmint.ru" открывается именно этим кодом. Спасибо!
  • Вопрос задан
  • 161 просмотр
Решения вопроса 1
Rsa97
@Rsa97
Для правильного вопроса надо знать половину ответа
Защита от ботов
spoiler
<html>
  <head>
    <script>
      function set_cookie () {
        var now = new Date()
        var time = now.getTime()
        time += 19360000 * 1000
        now.setTime(time)
        document.cookie = 'beget=begetok' + '; expires=' + now.toGMTString() + '; path=/'
      }
      set_cookie()
      location.reload()
    </script>
  </head>
  <body>
  </body>
</html>

То есть ставится кука и страница перезагружается. Сервер проверяет наличие куки и выдаёт полную страницу.
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
darakanoit
@darakanoit
Возможно сайт рисуется при помощи JS, тогда через php вы не сможете его увидеть(php не воспроизводит js), нужно что-то вроде "headless chrome selenium"(безголового хрома), покурите в эту сторону.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы