PankovAlxndr
@PankovAlxndr
Fullstack web developer

Как спарсить сайт bankrot.fedresurs.ru, когда там нет HTML сразу?

Здравтсвуйте, стоит задача прасинга инфы с сайта https://bankrot.fedresurs.ru/Messages.aspx?attempt=1
но дело в том, что при первом запросе он не отдает мне HTML страницы, а что-то происходит на JS
пишет set-cookie...

Подскажите как можно это обойти или победить и получить заветную HTML страничку ?
только на языке PHP, тк нет в распоряжении других серверов

делаю запрос чрез CURL и поулчаю всегда такое

<html>
<body>setting cookie...
<script type="text/javascript" src="/aes.min.js"></script>
<script>function toNumbers(d) {
        var e = [];
        d.replace(/(..)/g, function (d) {
            e.push(parseInt(d, 16))
        });
        return e
    }

    function toHex() {
        for (var d = [], d = 1 == arguments.length && arguments[0].constructor == Array ? arguments[0] : arguments, e = "", f = 0; f < d.length; f++) e += (16 > d[f] ? "0" : "") + d[f].toString(16);
        return e.toLowerCase()
    }

    var a = toNumbers("21cdfcca194c84090a6245be8d6fd928"), b = toNumbers("0420670e09c2febaac26fce222a0bb8c"),
        c = toNumbers("c30e6d026f96e9c4ee1b05c5d36b67a2"), now = new Date(), time = now.getTime();
    time += 3600 * 1000;
    now.setTime(time);
    document.cookie = "bankrotcookie=" + toHex(slowAES.decrypt(c, 2, a, b)) + "; expires=" + now.toUTCString() + "; path=/";
    location.href = "https://bankrot.fedresurs.ru/Messages.aspx?attempt=2";</script>
</body>
</html>


как я вижу тут генерируются куки по определенным правилам, устанавливаются и делается редирект уже с куками, я могу как это проделать на php?
  • Вопрос задан
  • 1022 просмотра
Пригласить эксперта
Ответы на вопрос 1
@dimuska139
Backend developer
Selenium или Phantomjs. Лучше первое
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы