Задать вопрос
@nikit0zzz

Скачать страницу сайта, требует JS?

Подскажите в каком направлении двигаться, нужно скачать страницу, но при скачивании wget`ом выдает такую вещь:

<html>
<head>
<meta http-equiv="Content-Type" content="text/html; " />
<script>
    document.cookie='_ddn_intercept_2_=183a18e779c8a3f5fce99745e69c59e7; max-age=604800; path=/';
    var nc = function() {return document.cookie.indexOf('_ddn_intercept_2_=183a18e779c8a3f5fce99745e69c59e7')==-1;};
    var w = function() {document.body.innerHTML = document.getElementsByTagName('noscript')[0].textContent;};
    if (!window.opera) {
        if (!nc()) {window.location.reload(true);}
        var r = function() {if (nc()) w();};
    } else {
        var r = function () {
            if (!nc()) {window.location.reload(true);}
            else {w();}
        }
    }
</script>
</head>
<body onload="r()">
<noscript>You have to turn on javascript and cookies support in browser to visit this site.<br/>
Для посещения этого сайта необходима поддержка javacript и cookies Вашим браузером<br/>
<a href="http://ddos-guard.net">ddos-guard.net</a>
</noscript>
</body>
</html>


Как это можно обойти в wget или python скриптом?
  • Вопрос задан
  • 1138 просмотров
Подписаться 2 Оценить Комментировать
Пригласить эксперта
Ответы на вопрос 2
@Beltoev
Живу в своё удовольствие
Можно эмулировать браузер с помощью Selenium:
from selenium import webdriver
browser = webdriver.Firefox()
browser.get(raw_input("адрес страницы"))
html_text = browser.page_source # нужный текст
Ответ написан
document.cookie='_ddn_intercept_2_=183a18e779c8a3f5fce99745e69c59e7; max-age=604800; path=/';
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы