dim137
@dim137
python, django, linux

Как парсить сайт с помощью python библиотеки grab, если сайт отдает html яваскриптом?

Знаю, что для таких целей можно использовать selenium в связке с phantomjs, но как это можно сделать через питон библиотеку grab?

Вот, что я получаю при запросе через grab
<!DOCTYPE html>
<!-- The line above switches the browser into standard mode, see also
http://en.wikipedia.org/wiki/Internet_Explorer_box_model_bug
http://en.wikipedia.org/wiki/Document_type_declaration

This line must be the first in the data stream that is sent to the browser. Add
onload="alert('mode: ' + document.compatMode);"
to the body tag to see which mode the browser has chosen. If the output is "BackCompat" then
some other part of the server system might have added code in front of this file rendering
the DOCTYPE setting useless. Check with "View page source" or such in the browser.
-->
<html>
  <head>
    <meta Http-Equiv="X-UA-Compatible" Content="IE=Edge">
    <title>NOP Network Operations Portal</title>
    <meta Http-Equiv="Cache-Control" Content="no-cache">
    <meta Http-Equiv="Pragma" Content="no-cache">
    <meta Http-Equiv="Expires" Content="0">
  </head>
  <!-- 964px is the width of the header image,
         margin: 0 auto; centers on Firefox,
         text-align: center; centers on IEx7 -->
  <body id="main" style="margin: 0 auto; width: 964px; background: #C5CDD7; text-align: center;">
    <script language='javascript' src='/PORTAL/gateway/spec/PORTAL.20.0.0.4.51/gwt/MainPages/MainPages.nocache.js'></script>
    <iframe src="javascript:''" id="__gwt_historyFrame" style="position:absolute;width:0;height:0;border:0"></iframe>
  </body>
</html>
  • Вопрос задан
  • 1017 просмотров
Пригласить эксперта
Ответы на вопрос 2
@asd111
Chrome F12 Network и смотрите какие запросы куда идут. Потом повторяете те же самые запросы с помощью библиотеки grab и получаете нужные ответы.
Ответ написан
@shamanovski
Используй dryscrape модуль ( работает только на Unix системах )
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
22 нояб. 2024, в 08:04
1 руб./за проект
22 нояб. 2024, в 06:06
1500 руб./в час
22 нояб. 2024, в 06:04
1 руб./за проект