@Herben

Не получается спарсить Google SafeBrowsing, что не так?

Хотел спарсить https://transparencyreport.google.com/safe-browsin..., сервис через который можно проверить домен или ссылку на бан от гугла,

но чтобы я не делал, я получал вывод "[]", даже user-agent добавил, думая, что сделал что-то не то, но когда я просто вывел весь код через этот же скрипт, я получил совсем другой код, не тот, что был при обычном инспектировании, открыв исходный код в браузере я понял почему,

проще говоря через инспект одно, через исходный код другое

import requests
from bs4 import BeautifulSoup

url = 'https://transparencyreport.google.com/safe-browsing/search?url=discord-free.com'
headers = {
        'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.9; rv:45.0) Gecko/20100101 Firefox/45.0'
      }
page = requests.get(url, headers = headers)

soup = BeautifulSoup(page.text, "html.parser")
data = soup.findAll(class_='material-icons ng-star-inserted')

print(data)


6251c0178e47a475352641.png
Выше инспектирование где всё есть
6251c06db3e67868614170.png
Ниже исходный, именно его скрипт читает и ничего не находит
6251c5c1179ab019446360.png

Можно ли как-то спарсить это?
За ранее спасибо!
  • Вопрос задан
  • 149 просмотров
Решения вопроса 1
nokimaro
@nokimaro
Меня невозможно остановить, если я смогу начать.
потому-что парсить надо на страницу, а XHR-запрос который выполняется при загрузке страницы
https://transparencyreport.google.com/transparencyreport/api/v3/safebrowsing/status?site=discord-free.com


почему бы не воспользоваться официальным api?
https://developers.google.com/safe-browsing/v4/loo...
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы