@Denaka

При парсинге получаю не html код, а какой-то скрипт, из-за этого не могу разпарсить, Что делать?

Привет, есть сайт https://www.fractal.is/milliononmars/798973bf-2533...

хочу разпарсить карточки продаж, но не могу так как получаю скрипт вместо html кода, как можно обойти ил придумать что-то, извините за такой вопрос - новичек. Вот скрипт :

from unittest import result
import requests
from bs4 import BeautifulSoup

headers = {
	"User-Agent": "#"
}

r = requests.get("https://www.fractal.is/milliononmars/798973bf-2533-4f29-89d8-d7320c6dcdb6?orderByDirection=DESCENDING&orderByField=DATE", headers=headers)
s = BeautifulSoup(r.text, "lxml")

result = s.find("div", class_="MuiGrid-root MuiGrid-item MuiGrid-grid-xs-6 MuiGrid-grid-md-4 MuiGrid-grid-lg-3 MuiGrid-grid-xl-2 css-lnd6ju")
  • Вопрос задан
  • 98 просмотров
Пригласить эксперта
Ответы на вопрос 1
AlexNest
@AlexNest Куратор тега Python
Работаю с Python/Django
Сайт написан с использованием одного из JS-фреймворков.
Если вкратце проблема парсинга таких сайтов в том, что в ответ на запрос передается не готовый html, "собранный" на сервере а код на JS, который в итоге и отрисовывает html на стороне клиента.
Поскольку в requests/BS, в отличии от бразуера, нет среды выполнения js, то и приходит голый js.
Единственный вариант - переехать на selenium
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
SpectrumData Екатеринбург
от 150 000 до 250 000 ₽
Сбер Москва
от 200 000 до 300 000 ₽
09 авг. 2022, в 07:19
2000 руб./за проект
09 авг. 2022, в 07:17
5000 руб./за проект
09 авг. 2022, в 04:30
3000 руб./за проект