Задать вопрос

Tester_Maxno

Григорий Маханько @Tester_Maxno

парсинг

Парсинг

Не цепляется к тегам, классу. Первый запрос на HTML выдает не весь код, тег body остаётся скрыт, как туда пробраться и в этом ли проблема?

Доброе утро всем! Столкнулся с такой задачей: нужно спрасить с сайта инфу, при попытках прицепиться к тегам и классам выдаёт ровным счетом ноль. Если сделать первый запрос на html страницу или сохранив страницу сайта в html, обнаружил, что страница приходит на вся, всё что в теге body скрыто, может быть в этом проблема, если да то как решить? Сайт: https://www.whitegoods.ru/

Для начала мне нужно забрать ссылку на категорию и название этой категории

Код:
from cgitb import html
import requests
from bs4 import BeautifulSoup
from fake_useragent import UserAgent

head = {
"Accept": "*/*",
"User-Agent": 'UserAgent().random'
}
url = "https://www.whitegoods.ru"

def get_html(url, params = ''):
r = requests.get(url, headers = head)
return r

def get_content(html):
soup = BeautifulSoup(html, 'html.parser')
items = soup.find('a', class_= 'maincat__title')

print(items)

def parse():
html = get_html(url)
get_content(html.text)
print(html.text)

parse()

Что делаю не так? Как собрать правильную функцию?

Вопрос задан более трёх лет назад
59 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Skillfactory

Профессия Python-разработчик PRO

12 месяцев

Далее
Stepik

Парсинг на Python для начинающих

2 недели

Далее
OTUS

iOS Developer

12 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Tester_Maxno

Григорий Маханько @Tester_Maxno Автор вопроса

В документации к beautifullsoup есть

, но я не понимаю где применить, после попытки

, в ответ приходит не полная html страница

Ответ написан более трёх лет назад

Комментировать

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Парсинг

Средний
Вся сложность парсинга Авито. Как это сделать правильно?
- 1 подписчик
- 26 нояб.
- 194 просмотра
1

ответ
Telegram

+1 ещё

Простой
Как спарсить подписчиков своего телеграм канала?
- 2 подписчика
- 20 нояб.
- 424 просмотра
2

ответа
Веб-разработка

+1 ещё

Простой
Каким образом правильно сделать скрипт?
- 2 подписчика
- 15 нояб.
- 368 просмотров
2

ответа
Python

+1 ещё

Сложный
Как автоматизировать работу с сайтом используя Camoufox библиотеку?
- 2 подписчика
- 14 окт.
- 193 просмотра
0

ответов
Парсинг

Простой
Как получить ID всех ПВЗ?
- 1 подписчик
- 24 сент.
- 267 просмотров
0

ответов
Парсинг

+1 ещё

Простой
Как увеличить охват поисковых фраз Wildberries и ускорить?
- 2 подписчика
- 23 сент.
- 206 просмотров
0

ответов
Парсинг

Простой
Как парсить несколько сайтов, отличающихся друг от друга?
- 2 подписчика
- 09 сент.
- 207 просмотров
3

ответа
Node.js

+4 ещё

Простой
В чем разница между selenium, playwright и puppeteer?
- 3 подписчика
- 09 сент.
- 299 просмотров
2

ответа
Node.js

+1 ещё

Простой
NODE.JS – парсинг контента. При скачивании изображений получаю битые файлы. Как поправить?
- 1 подписчик
- 08 сент.
- 138 просмотров
1

ответ
Python

+2 ещё

Средний
Как правильно принимать платежи пользователей в сети Tron?
- 1 подписчик
- 03 сент.
- 230 просмотров
3

ответа
Показать ещё Загружается…

C++ / Qt Разработчик

Алабуга • Екатеринбург

от 127 500 ₽

Разработчик JavaScript/NodeJS, специалист технической поддержки

A-Parser

от 600 до 800 $

Инженер по инцидентам информационной безопасности

SMALL

от 3 400 до 4 700 $