BS не видит классы при парсинге?

Question

Данил Нескажу @dannight0151

Начинающий программист на Python и C#

BS не видит классы при парсинге?

Пытаюсь парсить сайт при помощи BS4 и requests.
C сайта с запросом в поисковик: https://steambuy.com/catalog/?q=PUBG
Нужно получить ссылку на страницу 1 результата поиска. Но BS почему-то не видит нужного класса?
Что не так с кодом или с сайтом?

import requests
from bs4 import BeautifulSoup as BS 
game = 'PUBG'
START='https://steambuy.com/catalog/?q='
HOST='https://steambuy.com'
URL=START+game
def get_html(url):
    search= requests.get(url)
    return search


def get_content(html):
    soup = BS(html,'html.parser')
    item = soup.find('a',class_='product-item__title-link').get('href')
    return item

def parse(url):
    html= get_html(url)
    if html.status_code == 200:
        a = get_content(html.text)
        print(a)
    else:
        pass
parse(URL)

Вопрос задан более трёх лет назад
880 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Профессиональная вёрстка на HTML и CSS

3 месяца

Далее
Stepik

Основы HTML и CSS

2 недели

Далее
Бруноям

Вёрстка на HTML и CSS

3 месяца

Далее

Пригласить эксперта

Ответы на вопрос 2

4 комментария

Данил Нескажу @dannight0151 Автор вопроса

Спасибо. А парсер может сам найти аякс запрос без моего участия?
Есть такие функции или методы в реквест или бс?
Или все-же в ручную придется искать?

Написано более трёх лет назад
Andrey_Dolg @Andrey_Dolg

Данил Нескажу, Конечно может, но для этого нужен совсем другой парсер и другие инструменты.

Написано более трёх лет назад
Данил Нескажу @dannight0151 Автор вопроса

Andrey_Dolg, Можете сказать, какие?

Написано более трёх лет назад
Andrey_Dolg @Andrey_Dolg

Данил Нескажу, Вам это врят ли поможет но называется это selenium-shark и позволяет эмулировать браузер и изучать запросы которые отправляет страница при загрузке. Аналогичное можно сделать через browser extension но там мороки чутка больше получается.
Но это всё не то чего вы хотите. Вам хочется полный рендеринг страницы без гемороя это автоматизация браузера и как следствие обычно решается через selenium или phantomjs в headless режиме.

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Какой отлдачик для Python поставить новичку?
- 1 подписчик
- 14 часов назад
- 48 просмотров
1

ответ
Python

Простой
Существует ли менеджер виртуальных окружений для python, который хранит все пакеты в одном месте?
- 1 подписчик
- 18 дек.
- 167 просмотров
1

ответ
Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 212 просмотров
1

ответ
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 67 просмотров
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 188 просмотров
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 211 просмотров
1

ответ
CSS

Простой
Как найти в DOM-элементе блоки (div), которые имеют ширину больше, чем их родительский элемент (td) средставми CSS?
- 2 подписчика
- 12 дек.
- 114 просмотров
0

ответов
JavaScript

+2 ещё

Средний
Как можно реализовать что то вроде селекта внутри родителя у которого есть скрытые элементы и должна быть горизонтальная прокрутка?
- 2 подписчика
- 11 дек.
- 164 просмотра
0

ответов
CSS

Простой
Как сделать “арочный” блок адаптивным?
- 1 подписчик
- 11 дек.
- 210 просмотров
0

ответов
CSS

Простой
Как сделать вырез снизу без задания цвета?
- 1 подписчик
- 11 дек.
- 111 просмотров
0

ответов
Показать ещё Загружается…

WordPress (PHP, HTML/CSS) разработчик

Epiic

от 90 000 ₽

Frontend-разработчик (Vanilla JS, high-load media platform)

Karma8

от 200 000 до 300 000 ₽

Frontend разработчик React / Next.js

PurpleSchool

До 65 000 ₽

Answer 1 · 2020-04-24 19:57:09

Добавлено:

import requests
import json
from bs4 import BeautifulSoup as BS 

headers = {'X-Requested-With':'XMLHttpRequest'}
url = 'https://steambuy.com/ajax/_get.php?rnd=0.7101602294952999&offset=0&region_free=0&sort=cnt_sell&sortMode=descendant&view=extended&a=getcat&q=PUBG&series=&izdatel=&currency=wmr&curr=&currMaxSumm%5Bwmr%5D=3000&currMaxSumm%5Bwmz%5D=100&currMaxSumm%5Bwme%5D=70&currMaxSumm%5Bwmu%5D=1000&letter=&limit=0&page=1&minPrice=0&maxPrice=5000&minDate=0&maxDate=0&deleted=0&no_price_range=0&records=14'

response = requests.get(url,headers=headers)
soup = BS(json.loads(response.text)['html'],'html.parser')
items = soup.find_all('a',class_='product-item__title-link')
for item in items:
	print('https://steambuy.com'+item.get('href'))

На выходе:

https://steambuy.com/steam/playerunknown-s-battleg...
https://steambuy.com/steam/playerunknowns-battlegr...

Конечно не можете найти, так как результаты подгружаются с другого адреса:

https://steambuy.com/ajax/_get.php+много параметров

Answer 2 · 2020-04-24 19:51:26

Не могу утверждать, но возможно те данные, которые тебе нужны, добавляются на страницу динамически.
Библиотека requests получает лишь код странички, а с динамическими данными работать не может.
Как это проверить? Через тот же requests скачай запрашиваемую страничку и изучи её.
Если моя теория верна, то смотри в сторону selenium.

BS не видит классы при парсинге?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт