Не получается поиск данных через bs4, как чинить?

Question

Kirill_Safe @Kirill_Safe

Не получается поиск данных через bs4, как чинить?

Вообщем, парсил раньше, все было норм
Начинаю парсить другие данные с того же веб-сайта, просто пишет None. Хотя они там есть.
Мой код:

Код

import json
import time
import os
from PIL import Image
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.chrome.options import Options

options = Options()
options.add_argument("--disable-images")
options.add_argument("--disable-webgl")
options.add_argument("--enable-javascript")
options.add_experimental_option("excludeSwitches", ["enable-logging"])
options.add_argument("--enable-chrome-browser-cloud-management")
with open('./cookies.json', 'r') as f:
    cookies = json.load(f)
def get_source(url):
    driver = webdriver.Chrome(options=options)
    driver.get('https://excalibur-craft.ru/index.php?do=profile&name=' + url)
    for cookie in cookies:
        driver.add_cookie(cookie)
    driver.refresh()
    time.sleep(0.50)
    source_code = driver.page_source
    soup = BeautifulSoup(source_code, 'html.parser')
    forum_link_element = soup.select_one('a#forum-tab')
    forum_link = forum_link_element['href'] if forum_link_element else None
    exp = soup.select_one('html > body > div:nth-of-type(2) > div:nth-of-type(1) > div > div:nth-of-type(1) > div > div:nth-of-type(2) > div:nth-of-type(2) > div:nth-of-type(1) > div:nth-of-type(5) > div:nth-of-type(2) > p')
    clan = soup.select_one('html > body > div:nth-of-type(2) > div:nth-of-type(1) > div > div:nth-of-type(1) > div > div:nth-of-type(2) > div:nth-of-type(2) > div:nth-of-type(1) > div:nth-of-type(6) > div > label > a')
    status = soup.select_one('html > body > div:nth-of-type(2) > div:nth-of-type(1) > div > div:nth-of-type(1) > div > div:nth-of-type(2) > div:nth-of-type(2) > div:nth-of-type(1) > div:nth-of-type(4) > div:nth-of-type(2) > p')
    online_on_month = soup.select_one('html > body > div:nth-of-type(2) > div:nth-of-type(1) > div > div:nth-of-type(1) > div > div:nth-of-type(2) > div:nth-of-type(2) > div:nth-of-type(1) > div:nth-of-type(2) > div:nth-of-type(2) > p')
    online_on_all = soup.select_one('html > body > div:nth-of-type(2) > div:nth-of-type(1) > div > div:nth-of-type(1) > div > div:nth-of-type(2) > div:nth-of-type(2) > div:nth-of-type(1) > div:nth-of-type(3) > div:nth-of-type(2) > p')
    registration_date = soup.select_one('html > body > div:nth-of-type(2) > div:nth-of-type(1) > div > div:nth-of-type(1) > div > div:nth-of-type(2) > div:nth-of-type(2) > div:nth-of-type(1) > div:nth-of-type(1) > div:nth-of-type(2) > p')


    if exp and status and online_on_month and online_on_all and registration_date:
        driver.get(forum_link)
        time.sleep(1)
        driver.get(forum_link)
        time.sleep(1)
        rank = soup.select_one('html > body > main > div > div > div > div > div > div > section > div:nth-of-type(1) > div > div > h3')
        reputation = soup.select_one('html > body > main > div > div > div > div > div > div > section > div:nth-of-type(1) > div > a:nth-of-type(2) > p')
        publications = soup.select_one('html > body > main > div > div > div > div > div > div > section > div:nth-of-type(1) > ul > li:nth-of-type(1) > h4')
        if clan:
            return (f"Опыт: {exp}\n"
                    f"Клан: {clan}\n"
                    f"Статус в игре: {status}\n"
                    f"Онлайн за месяц: {online_on_month}\n"
                    f"Онлайн за все время: {online_on_all}\n"
                    f"Дата регистрации: {registration_date}\n"
                    f"Кол-во публикаций: {publications}"
                    f"Репутация: {reputation}"
                    f"Ранг: {rank}")
        else:
            return (f"Опыт: {exp}\n"
                    f"Статус в игре: {status}\n"
                    f"Онлайн за месяц: {online_on_month}\n"
                    f"Онлайн за все время: {online_on_all}\n"
                    f"Дата регистрации: {registration_date}\n")
    else:
        return 1337


print(get_source("KirillSafe"))

Всякая другая шняга для поиска тех нужных данных(в коде они отмечены как rank, reputation, publications):

spoiler

XPATH - /html/body/main/div/div/div/div/div/div/section/div[1]/div/a[2]/p
/html/body/main/div/div/div/div/div/div/section/div[1]/div/div/h3
/html/body/main/div/div/div/div/header/div[3]/ul/li[1]

Укажите на ошибку :(

Вопрос задан более года назад
102 просмотра

Комментировать

Подписаться 2 Простой Комментировать

Решения вопроса 1

2 комментария

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Парсинг

+1 ещё

Средний
Ошибка в коде парсера Ozon, что не так?
- 1 подписчик
- час назад
- 6 просмотров
0

ответов
Парсинг

+4 ещё

Простой
Как отловить фрейм с капчей?
- 1 подписчик
- 02 июл.
- 119 просмотров
0

ответов
Python

+2 ещё

Простой
Почему происходит Блокировка доступа при использовании Selenium для парсинга?
- 2 подписчика
- 16 июн.
- 265 просмотров
3

ответа
Linux

+2 ещё

Средний
Как пробросить локальный порт через SOCKS5 с логином/паролем для Selenium?
- 1 подписчик
- 10 июн.
- 139 просмотров
0

ответов
VPN

+2 ещё

Средний
Возможно ли автоматизировать подключения к Big Blue Button?
- 1 подписчик
- 21 апр.
- 204 просмотра
1

ответ
Python

+2 ещё

Простой
Как парсить динамическую таблицу с помощью selenium?
- 2 подписчика
- 09 апр.
- 199 просмотров
0

ответов
Python

+2 ещё

Простой
Как сделать, чтобы при парсинге bs4 как то надо нажать на кнопку «показать еще», чтобы подгрузило еще 20 постов?
- 1 подписчик
- 08 апр.
- 222 просмотра
2

ответа
Парсинг

+1 ещё

Простой
У меня не получается спарсить ссылку на фото с сайта, help?
- 1 подписчик
- 07 апр.
- 209 просмотров
2

ответа
HTML

+2 ещё

Простой
Как с помощью Selenium на Python найти элемент html страницы, который расположен в #shadow-root (open)?
- 3 подписчика
- 03 апр.
- 229 просмотров
4

ответа
Selenium

+2 ещё

Простой
Почему скрипт не запускается из-за версии драйвера хрома?
- 1 подписчик
- 01 апр.
- 71 просмотр
1

ответ
Показать ещё Загружается…

QA Automation(Java)

SimbirSoft • Ульяновск

Phyton разработчик

Товеко

До 60 000 ₽

Инженер по автоматизированному тестированию (Java)

Bell Integrator • Москва

Answer 1 · 2024-07-16 22:31:57

Перестать копировать эти ужасные портянки XPATH из инспектора браузера и самому, глазами анализируя html, делать нормальные, скорее всего там будут подвязки на классы. Ну и сразу, для selenium не нужен bs, его встроенных функций достаточно.

Не получается поиск данных через bs4, как чинить?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт