Как правильно поправить поиск тега в Butifulsoup и python3?

Question

Максим Киктев @Ne0lite

Python

Как правильно поправить поиск тега в Butifulsoup и python3?

Как правильно поправить поиск тега в Butifulsoup и python3?

Вопрос заключается в том, что на сайте который я хочу спарсить есть 2 тега которые содержат нужную мне информацию.

на сайте это выглид так:

<td class="center">419.56</td>
<td class="center">
<nobr>
<span data-ts="1556824546" aria-label="May 2, 2019 19:15" class="hint--bottom-right datetime">14 days ago</span>
</nobr>
</td>

Строкой:

(tag.text for tag in BeautifulSoup(v, parser).find_all("td", {"class": "center"})),

Мне нужно вытащить значение 1го тега:
<td class="center">419.56</td>
без

<td class="center">
<nobr>
<span data-ts="1556824546" aria-label="May 2, 2019 19:15" class="hint--bottom-right datetime">14 days ago</span>
</nobr>
</td>

а вот уже строкой:

(tag.text for tag in BeautifulSoup(v, parser).find_all("span", {"class": "hint--bottom-right datetime"})))

вытащить значение

<span data-ts="1556824546" aria-label="May 2, 2019 19:15" class="hint--bottom-right datetime">14 days ago</span>

Под спойлером весь код скрипта

spoiler

import requests
from tabulate import tabulate
from itertools import chain, zip_longest
from bs4 import BeautifulSoup

raid_week = ''
lang = 'ru'
parser = 'lxml'

baseURL = 'https://www.wowprogress.com/gearscore/?lfg=1'

# Fetch page 1 of guild list from URL
def fetchpage1():
    return requests.get('https://www.wowprogress.com/gearscore/?lfg=1&raids_week=&lang=ru').content

# Fetch a subsequent page of guild list from URL
def fetchnextpage(p):
    return requests.get(baseURL + '&raids_week=' + str(raid_week) + '&lang=' + lang).content

def CreateSoup(v):
    return zip_longest(
        (tag.text for tag in BeautifulSoup(v, parser).find_all("a", {"class": "hint--bottom-right"})),
        (tag.text for tag in BeautifulSoup(v, parser).find_all("a", {"class": "realm"})),
        (tag.text for tag in BeautifulSoup(v, parser).find_all("td", {"class": "center"})),
        (tag.text for tag in BeautifulSoup(v, parser).find_all("span", {"class": "hint--bottom-right datetime"})))

# Returns a generator of guild names by chaining the first page to subsequent pages
def getcharacters(u):
    return chain(getnextpages(u))

# Get first page of guild names
def getpage1(url):
    return CreateSoup(fetchpage1())

# Get subsequent pages as a generator
def getnextpages(url):
    return chain.from_iterable((CreateSoup(fetchnextpage(page))) for page in range(1))

# Function call
print(tabulate([character for character in getcharacters(baseURL)], headers=['Character', 'Realm', 'CharILVL', 'DateTime']))

если выполнить представленный код, то получится что он парсить оба тега в столбец CharILVL

Вопрос задан более трёх лет назад
102 просмотра

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Чтобы сделать несколько запросов к OpenAI серверу из Python, нужно каждый раз вызывать client.chat.completions.create?
- 1 подписчик
- 21 дек.
- 101 просмотр
2

ответа
Python

Простой
Какой отлдачик для Python поставить новичку?
- 1 подписчик
- 20 дек.
- 146 просмотров
2

ответа
Python

Простой
Существует ли менеджер виртуальных окружений для python, который хранит все пакеты в одном месте?
- 3 подписчика
- 18 дек.
- 205 просмотров
1

ответ
Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 220 просмотров
1

ответ
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 77 просмотров
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 200 просмотров
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 241 просмотр
1

ответ
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 145 просмотров
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 252 просмотра
0

ответов
Python

Простой
Как получить конкретный атрибут приложенный в обьект?
- 1 подписчик
- 28 нояб.
- 240 просмотров
1

ответ
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Backend Developer

Hard Bootstrapping LLC. • Санкт-Петербург

от 175 000 до 350 000 ₽

Answer 1 · 2019-05-24 17:22:14

Первый можно так (основываясь на вашем коде, чтобы было понятнее)

found_tags = BeautifulSoup(v, parser).find_all("td", {"class": "center"})
first_tag = found_tags[0]
text = first_tag.text

Как правильно поправить поиск тега в Butifulsoup и python3?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт