Как из класса вытащить href?

Question

Руслан @ruprup

Web парсеры пишу. Нужно делать что то большее.

Как из класса вытащить href?

есть список awards:

awards = [<a class="bttn_green" href="/index.php?r=quests/reward&amp;id=74538347&amp;quest_id=1598044167">text</a>, <a class="bttn_green" href="/index.php?r=quests/reward&amp;id=74498540&amp;quest_id=1597875696">text</a>, <a class="bttn_green" href="/index.php?r=quests/reward&amp;id=74205167&amp;quest_id=1596578514">text</a>, <a class="bttn_green" href="/index.php?r=quests/reward&amp;id=74479806&amp;quest_id=1597790754">text</a>, <a class="bttn_green" href="/index.php?r=quests/reward&amp;id=74327918&amp;quest_id=1597093800">text</a>]

как из него вытащить каждый award? чтобы было так:

award = '/index.php?r=quests/reward&amp;id=74538347&amp;quest_id=1598044167'

пробовал через ['href'] в конце и через .get('href')) что то не выходит

Вопрос задан более трёх лет назад
185 просмотров

3 комментария

Подписаться 1 Простой 3 комментария

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

8 комментариев

Руслан @ruprup Автор вопроса

Не совсем подходит, в том супе есть еще много других ссылок, по этому я нужные внес в awards[]
и нужно как то оттолкнуться из этого списка

Написано более трёх лет назад
Сергей Горностаев @sergey-gornostaev Куратор тега Python

Руслан, принципиальной разницы между for link in soup.find_all('a'): и for award in awards: нет.

Написано более трёх лет назад

Руслан @ruprup Автор вопроса

Сергей Горностаев,

soup = bs(openQuests.content, 'html.parser')
	print(soup)
	award_divs = soup.find_all('a', attrs={'class': 'bttn_green'})
	print(award_divs)
	for award in award_divs:
		aw = str(award.find('a').get('href'))
		print(aw)

Написано более трёх лет назад

Руслан @ruprup Автор вопроса

Сергей Горностаев, смотрите, вот тут думаю есть разница,? если так сделать как вы пишите, то выйдет кучу разных линков, не нужных

Написано более трёх лет назад
Сергей Горностаев @sergey-gornostaev Куратор тега Python

Руслан, всё ещё никакой разницы в контексте вашего вопроса. Абстрагируйтесь от деталей. Вам просто нужно получить элемент и вызвать get('href'), если элемент не равен None.

Написано более трёх лет назад
Руслан @ruprup Автор вопроса
Сергей Горностаев, так дело в том что он видит его как None, хотя там есть элемент вот такой к примеру
<a class="bttn_green" href="/index.php?r=quests/reward&id=74538347&quest_id=1598044167">text</a>
Написано более трёх лет назад
Руслан @ruprup Автор вопроса

Сергей Горностаев, я что то не так пишу

Написано более трёх лет назад

Валерий Мамонтов @vmamontov

Руслан,

soup = bs(openQuests.content, 'html.parser')

award_divs = soup.find_all('a', {'class': 'bttn_green'})

for award in award_divs:
    print(award.attrs['href'])

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 199 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 522 просмотра
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 486 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 276 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 498 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 212 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 124 просмотра
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 330 просмотров
1

ответ
Python

Простой
Стоит ли переходить на IDE?
- 1 подписчик
- 25 мая
- 660 просмотров
5

ответов
Python

+2 ещё

Простой
Где хранить сессию SQLAlchemy в FastAPI: в конструкторе сервиса или передавать в каждый метод?
- 2 подписчика
- 23 мая
- 345 просмотров
1

ответ
Показать ещё Загружается…

что то не выходит

Что именно это значит? При попытке разверзлись хляби небесные и в ваш компьютер ударила молния?
Сергей Горностаев, выходит ошибка AttributeError: 'NoneType' object has no attribute 'get'
Руслан, это значит, что как минимум один из элементов списка awards - это None.

Answer 1 · 2020-10-19 09:04:35

Сергей Горностаев @sergey-gornostaev Куратор тега Python

Седой и строгий

Как достать ссылку из href='link'?

Ответ написан более трёх лет назад

8 комментариев

Answer 2 · 2020-10-19 11:12:06

Руслан

from bs4 import BeautifulSoup

html = '<a class="bttn_green" href="/index.php?r=quests/reward&amp;id=74538347&amp;quest_id=1598044167">text</a> \
    <a class="bttn_green" href="/index.php?r=quests/reward&amp;id=74498540&amp;quest_id=1597875696">text</a> \
    <a class="bttn_green" href="/index.php?r=quests/reward&amp;id=74205167&amp;quest_id=1596578514">text</a> \
    <a class="bttn_green" href="/index.php?r=quests/reward&amp;id=74479806&amp;quest_id=1597790754">text</a> \
    <a class="bttn_green" href="/index.php?r=quests/reward&amp;id=74327918&amp;quest_id=1597093800">text</a>'


soup = BeautifulSoup(html)

links = soup.findAll("a", {"class": "bttn_green"})

for link in links:
    # print(link.get_text())
    print(link.attrs["href"])

Как из класса вытащить href?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт