Как спарсить атрибут target=_"_blank"> спомошью BeautifulSoup в Python?

Question

Никита Иванов @n1k_ivanov

Как спарсить атрибут target=_"_blank"> спомошью BeautifulSoup в Python?

Тренируюсь по изучению библиотеки BeautifulSoup в python и зациклился уже на вторые сутки над парсингом атрибута target=_"_blank">

Что хочу сделать:
Спарсить победителей со страници => https://randstuff.ru/vkwin/zrnzt6/
Мне нужна сылка на страницу (Готова) и ИМЯ ФАМИЛИЯ победителя помещенные в словарь.

Так выглядит класс, в моем случае их получается 5. Сылку вытащил и теперь нужно имя и фамилию, находится в target="_blank">

<a class="name" href="https://vk.com/stush---" target="_blank">Стю-- Серге---</a>

Перелазил уже весь интернет и код на гите, но решение так и не нашел. Подскажите как решить :)

Что уже имеем:

import requests
from bs4 import BeautifulSoup

URL = 'https://randstuff.ru/vkwin/zrnzt6/'
HEADERS = {'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.96 YaBrowser/20.4.0.3443 Yowser/2.5 Safari/537.36', 'accept': '*/*'}

def get_html(url, params=None):
    r = requests.get(url, headers=HEADERS, params=params)
    return r

def get_content(html):
    soup = BeautifulSoup(html, 'html.parser')
    items = soup.find_all('a', class_='name')[1:]
    vk = []
    for item in items:
        vk.append({
            'title': item.get('href'),
            #'name': item.select('a', 'target="_blank">').get_text ТУТ ДОЛЖЕН БЫЛ БЫТЬ ПАРСИНГ ИМЕНИ И ФАМИЛИИ 
        })
    print(vk)

def parse():
    html = get_html(URL)
    if html.status_code == 200:
        get_content(html.text)
    else:
        print('Error')

parse()

Вопрос задан более трёх лет назад
324 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Решения вопроса 2

2 комментария

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+1 ещё

Простой
Почему при использование webdriverIE все равно открывается EDge?
- 1 подписчик
- час назад
- 9 просмотров
0

ответов
Python

Простой
Почему мой discord бот не реагирует на свои команды?
- 1 подписчик
- 2 часа назад
- 30 просмотров
0

ответов
Парсинг

+1 ещё

Средний
Как правильно написать функцию IMPORTJSON для парсинга цен криптовалют в гугл таблицу?
- 1 подписчик
- 3 часа назад
- 9 просмотров
0

ответов
Python

Простой
Как получить экземпляр родителя из дочернего класса?
- 1 подписчик
- 13 часов назад
- 101 просмотр
0

ответов
Python

Простой
Как указать когда нужна рекурсия а когда нет?
- 1 подписчик
- 16 часов назад
- 66 просмотров
1

ответ
Python

+1 ещё

Простой
Как сохранять сессию во Flask?
- 1 подписчик
- 21 час назад
- 42 просмотра
0

ответов
Python

+1 ещё

Простой
Как реализовать Python-код, который будет распознавать речь, но будет реагировать только тогда, когда будет упомянуто определенное слово?
- 1 подписчик
- вчера
- 96 просмотров
2

ответа
Python

Простой
Как создать offline карту на python?
- 1 подписчик
- вчера
- 137 просмотров
2

ответа
Python

Простой
Какие модули есть в Python для целей анализа, форматирования, вывода текста?
- 2 подписчика
- вчера
- 231 просмотр
3

ответа
Python

+1 ещё

Простой
Выбор: парсить на питоне с aiohttp, asyncio, bs4 или requests + bs4?
- 1 подписчик
- 17 апр.
- 138 просмотров
2

ответа
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Разработать парсер и админку

19 апр. 2024, в 14:12

30000 руб./за проект

Создать логотип

19 апр. 2024, в 14:10

500 руб./за проект

Разработка дизайна мобильного приложения которое управляет вентиляцией

19 апр. 2024, в 14:01

70000 руб./за проект

Answer 1 · 2020-05-30 15:30:28

Это:

#'name': item.select('a', 'target="_blank">').get_text ТУТ ДОЛЖЕН БЫЛ БЫТЬ ПАРСИНГ ИМЕНИ И ФАМИЛИИ

заменить на это:
'name': item.text

Output

[{'title': 'https://vk.com/stusha45', 'name': 'Стюша Сергеева'}, {'title': 'https://vk.com/id209266081', 'name': 'Юлия Сухова'}, {'title': 'https://vk.com/id394370251', 'name': 'Нина Ляшенко'}, {'title': 'https://vk.com/id473065083', 'name': 'Андрей Кротов'}, {'title': 'https://vk.com/id491175633', 'name': 'Тамара Петрова'}]

Answer 2 · 2020-05-30 15:35:28

soup.find_all('a', class_='name')[1:]
Тут уже возвращаются элементы целиком, со всеми атрибутами и текстом:

<a class="name" href="https://vk.com/stusha45" target="_blank">Стюша Сергеева</a>
<a class="name" href="https://vk.com/id209266081" target="_blank">Юлия Сухова</a>

Соответственно тебе не нужно повторно искать их, просто взять нужные значения из каждого элемента:

for item in items:
    item_data = {
        'title': item.get('href'),
        'name': item.text
    }
    print(item_data)

{'title': 'https://vk.com/stusha45', 'name': 'Стюша Сергеева'}
{'title': 'https://vk.com/id209266081', 'name': 'Юлия Сухова'}

Как спарсить атрибут target=_"_blank"> спомошью BeautifulSoup в Python?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт