Задать вопрос

PhonikTop @PhonikTop

beautiful-soup

Beautiful Soup

Как спарсить каждый отдельный элемент div?

Код страницы(HTML):

<div class="post-content">
    <div class="post-metadata">
      <div>
        <time datetime="2022-12-17T07:47:52+03:00">сегодня в 07:47</time>
         |
                      <a href="/news/pc">ПК</a>, 
                      <a href="/news/rumors">Слухи</a>, 
                      <a href="/news/freebies">Раздачи и скидки</a>
       </div>
    </div>
</div>

У дочерних элементов нету ни id ни class, при этом нужно достать содержимое из каждого.

Код парсера(Python):

import requests
from bs4 import BeautifulSoup
headers = {
    "User-Agent": "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:108.0) Gecko/20100101 Firefox/108.0"
}

def get_free_game():
    url = "юрл страницы"

    r = requests.get(url=url, headers=headers)
    soup = BeautifulSoup(r.text, "lxml")

    list_items = soup.find_all("div", class_="post")

    games_dict = {}

    for items in list_items:
        game_title = f"{items.find('div', class_='post-title').text.strip()}"
        news_tag = f"{items.find('div', class_='post-metadata').text.strip()}".split("\n")

        games_dict = {
            "News": game_title,
            "Tags": news_tag,
        }

        print(games_dict)


if __name__ == "__main__":
    get_free_game()

Использую requests&bs4

Вопрос задан более двух лет назад
137 просмотров

2 комментария

Подписаться 1 Простой 2 комментария

Помогут разобраться в теме Все курсы

Нетология

Фронтенд-разработчик

11 месяцев

Далее
Skillfactory

DevOps-инженер

6 месяцев

Далее
SF Education

Бизнес-аналитик

11 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Beautiful Soup

Простой
Почему Soup.find возвращает None?
- 1 подписчик
- 03 авг.
- 83 просмотра
1

ответ
Python

+2 ещё

Простой
Как сделать, чтобы при парсинге bs4 как то надо нажать на кнопку «показать еще», чтобы подгрузило еще 20 постов?
- 1 подписчик
- 08 апр.
- 241 просмотр
2

ответа
Парсинг

+1 ещё

Простой
У меня не получается спарсить ссылку на фото с сайта, help?
- 1 подписчик
- 07 апр.
- 218 просмотров
2

ответа
Beautiful Soup

Средний
Как распарсить файл в табличной верстке через beatifulsoap?
- 1 подписчик
- 07 мар.
- 138 просмотров
1

ответ
Beautiful Soup

Простой
Нормально ли что парсинг занимает много оперативки?
- 2 подписчика
- 17 нояб. 2024
- 254 просмотра
2

ответа
Beautiful Soup

+1 ещё

Простой
Как пройти капчу при методе POST?
- 1 подписчик
- 10 нояб. 2024
- 252 просмотра
1

ответ
Beautiful Soup

Простой
Почему скачиваются миниатюры изображений вместо их полного размера?
- 1 подписчик
- более года назад
- 183 просмотра
0

ответов
Beautiful Soup

Простой
Почему парсер не выдаёт нужный результат?
- 1 подписчик
- более года назад
- 130 просмотров
1

ответ
Beautiful Soup

Простой
Python BeautifulSoup почему не работает код?
- 1 подписчик
- более года назад
- 81 просмотр
0

ответов
Beautiful Soup

Простой
Парсится только часть страницы. Как парсить всю страницу?
- 1 подписчик
- более года назад
- 82 просмотра
2

ответа
Показать ещё Загружается…

SRE-инженер в команду Поддержки

ДОМ.РФ • Москва

от 250 000 до 400 000 ₽

Frontend Developer (React + Node.js)

Alfabet Service

от 1 000 до 2 000 $

Senior Golang Developer

AppMagic

До 7 000 $