Задать вопрос

Борис Мацегора

познаю Python. Парсинг, Aiogram

1

вклад
2

вопроса
2

ответа
50%

решений

Ответы пользователя по тегу Beautiful Soup

Как спарсить заголовок из title?
Борис Мацегора @boriss08
познаю Python. Парсинг, Aiogram
res = [] for old in all_old_teams: if (team := old.find_all("a")) != []: res.append(team[0].get('title')) res = set(res)

вот хороший код, команды собирает во множество ( без дубликатов) и всяческих ошибок из за хитрого решения

Ответ написан более двух лет назад

Комментировать
Комментировать

Где ошибка в парсере?

Борис Мацегора @boriss08

познаю Python. Парсинг, Aiogram

from bs4 import BeautifulSoup
import random
import json
import requests
import datetime
from fake_useragent import UserAgent

ua = UserAgent()

headers = {
    'accept': 'application/json, text/plain, */*',
    'user-Agent': ua.google,
}

article_dict = {}

for i in range(1, 4): 
    url = f'https://habr.com/ru/top/daily/page{i}/' 
    
    req = requests.get(url, headers=headers).text
    soup = BeautifulSoup(req, "html.parser") 
    all_hrefs_articles = soup.find_all("a", class_='tm-title__link')
    #print(all_hrefs_articles)
    for article in all_hrefs_articles:
        article_name = article.find('span').text 
        article_link = f'https://habr.com{article.get("href")}'
        article_dict[article_name] = article_link 

with open(f"articles_{datetime.datetime.now().strftime('%d_%m_%Y')}.json", "w", encoding='utf-8') as f: 
    try:
        json.dump(article_dict, f, indent=4, ensure_ascii=False)
        print('Статьи были успешно получены')

    except:
        print('Статьи не удалось получить')

Надеюсь помог ;)

Ответ написан более двух лет назад

1 комментарий

Самые активные сегодня

whattttov
- 5 ответов
- 0 вопросов
#
- 3 ответа
- 0 вопросов
Пума Тайланд
- 2 ответа
- 0 вопросов
perezagruzi_kod1
- 2 ответа
- 0 вопросов
Вячеслав Васильев
- 2 ответа
- 0 вопросов
Михаил Лялин
- 1 ответ
- 0 вопросов

Как спарсить заголовок из title?

Где ошибка в парсере?

Войдите на сайт