Выскакивает ошибка 'NoneType' object has no attribute 'select', как её исправить?

Question

N T @RG2

Beautiful Soup

Выскакивает ошибка 'NoneType' object has no attribute 'select', как её исправить?

Написал код, который должен выводить в json информацию с конкурсов сайта, включающую в себя: название, описание конкурса, начало и окончание приёма заявок, географию конкурса, организатора конкурса и т.д. Примерно так должно выглядеть:

[
 {
  "Название": "",
  "Описание": "",
  "Старт приема заявок": "",
  "Окончание приема заявок": "",
  "Участники конкурса": ""  
  "География конкурса": ""  
  "Организатор конкурса": ""  
 }
]

Сперва я попробовал написать код, который выведет в json название того или иного конкурса:

import requests
from bs4 import BeautifulSoup
import re
import os
from urllib.request import urlopen
import json
from urllib.parse import unquote
import asposecells
import jpype
from openpyxl import Workbook
import pandas as pd
import mysql.connector
from seleniumwire import webdriver 
import warnings
warnings.filterwarnings("ignore")
import time
import cloudscraper
from selenium import webdriver

url = 'https://гранты.рф/data/grants/list'
OUT_FILENAME = 'out.json'
options = webdriver.EdgeOptions()
options.add_argument("--headless")
driver = webdriver.Edge(options=options)
driver.get(url)
time.sleep(1.5)
html_parsed = driver.page_source
urls = []
soup = BeautifulSoup(html_parsed, 'html.parser')
def get_soup(url, **kwargs):
    response = requests.get(url, **kwargs, verify=False)
    if response.status_code == 200:
        soup = BeautifulSoup(response.text, features='html.parser')
    else:
        soup = None
    return soup

def crawl_products(url):
    for tag in soup.select('.competition-card-wrapper'):
        t = tag.attrs['href']
        url = 'https://гранты.рф{}'.format(t)
        urls.append(url)
        print(urls)
    return urls

def parse_products(urls):
    data = []
    item = {}
    soup = get_soup(url)
    for tr in soup.select(f".grants-competition-page.full-page-competition"):
        name = tr.select_one("p").text
        return data
    item['Название'] = name
    data.append(item)
    
def dump_to_json(filename, data, **kwargs):
    kwargs.setdefault('ensure_ascii', False)
    kwargs.setdefault('indent', 1)
 
    with open(OUT_FILENAME, 'w', encoding="utf-8") as f:
        json.dump(data, f, **kwargs)

def main():
    urls = crawl_products(url)
    data = parse_products(urls)
    dump_to_json(OUT_FILENAME, data)
 
    with open(OUT_FILENAME, 'w', encoding="utf-8") as f:
        json.dump(data, f, ensure_ascii=False, indent=1)

if __name__ == '__main__':
    main()
    
df = pd.read_json('./out.json')

И тут же возникает ошибка. Пробовал подставить любые классы из div, тщетно.

Traceback (most recent call last):
  File "C:\Download\server\py\main2.py", line 72, in <module>
    main()
  File "C:\Download\server\py\main2.py", line 65, in main
    data = parse_products(urls)
  File "C:\Download\server\py\main2.py", line 50, in parse_products
    for tr in soup.select(f".grants-competition-page.full-page-competition"):
AttributeError: 'NoneType' object has no attribute 'select'

Пробовал в data = parse_products(urls) вместо urls поставить что-то другое. Ошибок не было, но парсер пуст.

Вопрос задан более двух лет назад
130 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillfactory

DevOps-инженер

6 месяцев

Далее
Хекслет

Фронтенд-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Beautiful Soup

Простой
Почему Soup.find возвращает None?
- 1 подписчик
- 03 авг.
- 82 просмотра
1

ответ
Python

+2 ещё

Простой
Как сделать, чтобы при парсинге bs4 как то надо нажать на кнопку «показать еще», чтобы подгрузило еще 20 постов?
- 1 подписчик
- 08 апр.
- 237 просмотров
2

ответа
Парсинг

+1 ещё

Простой
У меня не получается спарсить ссылку на фото с сайта, help?
- 1 подписчик
- 07 апр.
- 218 просмотров
2

ответа
Beautiful Soup

Средний
Как распарсить файл в табличной верстке через beatifulsoap?
- 1 подписчик
- 07 мар.
- 138 просмотров
1

ответ
Beautiful Soup

Простой
Нормально ли что парсинг занимает много оперативки?
- 2 подписчика
- 17 нояб. 2024
- 253 просмотра
2

ответа
Beautiful Soup

+1 ещё

Простой
Как пройти капчу при методе POST?
- 1 подписчик
- 10 нояб. 2024
- 251 просмотр
1

ответ
Beautiful Soup

Простой
Почему скачиваются миниатюры изображений вместо их полного размера?
- 1 подписчик
- 01 нояб. 2024
- 183 просмотра
0

ответов
Beautiful Soup

Простой
Почему парсер не выдаёт нужный результат?
- 1 подписчик
- более года назад
- 127 просмотров
1

ответ
Beautiful Soup

Простой
Python BeautifulSoup почему не работает код?
- 1 подписчик
- более года назад
- 81 просмотр
0

ответов
Beautiful Soup

Простой
Парсится только часть страницы. Как парсить всю страницу?
- 1 подписчик
- более года назад
- 81 просмотр
2

ответа
Показать ещё Загружается…

Project manager / Resource manager

Regex SEO

от 1 500 до 3 000 $

Deep Learning Engineer (GigaChat Prod)

Сбер • Москва

от 350 000 ₽

Менеджер цифровых проектов

Российский Красный Крест • Москва

от 100 000 ₽

Answer 1 · 2023-09-28 15:12:23

Ошибку исправил. Но теперь парсер не выводится. Пишу код.

import requests
from bs4 import BeautifulSoup
import re
import os
from urllib.request import urlopen
import json
from urllib.parse import unquote
import asposecells
import jpype
from openpyxl import Workbook
import pandas as pd
import mysql.connector
from seleniumwire import webdriver 
import warnings
warnings.filterwarnings("ignore")
import time
import cloudscraper
from selenium import webdriver

url = 'https://гранты.рф/data/grants/list'
OUT_FILENAME = 'out.json'
options = webdriver.EdgeOptions()
options.add_argument("--headless")
driver = webdriver.Edge(options=options)
driver.get(url)
time.sleep(1.5)
html_parsed = driver.page_source
urls = []
soup = BeautifulSoup(html_parsed, 'html.parser')
def get_soup(url, **kwargs):
    response = requests.get(url, **kwargs, verify=False)
    if response.status_code == 200:
        soup = BeautifulSoup(response.text, features='html.parser')
    else:
        soup = None
    return soup

def crawl_products(url):
    for tag in soup.select('.competition-card-wrapper'):
        t = tag.attrs['href']
        url = 'https://гранты.рф{}'.format(t)
        urls.append(url)
        print(urls)
    return urls

def parse_products(urls):
    data = []
    item = {}
    for page in urls:
        soup = get_soup(page)
        if soup is None:
            break
        for tr in soup.select(".grants-competition-page-hero__title"):
            name = tr.select_one("p").text
            item['Название'] = name
            data.append(item)
        return data
    
def dump_to_json(filename, data, **kwargs):
    kwargs.setdefault('ensure_ascii', False)
    kwargs.setdefault('indent', 1)
 
    with open(OUT_FILENAME, 'w', encoding="utf-8") as f:
        json.dump(data, f, **kwargs)

def main():
    urls = crawl_products(url)
    data = parse_products(urls)
    dump_to_json(OUT_FILENAME, data)
 
    with open(OUT_FILENAME, 'w', encoding="utf-8") as f:
        json.dump(data, f, ensure_ascii=False, indent=1)

if __name__ == '__main__':
    main()
    
df = pd.read_json('./out.json')

Выскакивает ошибка 'NoneType' object has no attribute 'select', как её исправить?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт