Как достать ссылку на изображение?

Question

Aibot92 @Aibot92

Как достать ссылку на изображение?

Доброго дня
есть написаный парсинг :

import requests
from bs4 import BeautifulSoup
from selenium import webdriver
import csv
import os

URL = 'https://www.svyaznoy.ru/catalog/phone/8605/'
HEDARS = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_6) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.0.3 Safari/605.1.15', 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8'}
FILE = 'svz.csv'
direct= os.getcwd()

def get_himl(url):
    chromedriver =direct+'/chromedriver'
    options = webdriver.ChromeOptions()
    browser = webdriver.Chrome(executable_path=chromedriver,chrome_options=options)
    browser.get(url)
    generated_html = browser.page_source
    browser.quit()
    return generated_html

def seve_file(item,path):
    with open(path, 'w', newline='',encoding='utf-8') as file:
        writer = csv.writer(file, delimiter = ';')
        writer.writerow(['модель', 'цена акция (без учета комбо)', 'акции', 'старая цена/цена без акции'])
        for items in item:
            writer.writerow([items['title'], items['prise'], items['action'], items['old_prise']])


def get_content(html):
    soup = BeautifulSoup(html, 'html.parser')
    items = soup.find_all('div', {'class': ["b-product-block__content"]})

    phone =[]
    p = len(items)
    for items in items:
        prise = items.find('span', class_="b-product-block__visible-price")
        if prise:
            prise = prise.get_text()
            prise = prise.replace('\xa0', ' ')
        else:
            prise = "цена не указана"
        sale = items.find('div', class_="b-product-block__action-info _old-price")
        if sale:
            sale = sale.get_text()
        else:
            sale = ""
        actions = items.find('div', class_="b-product-block__action-info _action-price")
        if actions:
            actions = actions.get_text()
        else:
            actions = ""
        discont = items.find('span', class_="discount-sum")
        if discont:
            discont = discont.get_text()
            discont = "скидка по комбо: " + discont
        else:
            discont = ""
        old_prise = items.find('s', class_="b-product-block__price-old")
        if old_prise:
            old_prise = old_prise.get_text()
            old_prise = old_prise.replace('\xa0', ' ')
        else:
            old_prise = ""

        oll_action = sale + " " + actions + " " + discont
        if oll_action:
            oll_action = oll_action
        else:
            oll_action = ''
        pic_href = items.find('img', class_="lazy").get('content')
        print(pic_href)
        phone.append({
        'title' : items.find('span', class_="b-product-block__name").get_text(),
        'prise' : prise.replace('руб.', ' '),
        'action' : oll_action,
        'old_prise' : old_prise.replace('руб.', ' ')

        })
    return phone
def parsing():
    phone = []
    for page in range (1,3):
        print(f'Анализ {page}  ...')
        a = URL + 'page-'+ str(page)
        html = get_himl(a)
        phone.extend(get_content(html))
        seve_file(phone,FILE)
    print(f'найдено ' + str(len(phone)) + ' телефонов')
parsing()

к нему захотел добавить извлечение картинок но при поиске ссылки выдает ошибку :

pic_href = items.find('img', class_="lazy").get('content')
        print(pic_href)

File "/Users/alexs/Desktop/py/Parsing/parser_svz.py", line 70, in get_content
pic_href = items.find('img', class_="lazy").get('content')
AttributeError: 'NoneType' object has no attribute 'get'

подскажите что делаю не так?

Вопрос задан более трёх лет назад
177 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее
Skillfactory

Профессия Python-разработчик

9 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

2 комментария

Aibot92 @Aibot92 Автор вопроса

File "/Users/alexs/Desktop/py/Parsing/parser_svz.py", line 70, in get_content
    pic_href = items.find('img', class_="lazy").get('href')
AttributeError: 'NoneType' object has no attribute 'get'

там ссылка которую я хочу извлечь

<img class="lazy" content="https://cdn.svyaznoy.ru/upload/iblock/782/01.jpg/resize/307x224/" data-src="https://cdn.svyaznoy.ru/upload/iblock/782/01.jpg/resize/307x224/"/>

Написано более трёх лет назад

ThunderCat @ThunderCat

Aibot92, а, ну так вы бы прикладывали значимый код, так гадать можно бесконечно... Кроме того, смотрим доку:
If find() can’t find anything, it returns None:
Как раз ваш случай. Не нашло картинку. Скорее всего или в какой-то из итераций картинки не нашлось, или надо через find_all('img')[0].get(), так как find заточен под поиск уникальных элементов. Получайте сначала элемент, проверяйте если не пустой, затем уже берите атрибут.

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- 15 нояб.
- 183 просмотра
0

ответов
Веб-разработка

+1 ещё

Простой
Каким образом правильно сделать скрипт?
- 2 подписчика
- 15 нояб.
- 272 просмотра
2

ответа
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 231 просмотр
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- 08 нояб.
- 151 просмотр
0

ответов
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 2 подписчика
- 08 нояб.
- 125 просмотров
1

ответ
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 254 просмотра
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 138 просмотров
0

ответов
Python

+1 ещё

Простой
Почему callback_query_handler в telebot не работает?
- 1 подписчик
- 31 окт.
- 141 просмотр
3

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 145 просмотров
0

ответов
Python

Простой
Что делать если turtle в python не отвечает?
- 1 подписчик
- 22 окт.
- 261 просмотр
2

ответа
Показать ещё Загружается…

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽

Junior Python Developer

ITK academy • Воронеж

от 75 000 ₽

Answer 1 · 2022-04-24 13:52:16

ThunderCat @ThunderCat

{PHP, MySql, HTML, JS, CSS} developer

pic_href = items.find('img', class_="lazy").get('href') // почему вообще там контент должно быть???

Ответ написан более трёх лет назад

2 комментария

Answer 2 · 2022-04-24 21:20:32

alexbprofit @alexbprofit

Junior SE

driver.find_elements(By.NAME, 'img').get_attribute('content')

Ответ написан более трёх лет назад

Комментировать

Как достать ссылку на изображение?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт