Как парсить яндекс картинки?

Question

Mishele123 @Mishele123

Beautiful Soup

Как парсить яндекс картинки?

Нужно ОБЯЗАТЕЛЬНО использовать реквесты. Вот код:

import os
import requests
from bs4 import BeautifulSoup
import cv2


headers = {
    "User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:109.0) Gecko/20100101 Firefox/117.0"
}

def saveImages(name : str, index : int, item : bytes) -> None:
    if not os.path.exists(name):
        os.mkdir(name)
    file = open(f"{name}/{index}.jpg", "wb")
    file.write(item)
    file.close()
    print("Сохранено")


def downloadImage(text : str) -> []:
    i = 0
    max_count = 50
    main_url = "https://yandex.ru/images/search?text=" + text
    result = requests.get(main_url, headers=headers)
    print(result)
    soup = BeautifulSoup(result.content, "lxml")
    links = soup.findAll("img", class_ = "serp-item__thumb justifier__thumb")
    for link in links:
        try:
            link = link.get("src")
            _img = requests.get("https:" + str(link))
            saveImages(text, i, _img.content)
            i += 1
            print(i)
            if i == max_count:
                break
        except:
            continue           

downloadImage("tiger")

Скачивает только 30 картинок и потом завершает работу (без ошибок). Что делать в данной ситуации?

Вопрос задан более двух лет назад
1522 просмотра

4 комментария

Подписаться 2 Средний 4 комментария

mayton2019 @mayton2019

Откуда число 30 появляется?

Написано более двух лет назад
Модератор @TosterModerator

Не надо ставить как можно больше тэгов. Лучше оставить один, но конкретный, с которым проблема.
См.п.3.1 Регламента.

Написано более двух лет назад
Shavadrius @Shavadrius

Так наверное на странице всего 30 картинок при первой загрузке. Вы же страницу не скроллите, не вызываете ajax-подгрузку...

Написано более двух лет назад
maksam07 @maksam07

Обязательно использовать парсинг? у яндекса вроде бы апишка есть

Написано более двух лет назад

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Профессия Графический дизайнер PRO

15 месяцев

Далее
Нетология

Фронтенд-разработчик

11 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Beautiful Soup

Простой
Почему Soup.find возвращает None?
- 1 подписчик
- 03 авг.
- 86 просмотров
1

ответ
Python

+2 ещё

Простой
Как сделать, чтобы при парсинге bs4 как то надо нажать на кнопку «показать еще», чтобы подгрузило еще 20 постов?
- 1 подписчик
- 08 апр.
- 243 просмотра
2

ответа
Парсинг

+1 ещё

Простой
У меня не получается спарсить ссылку на фото с сайта, help?
- 1 подписчик
- 07 апр.
- 218 просмотров
2

ответа
Beautiful Soup

Средний
Как распарсить файл в табличной верстке через beatifulsoap?
- 1 подписчик
- 07 мар.
- 138 просмотров
1

ответ
Beautiful Soup

Простой
Нормально ли что парсинг занимает много оперативки?
- 2 подписчика
- более года назад
- 254 просмотра
2

ответа
Beautiful Soup

+1 ещё

Простой
Как пройти капчу при методе POST?
- 1 подписчик
- более года назад
- 256 просмотров
1

ответ
Beautiful Soup

Простой
Почему скачиваются миниатюры изображений вместо их полного размера?
- 1 подписчик
- более года назад
- 183 просмотра
0

ответов
Beautiful Soup

Простой
Почему парсер не выдаёт нужный результат?
- 1 подписчик
- более года назад
- 130 просмотров
1

ответ
Beautiful Soup

Простой
Python BeautifulSoup почему не работает код?
- 1 подписчик
- более года назад
- 81 просмотр
0

ответов
Beautiful Soup

Простой
Парсится только часть страницы. Как парсить всю страницу?
- 1 подписчик
- более года назад
- 82 просмотра
2

ответа
Показать ещё Загружается…

UI/UX Designer (приложение для поиска подруг)

SUMMEET

от 1 000 до 1 200 $

React Native разработчик в VSRAP

VSRAP Shop • Санкт-Петербург

от 150 000 до 220 000 ₽

Системный аналитик

Bitbanker.ru

от 240 000 ₽

Не надо ставить как можно больше тэгов. Лучше оставить один, но конкретный, с которым проблема.
См.п.3.1 Регламента.
Так наверное на странице всего 30 картинок при первой загрузке. Вы же страницу не скроллите, не вызываете ajax-подгрузку...
Обязательно использовать парсинг? у яндекса вроде бы апишка есть

Answer 1 · 2023-09-07 12:23:52

Скачивает только 30 картинок и потом завершает работу (без ошибок). Что делать в данной ситуации?

В браузере проскролить ленту картинок и найти по какому запросу идёт подзагрузка, выполнять и этот запрос при помощи requests, но не факт, что с requests - это получится, с большой вероятностью придётся использовать selenium для скролинга
PS можно использовать https://serpapi.com/, там 100 реквестов бесплатные

Answer 2 · 2023-09-08 05:25:06

Я в свое время использовал selenium, он умеет грузить страницу и автоматизировать действия на ней, с Яндексом могут возникнуть проблемы из за капчи.
Парсил страницы на Яндекс работе когда она была живая, собирал со страницы необходимые ссылки BeautifulSoup.
Далее обрабатывал ссылке как мне было необходимо. На сколько помню использовал еще fake_useragent

Как парсить яндекс картинки?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт