@CteplerMarinovich

Почему парсер то работает то нет?

Я написал код, который возвращает описание фильма с кинопоиск, по ссылке формата "kinopoisk.ru/"+id фильма
И он то работает то нет... Первый запуск вернул описание, второй выдал ошибку, мол у обьекта title нет атрибута text, через 40 минут я снова его запустил, и он снова вернул мне описание фильма... Как это работает???

from bs4 import BeautifulSoup
import requests


source = requests.get("https://www.kinopoisk.ru/film/361/")

soup = BeautifulSoup(source.text, "lxml")

title = soup.find("div", class_="styles_filmSynopsis__Cu2Oz")
print(title.text)
  • Вопрос задан
  • 153 просмотра
Решения вопроса 1
@MaxKozlov
Для начала вы можете записать в файл то, что находится в source, и сравнить между собой успешный и неуспешный запуск
...
Судя по наличию в неуспешном ответе "SmartCaptcha", вас распознают как робота.

Увеличиваем таймауты, маскируемся всячески.
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
vldmrmlkv
@vldmrmlkv
Systems engineer
Делайте проверку в цикле.
Попробуйте добавить timeout
source = requests.get("https://www.kinopoisk.ru/film/361/",  timeout=3)

https://docs.python-requests.org/en/latest/user/ad...
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы