class AmazonproductspiderSpider(scrapy.Spider):
visited_urls = {}
# Читаю файл с ASIN, вызываю parse_item через коллбэк.
def start_requests(self):
........
def parse_item(self, response):
captcha_form = response.xpath('//form[@action="/errors/validateCaptcha"]')
# Если в респонсе найдена каптча, то срабатывает дальнейший блок кода и вызывается get_captcha
if captcha_form:
visited_urls[response.url] += 1
if visited_urls[response.url] < 2:
captcha_img = captcha_form.xpath('.//img/@src').extract_first()
yield scrapy.Request(