Указанные в start_urls =[] запрашиваются асинхронно. Вы отправлятете запрос к странице авторизации и контенту одновременно.
Основная ваша проблема неправильный Post -запрос. Вместо
https://ecom.elko.ru/Account/Login
должно быть
https://ecom.elko.ru/Account/Login?ReturnUrl=%2fCatalog%2fCategory%2fSCO
Вопрос об авторизации,вот рабочий код для ее прохождения.
import scrapy
from scrapy.contrib.spiders import CrawlSpider
from scrapy.item import Item, Field
from scrapy.contrib.loader import XPathItemLoader, ItemLoader
from scrapy.http import Request, FormRequest
class ScrapyTestItem(scrapy.Item):
title = Field()
url = Field()
class ScrapyTestSpider(CrawlSpider):
name = "catalog"
def start_requests(self):
return [
FormRequest(
"https://ecom.elko.ru/Account/Login?ReturnUrl=%2fCatalog%2fCategory%2fSCO",
formdata={"Username": "ваш_логин", "Password": "ваш_пароль"}
)]
def parse(self, response):
print(response.url)
# Парсим страницу или отправляем запрос на другие.
Перенаправление на страницу каталога
ecom.elko.ru/Catalog/Category/SCO2016-12-18 12:32:55 [scrapy] DEBUG: Redirecting (302) to <GET https://ecom.elko.ru/Catalog/Category/SCO> from <POST https://ecom.elko.ru/Account/Login?ReturnUrl=%2fCatalog%2fCategory%2fSCO>