ehles

Question

MySQL
+1 ещё

Как реализовать выборку из таблиц mysql, связанных как один ко многим?

2 подписчика
более трёх лет назад
3427 просмотров

3

ответа

Answer 1 · 2014-04-08 16:15:55

Делаем запрос примерно так:

import json
from scrapy.contrib.spiders import CrawlSpider

class my_super_spider(CrawlSpider):
    start_urls = ["http://domain.com"]
    url = "http://domain.com/?postcode=123&sku=blablabla"
    def parse(self, response):
        # Тут можно распарсть response (ответ на запрос из start_urls) или просто нагенерить
        # новых запросов, или и то и другое.
        yield Request(url, callback=self.parse_my_url)
    def parse_my_url(self, response):
        # Если сайт отдает ответ в виде json то так:
        data_from_json = json.loads(response.body)
        # Если сайт отдает html то так:
        # xpath можно узнать в панели отладки хрома (правой кнопкой мышки на элементе), например:
        xpath_name = '//*[@id="global"]/div/table/tbody/tr/td[%(col)s]/table/tbody/tr/td/a/text()'
        hxs = HtmlXPathSelector(response)
        column = 100500
        data_from_html = hxs.select(xpath_name % {'col': column}).extract()
        
        # Далее "собираем" items и сохраняем в БД или ещё куда там у вас..

по комментариям в коде должно стать всё понятно.

P.S. как делать тут хорошо описано: doc.scrapy.org/en/latest/topics/spiders.html

P.P.S. Эмулировать куки, со scrapy не надо, он всё сам делает (конечно, если надо, доступ к ним получить можно).

ehles

Достижения

Наибольший вклад в теги

Python

Scrapy

Мышь

Лучшие ответы пользователя

Scrapy: Response, Request - как получить значение?

Лучшие вопросы пользователя

Как реализовать выборку из таблиц mysql, связанных как один ко многим?

Scrapy: Response, Request - как получить значение?

Как реализовать выборку из таблиц mysql, связанных как один ко многим?

Войдите на сайт