Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
VitaliySm
0
вклад
11
вопросов
3
ответа
100%
решений
Ответы
Информация
Ответы
Вопросы
Комментарии
Подписки
Нравится
Достижения
Как правильно задать уникальное поле в mongodb?
VitaliySm
@VitaliySm
Автор вопроса
Решил вопрос так:
self.prod_coll.insert({ 'p_id': item['p_id'], 'code': item['code'], 'page_url': item['page_url']})
self.prod_coll.ensure_index([('p_id', pymongo.ASCENDING), ('unique', True)])
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Как парсить множество разных сайтов?
VitaliySm
@VitaliySm
Автор вопроса
проблема была в том, что я указывал allowed_domains = ["domain"], и поэтому паук не переходил на внешие ресурсы. указав таким образом allowed_domains = [], решил проблему.
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Как перенаправить паука на внешний ресурс?
VitaliySm
@VitaliySm
Автор вопроса
решил вот так:
def parse_start_url(self, response):
url = response.xpath("__xpath___").extract()
yield Request("%доп_часть_урла" % url[0], callback=self.parse_url)
def parse_url(self, response):
item = TestItem()
item['telephone'] = response.xpath('__xpath____').extract()
return item
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Оценили как «Нравится»
Закрыть
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама