Почему Scrapy Xpath не парсит некоторые выражения?

Question

tispoint @tispoint

XPath
Scrapy

Почему Scrapy Xpath не парсит некоторые выражения?

Добрый день!
Пытаюсь освоить Scrapy, путем адаптации найденного работоспособного примера под свои нужды.

#! coding: utf-8
__author__ = 'acman'
from scrapy.contrib.spiders import CrawlSpider, Rule
from scrapy.contrib.linkextractors import LinkExtractor
from scrapy.item import Item, Field
from scrapy.contrib.loader import XPathItemLoader
from scrapy.contrib.loader.processor import TakeFirst
from scrapy.selector import HtmlXPathSelector
#
#
class ScrapyTestItem(Item):
    title = Field()
    imagelink = Field()
    url = Field()
    price = Field()
    field_11 = Field()

class Test03Loader(XPathItemLoader):
    default_output_processor = TakeFirst()    
  
class ScrapyTestSpider(CrawlSpider):
    name = "test03"
    allowed_domains = ["pastelmebel.ru"]
    start_urls = ["http://pastelmebel.ru/shop/bedroom-furniture/bedroom-august/the-cabinet-wall-s-83-sfw1w-august-wenge/"]

    rules = (
        Rule(LinkExtractor(allow=('/bedroom-august/')), 
            callback='parse_item', follow=True),
    )

    def parse_item(self, response):
        hxs = HtmlXPathSelector(response)
        l = Test03Loader(ScrapyTestItem(), hxs)

        l.add_xpath('title', "//h1[last()]/text()")
        l.add_xpath('imagelink', "//img[1]/@src")
        l.add_xpath('price', "//*[@class='itemOtherPricePrice number']/text()")  
        l.add_xpath('field_11', ".//*[@id='tab-sub-about-features']/table/tbody/tr[1]/td[2]/span") 
        l.add_value('url', response.url)

        return l.load_item()

Так вот, в итоговый вывод не попадает поле field_11, остальные (заголовок, цена, путь картинки) парсятся нормально.
Выражение для Xpath брал из FirePath - там все нормально, валидное.

Что еще может быть?

Вопрос задан более трёх лет назад
512 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Профессия Инженер по автоматизации тестирования

9 месяцев

Далее
Яндекс Практикум

Инженер по тестированию: от новичка до автоматизатора

9 месяцев

Далее
Stepik

Работа с документами в Java

2 недели

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

XPath

Средний
Как в wp all import по xpath надо выйти в соседнюю ветку?
- 1 подписчик
- 20 февр.
- 60 просмотров
1

ответ
JavaScript

+3 ещё

Простой
Как правильно передать xpath в Cypress?
- 1 подписчик
- более года назад
- 45 просмотров
0

ответов
Telegram

+1 ещё

Простой
Можно ли скрапить телеграмм?
- 1 подписчик
- более года назад
- 379 просмотров
1

ответ
Парсинг

+1 ещё

Простой
Как найти источник данных этого сайта?
- 1 подписчик
- более года назад
- 266 просмотров
1

ответ
JavaScript

+1 ещё

Средний
Как получить потомков с использованием xpath?
- 2 подписчика
- более года назад
- 202 просмотра
1

ответ
Excel

+2 ещё

Простой
Как победить XPath?
- 2 подписчика
- более года назад
- 241 просмотр
1

ответ
HTML

+2 ещё

Средний
Нужно составить xPath, в зависимости от содержимого родительских узлов, как?
- 1 подписчик
- более года назад
- 103 просмотра
1

ответ
HTML

+2 ещё

Простой
Как вытянуть значение из парсера на c#?
- 1 подписчик
- более года назад
- 169 просмотров
1

ответ
HTML

+2 ещё

Средний
Как через xpath достать язык страницы?
- 1 подписчик
- более года назад
- 65 просмотров
1

ответ
HTML

+2 ещё

Средний
Какая формула xpath будет переходить с главной страницы по условию(названию анкора) и находить заданные данные?
- 1 подписчик
- более года назад
- 51 просмотр
1

ответ
Показать ещё Загружается…

Координатор заявок service desk

ИТ-Холдинг Т1 • Самара

от 45 000 до 45 000 ₽

Python разработчик Senior/Lead (Django, DRF)

Hello, Doc!

от 250 000 до 300 000 ₽

React Native Developer

SMALL

До 370 000 ₽

Answer 1 · 2016-03-06 16:27:44

а Вы сами, простите, понимаете что там написано? )
.// этот как?
еще и *

постарайтесь научиться писать XPath выражения (подсказка - это когда в них не будет вот такого вот [1] [2]) и работа с XPath станет легкой и понятной

Answer 2 · 2016-08-30 15:46:35

Alexey Savinov @dreamhost

удалите /tbody/

тестировать выражения можно в scrapy slell
например
scrapy shell http://targetsite.com

Ответ написан более трёх лет назад

Комментировать

Почему Scrapy Xpath не парсит некоторые выражения?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт