Парсю страницу с помощью Scrapy
https://www.reformagkh.ru/myhouse/profile/view/7913930/
Написал такой код:
def parse_item(self, response):
hxs = HtmlXPathSelector(response)
l = ReformaLoader(ReformaItem(), hxs)
l.add_xpath('house', '/html/body/div[1]/div[2]/h1/span[2]/span[1]/text()')
l.add_xpath('organization', '/html/body/div[1]/div[2]/section/div[1]/table[1]/tbody/tr/td[2]/a/text()')
l.add_xpath('year',
'/html/body/div[1]/div[2]/div[7]/div/div/div[1]/div/div/table/tbody/tr[4]/td[2]/span/text()')
return l.load_item()
Потом дотукал что данные представлены в виде таблицы, и можно не писать полный XPATh путь, а просто циклом for проходить по таблицы и извлекать нужные поля
titles = hxs.xpath("//table[@class='orders overhaul-services-table']//tr")
for titles in titles:
l.add_xpath(????)
Но никак не пойму как обращаться в самом цикле к элементам таблицы, которые нужно извлечь. Или я избрал не тот путь решения задачи? Подскажите куда копать?
P.S. Во вкладке лифты, таблица с данным бывает разной, в зависимости от дома. Поэтому и первое мое решение не есть хорошее