Chrome добавляет теги tbody вокруг table и других табличных тэгов, htmlagilitypack же их игнорирует. Поэтому XPath созданные Chrome неправильные и HPA не видит ноды. Как получить XPath без лишних тэгов?
Не знаю почему, но у меня класса нету.
Но немного по другому сделаю. Регуляркой выдеру таблицу, а дальше как обычно.
P.S: почему хром выдает такие xpath? Они не используют возможности xpath.
Никакими програмками не пользуйтесь. Почитайте стандарт XPath (W3C) — все доступно. Ниже вам все верно советуют (иллюстрация). Для парсинга сайтов рекомендовал бы все же Scrapy.
>> Таблица с экспрессами.
Пардон, «чо-чо»? «Экспресс»в наших краях это такая разновидность ставки на несколько независимых исходов одновременно. Леон за игрока их формирует?!
В общем не понятно что Вы имее те в виду. Поясните, пожалуйста.
P.S.: парсить сайты БК занятие неблагодарное. Леон не дает в паблик фиды с линией? Спросите у них, может быть поделятся. Не захотят — поищите у кого купить их линию, а то и получить бесплатно. Не сомневайтесь, за вас уже давно все распарсили и выложили, вопрос только в стоимости доступа и актуальности линии, если отставание на несколько минут не существенно то проще покупать.
P.S.: в запущеныйх случаях есть надежный способ — внедрение своего JS через userscript который будет парсить любой контент, заворачивать в удобный формат и засылать AJAx'ом на обрабатывающий сервер (спасибо CORS). Недостаток — нужно держать запущенный firefox/chrome в которых этот юзерскрипт работать будет.