Как получить XPATH из страницы без изменений DOM?

Question

l0cal @l0cal

Как получить XPATH из страницы без изменений DOM?

Chrome добавляет теги tbody вокруг table и других табличных тэгов, htmlagilitypack же их игнорирует. Поэтому XPath созданные Chrome неправильные и HPA не видит ноды. Как получить XPath без лишних тэгов?

Вопрос задан более трёх лет назад
3622 просмотра

1 комментарий

Подписаться 3 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

Яндекс Практикум

Профессиональная вёрстка на HTML и CSS

3 месяца

Далее
Stepik

Основы HTML и CSS

2 недели

Далее
OTUS

HTML/CSS

3 месяца

Далее

Решения вопроса 1

4 комментария

creage @creage

//table[class='newLive']//tr — так правильнее

Написано более трёх лет назад
creage @creage

//table[_тут_знак_собачки_class='newLive']//tr — долбаный парсер

Написано более трёх лет назад
l0cal @l0cal Автор вопроса

Не знаю почему, но у меня класса нету.
Но немного по другому сделаю. Регуляркой выдеру таблицу, а дальше как обычно.
P.S: почему хром выдает такие xpath? Они не используют возможности xpath.

Написано более трёх лет назад
l0cal @l0cal Автор вопроса

Не берет таблицу. Хотя я тут надумал кое-что, сейчас напишу и покажу.
www.mediafire.com/i/?u143um9fi4j98ft

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 2

Комментировать

3 комментария

l0cal @l0cal Автор вопроса

/html/body/div[1]/table/tbody/tr[2]/td[2]/div/div[2]/div/div[1]/table/tbody/tr/td/table/tbody/tr/td[4]/table[1]/tbody

Вот такой у меня xpath, что в нем нужно заменить? Просто xpath для меня как темный лес.
Страница: ru.leonbets.com/
Таблица с экспрессами.

Программа: pastebin.com/wEqRm8i4

Написано более трёх лет назад
Weageoo @Weageoo

Никакими програмками не пользуйтесь. Почитайте стандарт XPath (W3C) — все доступно. Ниже вам все верно советуют (иллюстрация). Для парсинга сайтов рекомендовал бы все же Scrapy.

Написано более трёх лет назад
pietrovich @pietrovich

>> Таблица с экспрессами.
Пардон, «чо-чо»? «Экспресс»в наших краях это такая разновидность ставки на несколько независимых исходов одновременно. Леон за игрока их формирует?!
В общем не понятно что Вы имее те в виду. Поясните, пожалуйста.

P.S.: парсить сайты БК занятие неблагодарное. Леон не дает в паблик фиды с линией? Спросите у них, может быть поделятся. Не захотят — поищите у кого купить их линию, а то и получить бесплатно. Не сомневайтесь, за вас уже давно все распарсили и выложили, вопрос только в стоимости доступа и актуальности линии, если отставание на несколько минут не существенно то проще покупать.

P.S.: в запущеныйх случаях есть надежный способ — внедрение своего JS через userscript который будет парсить любой контент, заворачивать в удобный формат и засылать AJAx'ом на обрабатывающий сервер (спасибо CORS). Недостаток — нужно держать запущенный firefox/chrome в которых этот юзерскрипт работать будет.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Веб-разработка

+1 ещё

Простой
Каким образом правильно сделать скрипт?
- 2 подписчика
- 15 нояб.
- 270 просмотров
2

ответа
HTML

+1 ещё

Простой
Как реализовать форму ввода как в веб-версии chatGPT?
- 1 подписчик
- 13 нояб.
- 160 просмотров
0

ответов
JavaScript

+2 ещё

Простой
Как сделать горизонтальный скролл стрелками?
- 1 подписчик
- 05 нояб.
- 235 просмотров
1

ответ
PHP

+2 ещё

Простой
Создание элемента с необычной формой и прозрачным фоном и рамкой?
- 1 подписчик
- 03 нояб.
- 185 просмотров
0

ответов
.NET

+1 ещё

Простой
Как решить проблему с созданием проекта в решении Visual Studio?
- 1 подписчик
- 29 окт.
- 104 просмотра
1

ответ
HTML

Простой
При клике на кастомную кнопку “Скачать” не происходит переход, хотя JS-обработчик отрабатывает. Как решить?
- 1 подписчик
- 29 окт.
- 186 просмотров
0

ответов
HTML

+1 ещё

Простой
Как создать карточки в рядах со смещением?
- 1 подписчик
- 28 окт.
- 129 просмотров
2

ответа
.NET

Простой
Почему не сохраняется снапшот?
- 1 подписчик
- 28 окт.
- 66 просмотров
0

ответов
Python

+1 ещё

Сложный
Как автоматизировать работу с сайтом используя Camoufox библиотеку?
- 2 подписчика
- 14 окт.
- 183 просмотра
0

ответов
HTML

+1 ещё

Простой
Как в руководстве steam сделать обтекающий картинку текст?
- 1 подписчик
- 08 окт.
- 147 просмотров
1

ответ
Показать ещё Загружается…

PHP-разработчик

FoodSoul • Калининград

от 180 000 до 250 000 ₽

Специалист технической поддержки (чат)

WebSoft

от 50 000 до 70 000 ₽

Frontend Developer (React + Node.js)

Alfabet Service

от 1 000 до 2 000 $

Перефразируюсь: нужен xpath из кода до парсинга страницы движком так как он добавляет нежелательные тэги.

Answer 1 · 2012-07-21 22:05:47

Вам нужно выбрать таблицу с событиями? Зачем же вы парсите весь путь?

//table[class='newLive']//tr — вернет вам все строки таблицы с классом newLive.

Answer 2 · 2012-07-20 17:59:10

Mikhail Osher @miraage

Старый прогер

Как раз у Chrome правильные XPath.

Ответ написан более трёх лет назад

Комментировать

Answer 3 · 2012-07-20 19:25:35

Weageoo @Weageoo

Можно юзать .//table//tr вместо .//table/tr

Ответ написан более трёх лет назад

3 комментария

Как получить XPATH из страницы без изменений DOM?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт