Как в grab для python, исключить определенную ноду из обработки?

Question

Тимофей Дергачёв @exeto

front-end developer

Как в grab для python, исключить определенную ноду из обработки?

Есть такой код:

from grab import Grab

g = Grab()
g.go('http://habrahabr.ru/post/241889/')
xpath = '//div[contains(@class, "content_left")]//div[contains(@class, "content")]'
print(g.doc.select(xpath).html())

1. Как исключить, к примеру, //div[contains(@class, "polling")]?

2. Как обработать две ноды? Так //div | //span обрабатывается только первая.

Вопрос задан более трёх лет назад
5097 просмотров

2 комментария

Подписаться 3 Оценить 2 комментария

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillfactory

Профессия Python-разработчик

9 месяцев

Далее
Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Что делать если turtle в python не отвечает?
- 1 подписчик
- вчера
- 136 просмотров
2

ответа
Python

Простой
Не могу разобраться почему не работает код python?
- 1 подписчик
- вчера
- 243 просмотра
2

ответа
Python

Простой
Какие есть удобные API для генерации картинок через AI?
- 2 подписчика
- 20 окт.
- 155 просмотров
1

ответ
Python

Простой
Дублирование логов в python logging?
- 3 подписчика
- 19 окт.
- 253 просмотра
1

ответ
Python

+1 ещё

Средний
Как сделать чтоб аккаунт писал при подписке на канал?
- 1 подписчик
- 16 окт.
- 158 просмотров
0

ответов
Python

+1 ещё

Простой
Какие есть простые легковесные LLM для локального использования?
- 2 подписчика
- 14 окт.
- 598 просмотров
2

ответа
Python

+1 ещё

Сложный
Как автоматизировать работу с сайтом используя Camoufox библиотеку?
- 2 подписчика
- 14 окт.
- 131 просмотр
0

ответов
Python

+1 ещё

Простой
FastAPI Prometheus_fastapi_instrumentator где мне следует разместить?
- 1 подписчик
- 09 окт.
- 147 просмотров
1

ответ
Python

+1 ещё

Простой
Пытаюсь пропустить число 10 двумя способами.(правильный второй код) Почему эти два кода дают разный результат?
- 1 подписчик
- 09 окт.
- 559 просмотров
2

ответа
Python

+2 ещё

Простой
В каком слое DTO объект преобразовывать в словарь перед сохранением в БД?
- 1 подписчик
- 08 окт.
- 149 просмотров
2

ответа
Показать ещё Загружается…

Python Developer

Strikt

от 100 000 до 150 000 ₽

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

Python разработчик

ITK academy • Казань

от 75 000 ₽

Лучше задавать вопросы в https://groups.google.com/forum/#!forum/python-grab
Там сидит автор библиотеки.
1. Что значит исключить? Внутри xpath'а содержится див с классом polling? И его надо исключить из объекта полученного в .doc.select(xpath).html()? Тогда регулярки.
2. Какой именно код обрабатывает только 1? Что значит обработать 2 ноды? По отдельности?
@FireGM: уже понял что лучше там было задать.
1. Да, именно это нужно, думал есть более правильный способ.
2. Вот тут можно посмотреть что я имею ввиду.

Answer 1 · 2014-11-02 01:01:24

1. Решение:

from grab import Grab
from grab.tools.lxml_tools import drop_node

url = 'http://habrahabr.ru/post/241889/'
xpath = '//div[contains(@class, "content_left")]//div[contains(@class, "content")]'
drop = '//div[contains(@class, "polling")]'

g = Grab()
g.go(url)
page = g.doc.select(xpath)
drop_node(page.node(), drop)

for element in page:
    print(element.html())

2. Не знаю почему я сразу не обратил внимание, что grab.doc.select() возвращает итерируемый объект. Вот решение:

from grab import Grab

g = Grab()
g.go(url)
xpath = '//div | //span'

for element in g.doc.select(xpath):
    print(element.html())

Как в grab для python, исключить определенную ноду из обработки?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт