Библиотека для парсинга lxml

Question

IgaIst @IgaIst

Python
lxml

Библиотека для парсинга lxml

Проблема с парсингом тега «link» в библиотеке lxml

Собственно код:

import lxml.html
xml = '<link>trololo</link>'
doc = lxml.html.document_fromstring(xml)
out = doc.cssselect('link')[0]
print out.text

Всё выполняется, но на выходе получаем:
None

Если заменить тег «link», на любой другой, то проблема исчезает.

Собственно: я в недоумении! Сталкивался ли кто-то с подобным непонятночем?
Или может кто-то подобную(простенькую, маленькую, лёгенькую) либу посоветует?

Вопрос задан более трёх лет назад
4513 просмотров

2 комментария

Подписаться 5 Оценить 2 комментария

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

3 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 207 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 537 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 490 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 280 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 504 просмотра
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 213 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 124 просмотра
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 330 просмотров
1

ответ
Python

Простой
Стоит ли переходить на IDE?
- 1 подписчик
- 25 мая
- 663 просмотра
5

ответов
Python

+2 ещё

Простой
Где хранить сессию SQLAlchemy в FastAPI: в конструкторе сервиса или передавать в каждый метод?
- 2 подписчика
- 23 мая
- 345 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2013-08-14 11:59:33

syschel натолкнул на очень хорошую мысль: я ведь xml парсю html-модулем)

Решение:

from lxml import etree
doc = etree.XML('<link>trololo</link>')
out = doc.xpath('/link')[0].text
print out

Answer 2 · 2013-08-13 22:47:43

То же самое будет, если заменить link на br или img.
Думаю, дело в том, что теги link, br, img по стандарту одиночные, а тут представлены парными.

Библиотека для парсинга lxml

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт