Задать вопрос

Библиотека для парсинга lxml

Проблема с парсингом тега «link» в библиотеке lxml

Собственно код:

import lxml.html
xml = '<link>trololo</link>'
doc = lxml.html.document_fromstring(xml)
out = doc.cssselect('link')[0]
print out.text


Всё выполняется, но на выходе получаем:
None

Если заменить тег «link», на любой другой, то проблема исчезает.

Собственно: я в недоумении! Сталкивался ли кто-то с подобным непонятночем?
Или может кто-то подобную(простенькую, маленькую, лёгенькую) либу посоветует?
  • Вопрос задан
  • 4501 просмотр
Подписаться 5 Оценить 2 комментария
Решения вопроса 1
@IgaIst Автор вопроса
syschel натолкнул на очень хорошую мысль: я ведь xml парсю html-модулем)

Решение:

from lxml import etree
doc = etree.XML('<link>trololo</link>')
out = doc.xpath('/link')[0].text
print out
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
Ramires
@Ramires
То же самое будет, если заменить link на br или img.
Думаю, дело в том, что теги link, br, img по стандарту одиночные, а тут представлены парными.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
22 дек. 2024, в 14:07
15000 руб./за проект
22 дек. 2024, в 13:01
50000 руб./за проект
22 дек. 2024, в 10:44
15000 руб./за проект