MikeVL
@MikeVL

Как лучше обрабатывать большие XML фалы в Python?

Приветствую!

Столкнулись с проблемой обработки больших XML файлов в Python.
Есть файл объёмом 300Мб, в нём содержится 250 000 элементов <offer>...</offer>.

> cat yml_products_1.xml | grep -c '<offer '
250000


При обработке находятся не все элементы, а только 62719.

xmlprice.xml.root.xpath('count(shop/offers/offer)')
62719


Парсер вызывается следующим образом:

etree.XMLParser(resolve_entities=False, remove_blank_text=True, recover=True, huge_tree=True)


В чём может быть проблема?
  • Вопрос задан
  • 314 просмотров
Пригласить эксперта
Ответы на вопрос 1
Astrohas
@Astrohas
Python/Django Developer
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы