Для личных нужд понадобился небольшой парсер отчетов.
На хабре как раз в этот момент писали про LXML и как он быстро работает. Решил попробовать сделать красиво.
В результате застрял с Element table.
PR = xml = lxml.html.document_fromstring(open('test.html').read().decode('utf-8'))
i = 1
while True:
table = PR.xpath('/html/body/table['+str(i)+']')
if not table:
break
i += 1
print table
Результатом является набор [<Element table at 0x********>]
Единственное что нашел это дальше сделать table[0].text_content() и получить множество строк из таблици.
Мне же хотелось бы красиво получить заголовки с каждой таблицы + массив(массивы) только тех колонок из таблице которые мне нужны что бы потом отфильтровать нужные значения и вывести в читаемом виде.
Заранее спасибо.