from lxml import etree
html = '<html><body><p id="test">data</p></body></html>'
root = etree.fromstring(html)
print(root.xpath('.//*[@id="test"]')[0].text)
> data
Получить содержимое html для парсинга можно примерно так:
import requests
response = requests.get('http://ya.ru')
html = response.text