@grezzzle

Парсинг html с помощью grab?

Приветствую. Не могу понять в чем у меня ошибка. Необходимо получить html страницы, вытащить ссылки находящиеся в таблице. Регулярные выражения к сожалению не знаю.
def loadPage(url):
    g = Grab()
    g.setup(timeout=15, connect_timeout=10)
    g.go(url)
    html = str(g.response.body)
    return html

resp = loadPage(site)
fuck = lxml.html.document_fromstring(resp)
links = fuck.xpath('//tr/td/a')
print(links)

--
PS Может кто скинуть ссылку на актуальную документацию кроме официальной, может где то есть? docs.grablib.org/en/latest/index.html
  • Вопрос задан
  • 218 просмотров
Пригласить эксперта
Ответы на вопрос 1
@shamanovski
Для быстрых небольших парсингов лучше использовать BeautifulSoup
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы