Ответы пользователя по тегу Парсинг
  • Научиться парсингу - с чего начать?

    @Unknown007
    Отличная библиотека для парсинга сайтов - grab. Правда, на питоне. Самому пришлось изучить python только ради использования этой библиотеки, и не пожалел - удобный язык, как и библиотека - делаете запросы на xpath и сохраняете результаты:
    g = Grab(log_file='parse_log.html')
    g.go(url)
    pages_block = g.doc.select('//div[contains(@class,"pager")]/div[contains(@class, "pages")]')
    if pages_block:
        pages = pages_block.select('.//li/a[not(@title="Next" or @title="Previous")]')
        page_hrefs = []
        for page in pages:
            href = page.node.attrib['href']
            page_hrefs.append(href)
            print "Page: %d" % int(page.text())
    Ответ написан
    4 комментария