Задать вопрос

Как спарсить названия статей с сайта habrahabr при помощи grab python?

Добрый день. Простой вопрос. Как спарсить имена тем с habrahabr. Не пойму какой запрос в селектор вставить вместо "repo_listing" Темы идут с заголовками post_цифры

from grab import Grab

g = Grab()

g.go('http://habrahabr.ru/hub/infosecurity/')

for elem in g.doc.select('//ul[@id="repo_listing"]/li/a'):
    print ('%s: %s' % (elem.text(), elem.attr('href')))
  • Вопрос задан
  • 4785 просмотров
Подписаться 4 Оценить Комментировать
Решения вопроса 2
@VoRez
Backend web developer.
нужно было посмотреть html структуру хабра.
<h1 class="title">
      	<a href="http://habrahabr.ru/post/233297/" class="post_title">Опыт работы эникейщиком/системным администратором в бюджетной организации</a>	
  	<a href="/sandbox/" class="flag flag_sandbox" title="Перейти в песочницу">из песочницы</a>
</h1>

Так что вам нужно
g.doc.select('//h1[@class="title"]/a')
Ответ написан
cha-cha
@cha-cha
Мы точно на один и тот же хабр заходим? Никаких ul/li там нет.
for elem in g.doc.select('//div[@class="post"]/h1/a[@class="post_title"]'):
    print ('%s: %s' % (elem.text(), elem.attr('href')))
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
@zedxxx
Что такое grub: https://ru.wikipedia.org/wiki/GNU_GRUB
Что такое grab, в мире питона: ru.wikibooks.org/wiki/Grab

А то я смотрю, для вас что grab, что grub, всё на одно лицо :)
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы