@hardwellZero

Как достать текст без тега?

Добрый день.
Нужно достать текст из сайта (спарсить) у которого нет опознавательных атрибутов.
Разметка выглядит вот так:
36be0bc354af4078bc101632535cf065.png
Ссылки на статью уже достал, теперь нужен заголовок к ней.
Использую BS4, Python.
Каким образом можно получить его?
  • Вопрос задан
  • 9546 просмотров
Пригласить эксперта
Ответы на вопрос 3
@strelov1
Используй xpatch там это просто xpath_text('//div/text()')
Ответ написан
Viper029
@Viper029
Программирую за печенье
Регулярные выражения используй
Ответ написан
Комментировать
skipirich
@skipirich
проходил мимо
import bs4

title = '<h3 class="null" style="margin:0; padding:0;">This is a title</h3>'
soup = bs4.BeautifulSoup(title)
print soup.select('h3')[0].get_text()

Так подойдет?
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы