Как достать текст без тега?

Question

hardwellZero @hardwellZero

Как достать текст без тега?

Добрый день.
Нужно достать текст из сайта (спарсить) у которого нет опознавательных атрибутов.
Разметка выглядит вот так:

Ссылки на статью уже достал, теперь нужен заголовок к ней.
Использую BS4, Python.
Каким образом можно получить его?

Вопрос задан более трёх лет назад
9587 просмотров

2 комментария

Подписаться 2 Оценить 2 комментария

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ответы на вопрос 3

1 комментарий

Комментировать

2 комментария

hardwellZero @hardwellZero Автор вопроса

Нет. Смотрите тему внимательнее.

Написано более трёх лет назад
Роман @skipirich
Ааа я понял :), извини. Ну тогда вот такой вариант
import bs4 import re raw = '''<h3 class="null" style="margin:0; padding:0;">This is a title</h3> TROLOLO <a href="#">This is link</a>''' raw = re.sub("</h3>(.+)<a", r"</h3><mytag>\1</mytag><a", raw, flags=re.DOTALL) soup = bs4.BeautifulSoup(raw) print soup.select('mytag')[0].get_text()

т.е вначале текст без тега загоняем в придуманный тег а потом его супом.
Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- 19 июл.
- 75 просмотров
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 91 просмотр
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 310 просмотров
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 234 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 654 просмотра
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 550 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 307 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 566 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 228 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 141 просмотр
1

ответ
Показать ещё Загружается…

какой именно текст из этой разметки ты хочешь достать?

Answer 1 · 2015-05-22 17:32:32

Eugene Ki @qqq3

Junior user

Как распарсить текст в div'е, игнорируя вложенные теги, BeautifulSoup?

Ответ написан более трёх лет назад

1 комментарий

Answer 2 · 2015-05-23 01:14:07

Elios @strelov1

Используй xpatch там это просто xpath_text('//div/text()')

Ответ написан более трёх лет назад

1 комментарий

Answer 3 · 2015-05-22 17:28:36

Антон Родионов @Viper029

Программирую за печенье

Регулярные выражения используй

Ответ написан более трёх лет назад

Комментировать

Answer 4 · 2015-05-31 09:42:45

Роман @skipirich

проходил мимо

import bs4

title = '<h3 class="null" style="margin:0; padding:0;">This is a title</h3>'
soup = bs4.BeautifulSoup(title)
print soup.select('h3')[0].get_text()

Так подойдет?

Ответ написан более трёх лет назад

2 комментария

Как достать текст без тега?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт