Как спарсить тег со вложенными в него тегами в BS4?

Question

Gero39 @Gero39

Как спарсить тег со вложенными в него тегами в BS4?

Доброго дня/вечера/ночи.

У меня такая проблема. Нужно достать данные из тега, который закрывается в неудобном месте. Из примера должно стать понятно:

import requests
from bs4 import BeautifulSoup

link = "URL" 
responce = requests.get(link).text
soup = BeautifulSoup(responce, 'html.parser')

'''
<body>
  <div class="gbox">
    <div class="g-box-contents">
       <div class="detailed-item" data-tagnames="Нужный мне текст">
         <a class="thumb" href="Ненужный мне текст" >
           <img src="Ещё более ненужный текст">
              </a>
        <div class= "item-info" ....
         .... ещё больше вложений
        </div>
        </div>

'''
block = soup.find('div', class_='g-box-contents')

div = block.find_all('div', class_='detail-item', limit=1, recursive=False)[0] #перепробовал много вариантов.

print(div)

Выводится вся ветка входящая в div, а мне нужно только начало. В приведенном коде мог ошибиться, т.к перепечатывал под пример без сайта.

Сам сайт дать не могу, он очень специфический.

Заранее спасибо за ответ!

Вопрос задан более трёх лет назад
734 просмотра

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Чтобы сделать несколько запросов к OpenAI серверу из Python, нужно каждый раз вызывать client.chat.completions.create?
- 1 подписчик
- 16 часов назад
- 61 просмотр
2

ответа
Python

Простой
Какой отлдачик для Python поставить новичку?
- 1 подписчик
- вчера
- 101 просмотр
2

ответа
Python

Простой
Существует ли менеджер виртуальных окружений для python, который хранит все пакеты в одном месте?
- 3 подписчика
- 18 дек.
- 184 просмотра
1

ответ
Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 217 просмотров
1

ответ
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 73 просмотра
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 194 просмотра
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 222 просмотра
1

ответ
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 141 просмотр
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 245 просмотров
0

ответов
Парсинг

Простой
Видит ли администрация сайта сканирование,и можно ли скрыть?
- 1 подписчик
- 07 дек.
- 398 просмотров
2

ответа
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Backend Developer

Hard Bootstrapping LLC. • Санкт-Петербург

от 175 000 до 350 000 ₽

Answer 1 · 2022-10-03 23:46:01

Если data-tagnames="Нужный мне текст" , то это атрибуты тега. Того тега, который внутри найденного первый раз.

for i in block:
    try:
        print ( i, ':', i.get('data-tagnames', '\r\n') )
    except Exception:
        print (i, ':','Attr.: no data-tagnames', '\r\n')

Как спарсить тег со вложенными в него тегами в BS4?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт