Задать вопрос

MeinJun @MeinJun

html

HTML
Python

Как спарсить текст с Content-Encoding: gzip?

Вот функция супа:

def get_content(html):
            soup = BeautifulSoup(html, 'html.parser')
            items = soup.findall('div', class='column')

            for item in items:
                info = {
                    'title': item.find('h1', class_='page__title title').get_text(),
                    'timedate': item.find('span', class='date-display-single').get_text(),
                    'textstat': item.find('div', class='field-item even').get_text(),
                }
                news.append(info)
            return news

А вот то, что выводит в консоль:

{'title': 'Врачи предупредили об опасности бессонной ночи', 'time_date': '01.01.2020 в 17:34', 'text_stat': '01.01.2020 в 17:34'}]

Т.е. вместо текста статьи выводится дата, хотя все классы проверены тысячу раз, всё идет куда надо.
В коде элемента класс помечен так - div class="field-item even" property="content:encoded"
в заголовке нетворка - Content-Encoding: gzip

Можно ли как-то спарсить такой текст в статье? И вообще в этом ли загвоздка?

Вопрос задан более трёх лет назад
73 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Профессиональная вёрстка на HTML и CSS

3 месяца

Далее
Stepik

Основы HTML и CSS

2 недели

Далее
Бруноям

Вёрстка на HTML и CSS

3 месяца

Далее

Решения вопроса 1

MeinJun @MeinJun Автор вопроса

Окей, сорри за ваше потраченное время. Моя ошибка, я всё-таки запутался в тысячах классов и не увидел нужный

Ответ написан более трёх лет назад

Комментировать

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 13 часов назад
- 63 просмотра
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- вчера
- 128 просмотров
0

ответов
JavaScript

+2 ещё

Простой
Как сделать резкое переключение слайдов?
- 1 подписчик
- 03 дек.
- 128 просмотров
0

ответов
Python

Простой
Как получить конкретный атрибут приложенный в обьект?
- 1 подписчик
- 28 нояб.
- 209 просмотров
1

ответ
Python

Простой
Как сохранить курсор в строке ввода при перезапуске explorer.exe?
- 1 подписчик
- 28 нояб.
- 138 просмотров
1

ответ
Python

Простой
Ошибка IndexError: string index out of range в написании реализации системы Линденмайера – от чего происходит и как исправить?
- 1 подписчик
- 27 нояб.
- 130 просмотров
1

ответ
HTML

+1 ещё

Средний
В какую сторону копать решение чтобы решить проблему с наложением?
- 1 подписчик
- 22 нояб.
- 137 просмотров
0

ответов
Python

+1 ещё

Простой
Как сделать рассылку в viber в фоне?
- 1 подписчик
- 22 нояб.
- 106 просмотров
0

ответов
HTML

+1 ещё

Простой
Как растянуть вложенный блок внутри других блоков на максимальную длину, но не более чем на ширину страницы?
- 1 подписчик
- 21 нояб.
- 136 просмотров
0

ответов
Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- 15 нояб.
- 250 просмотров
1

ответ
Показать ещё Загружается…

WordPress (PHP, HTML/CSS) разработчик

Epiic

от 90 000 ₽

Automation QA Engineer (Java)

ITK academy • Москва

от 90 000 ₽

Frontend разработчик (ReactJS, TypeScript)

Arkline

от 120 000 до 200 000 ₽