@MeinJun

Как спарсить текст с Content-Encoding: gzip?

Вот функция супа:
def get_content(html):
            soup = BeautifulSoup(html, 'html.parser')
            items = soup.findall('div', class='column')

            for item in items:
                info = {
                    'title': item.find('h1', class_='page__title title').get_text(),
                    'timedate': item.find('span', class='date-display-single').get_text(),
                    'textstat': item.find('div', class='field-item even').get_text(),
                }
                news.append(info)
            return news

А вот то, что выводит в консоль:

{'title': 'Врачи предупредили об опасности бессонной ночи', 'time_date': '01.01.2020 в 17:34', 'text_stat': '01.01.2020 в 17:34'}]

Т.е. вместо текста статьи выводится дата, хотя все классы проверены тысячу раз, всё идет куда надо.
В коде элемента класс помечен так - div class="field-item even" property="content:encoded"
в заголовке нетворка - Content-Encoding: gzip

Можно ли как-то спарсить такой текст в статье? И вообще в этом ли загвоздка?
  • Вопрос задан
  • 69 просмотров
Решения вопроса 1
@MeinJun Автор вопроса
Окей, сорри за ваше потраченное время. Моя ошибка, я всё-таки запутался в тысячах классов и не увидел нужный
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы