Вот функция супа:
def get_content(html):
soup = BeautifulSoup(html, 'html.parser')
items = soup.findall('div', class='column')
for item in items:
info = {
'title': item.find('h1', class_='page__title title').get_text(),
'timedate': item.find('span', class='date-display-single').get_text(),
'textstat': item.find('div', class='field-item even').get_text(),
}
news.append(info)
return news
А вот то, что выводит в консоль:
{'title': 'Врачи предупредили об опасности бессонной ночи', 'time_date': '01.01.2020 в 17:34', 'text_stat': '01.01.2020 в 17:34'}]
Т.е. вместо текста статьи выводится дата, хотя все классы проверены тысячу раз, всё идет куда надо.
В коде элемента класс помечен так - div class="field-item even" property="content:encoded"
в заголовке нетворка - Content-Encoding: gzip
Можно ли как-то спарсить такой текст в статье? И вообще в этом ли загвоздка?