Tera4Byte
@Tera4Byte
-

Не распознаётся кириллица в Python. Как исправить?

Здравствуйте. Решил в качестве теста запарсить сайт "http://подолино-смоленский-храм.рф/raspisanie.html", но после парсинга выводится в консоль PyCharm вместо текста расписания это (небольшой кусочек выведенного результата):

6 маÑÑа(ÑÑббоÑа)
9:00
ÐожеÑÑÐ²ÐµÐ½Ð½Ð°Ñ ÐиÑÑÑгиÑÐаниÑида

16:00
ÐÑеноÑное бдение

ÐÐµÐ´ÐµÐ»Ñ Ð¼ÑÑопÑÑÑнаÑ. РСÑÑаÑном ÑÑде.ÐбÑеÌÑение моÑей мÑÑеников, иже во Ðвгении.

7 маÑÑа(воÑкÑеÑенÑе)
9:00
ÐожеÑÑÐ²ÐµÐ½Ð½Ð°Ñ ÐиÑÑÑгиÑÐолебен Ñ Ð°ÐºÐ°ÑиÑÑом иконе Ðожией ÐаÑеÑи «ÐÑеÑаÑиÑа» и водооÑвÑÑениемÐиÑиÑ

Process finished with exit code 0

Т. е текст, почему-то, кодируется, хотя я об этом его не прошу. Буду очень благодарен если объясните, что я делаю не так, и как это исправить.

Вот сам код:
----------------------------------------------------------------------------------------
from base_of_bot import UserAgent, Accept
import requests as req
from bs4 import BeautifulSoup as bs

url_site = 'http://подолино-смоленский-храм.рф/raspisanie.html'
headers = {
"Accept": Accept,
"User-Agent": UserAgent
}

req_header = req.get(url_site, headers=headers)
src = req_header.text
soup = bs(src, 'lxml')
actual_schedule = soup.find("div", { 'class':'content' } ).text
print(actual_schedule)
----------------------------------------------------------------------------------------
  • Вопрос задан
  • 2389 просмотров
Решения вопроса 1
hottabxp
@hottabxp Куратор тега Python
Сначала мы жили бедно, а потом нас обокрали..
После строки:
req_header = req.get(url_site, headers=headers)
добавьте:
req_header.encoding = req_header.apparent_encoding

Название переменных сломали мне мозг.
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы