@Artur18
Новичок

Парсинг html страницы, проблема кодировки, как исправить?

from bs4 import BeautifulSoup
with open('index.html') as file:
  src = file.read()
# print(src)  

soup = BeautifulSoup(src, 'lxml')

text = soup.get_text()
print(text)


Вместо нормальных предложений выдаёт набор из символов. В html странице указан UTF-8
  • Вопрос задан
  • 84 просмотра
Решения вопроса 1
@crazyybard
from bs4 import BeautifulSoup
with open('index.html', encoding="utf-8") as file:
src = file.read()
# print(src)

soup = BeautifulSoup(src, 'lxml')

text = soup.get_text()
print(text)
Попробуй так но это не точно
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы