Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
crazyybard
1
вклад
3
вопроса
1
ответ
100%
решений
Информация
Информация
Ответы
Вопросы
Комментарии
Подписки
Нравится
Пользователь пока ничего не рассказал о себе
Наибольший вклад в теги
Все теги (2)
Python
1 ответ
3 вопроса
1
Вклад в тег
Подписаться
39k
Beautiful Soup
1 ответ
0 вопросов
1
Вклад в тег
Подписаться
767
Лучшие ответы
пользователя
Все ответы (1)
Парсинг html страницы, проблема кодировки, как исправить?
crazyybard
@crazyybard
from bs4 import BeautifulSoup
with open('index.html', encoding="utf-8") as file:
src = file.read()
# print(src)
soup = BeautifulSoup(src, 'lxml')
text = soup.get_text()
print(text)
Попробуй так но это не точно
Ответ написан
более двух лет назад
Комментировать
Нравится
1
Комментировать
Оценили как «Нравится»
Закрыть
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама