@Taylor_Superhero

Как декодировать байты в строку в питон?

soup = content.decode('utf-8')
Пытаюсь декодировать приходящую HTML страницу из байт в строку. Вот ошибка UnicodeEncodeError: 'charmap' codec can't encode character '\xf8' in position 3901: character maps to undefined.
Могу ли я как-то научить UTF распознавать все символы, или может можно игнорировать неизвестные?
  • Вопрос задан
  • 764 просмотра
Пригласить эксперта
Ответы на вопрос 1
dimonchik2013
@dimonchik2013
non progredi est regredi
юзай chardet для правильной кодировки

универсального решения нет,
но да - можно заменить/выкинуть все не-ascii символы
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы