Задать вопрос
@Taylor_Superhero

Как декодировать байты в строку в питон?

soup = content.decode('utf-8')
Пытаюсь декодировать приходящую HTML страницу из байт в строку. Вот ошибка UnicodeEncodeError: 'charmap' codec can't encode character '\xf8' in position 3901: character maps to undefined.
Могу ли я как-то научить UTF распознавать все символы, или может можно игнорировать неизвестные?
  • Вопрос задан
  • 779 просмотров
Подписаться 1 Оценить 7 комментариев
Помогут разобраться в теме Все курсы
  • Нетология
    Fullstack-разработчик на Python + нейросети
    20 месяцев
    Далее
  • Skillfactory
    Профессия Python-разработчик
    9 месяцев
    Далее
  • Яндекс Практикум
    Python-разработчик
    10 месяцев
    Далее
Пригласить эксперта
Ответы на вопрос 1
dimonchik2013
@dimonchik2013
non progredi est regredi
юзай chardet для правильной кодировки

универсального решения нет,
но да - можно заменить/выкинуть все не-ascii символы
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы