Задать вопрос
@Taya93
Брест

Как справиться с ошибкой 'utf-8' codec can't decode byte 0xc0 in position 199: invalid start byte?

есть сайт, данные с которого получаются в виде
<h4>Àäðåñà ìàãàçèíîâ</h4><br>\n      <h4>ã. Ðûáèíñê</h4><br>\n      <ol>\n        <li>Óë. Ëüâà Îøàíèíà, ä.5 òåë. (4855)26-57-64</li>\n


пытаюсь декодить .content.decode('utf-8') так ошибка utf-8' codec can't decode byte 0xc0 in position 199: invalid start byte
если так делаю .content.decode('utf-8', errors='ignore') то получаю
строку
<h4> </h4><br>\n      <h4>. </h4><br>\n      <ol>\n        <li>.  , .5 . (4855)26-57-64</li>\n        <li>. , . , .10 . (4855)27-38-77</li>\n


как быть ?
  • Вопрос задан
  • 45605 просмотров
Подписаться 1 Простой 6 комментариев
Пригласить эксперта
Ответы на вопрос 4
@angernicky
Я тоже решил этот баг. Вообщем нужно использовать либо CP866, или Windows-1251 кодировку.
Ответ написан
@Taya93 Автор вопроса
Брест
все, нашла решение.
.content.decode('Windows-1251')
это в кодировке Windows-1251
Ответ написан
Комментировать
@deliro
Раскодировать в правильной кодировке
Ответ написан
Комментировать
Guest007
@Guest007
Django, Python, Linux и всё такое...
.content.encode('utf-8')?
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы