Как исправить ошибку «UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa7 in position 11: invalid start byte»?

Question

Sergo Zar @Sergomen

Просто делай добро и оно вернётся

Python

Как исправить ошибку «UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa7 in position 11: invalid start byte»?

Я сделал что-то типо архиватора, и это чтото по моей задумке должно "склеивать"(и обратно. "расклеивать") файлы в один, и также если нужно склеивать так чтобы файлы "маскировались"(или хз как правильно сказать) под другие файлы. Все это работает нормально когда я "склеиваю" файлы, но вот "расклеить" их не получается изза ошибок типо:

Traceback (most recent call last):
  File "files.py", line 78, in <module>
    f_decode(file)
  File "files.py", line 36, in f_decode
    if key in codecs.utf_8_decode(ff)[0]:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa7 in position 11: invalid start byte

ошибки различаются только не декодированым байтом и позицией в зависимости от файла который хочу "расклеить".
Как это исправить?

код

#! /usr/bin/env python3
# -*- coding: utf-8 -*-

import codecs, sys, argparse

key = ":E9 EE E1 E0 ED FB E9 20 F5 F3 E9:"
help_text = '''
    -e\\-encode [файл або кілька файлів(через пробіл)] - запакувати 
    -o\\-output_file файл - кінцевий файл(обов'яковий параметр для -e\\-encode)
    -r\\--rat true\\false - замаскувати файл\\файли під інший файл(true - так,false - ні)(головний файл перший в списку -e, інші маскуються під нього)(в -o вказати файл з розширенням першого файлу)
    -d\\-decode [файл або кілька файлів(через пробіл)] - розпакувати

     '''
def r_file(file,rat):
    f = open(file,'rb')
    temp = b""
    if rat == "false":
        temp += codecs.utf_8_encode(str(key+":"+file+":\n"))[0]
    for ff in f:
        temp += ff
    f.close()

    return temp

def w_file(file,text):
    f = open(file,'wb')
    f.write(text)
    f.close()

def f_decode(file):
    f = open(file,"rb")
    name = ""
    text = b""
    n = 0
    for ff in f: 
        if key in codecs.utf_8_decode(ff)[0]: # строка 36
            text = b""
            name = codecs.utf_8_decode(ff)[0].split(":")[3]
            n = 0
        else:
            f1 = open(name,"ab")
            f1.write(ff)
            f1.close()
            
    f.close()

def createParser ():
    parser = argparse.ArgumentParser()
    parser.add_argument ('-e', '--encode', nargs='+')
    parser.add_argument ('-d', '--decode', nargs='+')
    parser.add_argument ('-o', '--output_file', nargs='?')
    parser.add_argument ('-r', '--rat', nargs='?',default="false")
    parser.add_argument ('-i', '--infa',default=None)
 
    return parser

parser = createParser()
namespace = parser.parse_args(sys.argv[1:])

if namespace.encode != None:
    if namespace.output_file == None:
        print("Параметр -o\\-output_file обов`язковий") 
    else:
        files = namespace.encode
        f = namespace.output_file
        t = b''
        rat = namespace.rat 
        for file in files:
            if rat == "true":
                t += r_file(file,"true")
                rat = "false"
            else:
                t += r_file(file,"false")
        w_file(f,t)
if namespace.decode != None:
    files = namespace.decode
    for file in files:
        f_decode(file) #строка 78

if namespace.infa == None or namespace.infa != None:
    print(help_text)

Вопрос задан более трёх лет назад
3481 просмотр

5 комментариев

Подписаться 1 Простой 5 комментариев

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 194 просмотра
0

ответов
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 55 просмотров
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 173 просмотра
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 182 просмотра
1

ответ
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 125 просмотров
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 219 просмотров
0

ответов
Python

Простой
Как получить конкретный атрибут приложенный в обьект?
- 1 подписчик
- 28 нояб.
- 229 просмотров
1

ответ
Python

Простой
Как сохранить курсор в строке ввода при перезапуске explorer.exe?
- 1 подписчик
- 28 нояб.
- 151 просмотр
1

ответ
Python

Простой
Ошибка IndexError: string index out of range в написании реализации системы Линденмайера – от чего происходит и как исправить?
- 1 подписчик
- 27 нояб.
- 154 просмотра
1

ответ
Python

+1 ещё

Простой
Как сделать рассылку в viber в фоне?
- 1 подписчик
- 22 нояб.
- 113 просмотров
0

ответов
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Software Engineer - ML/LLM

Ennabl • Лимассол

от 650 000 ₽

Почитайте вот тут, если ещё не читали, может что интересное нароете.
Sergo Zar, рекомендую написать найденное вами решение чуть подробнее в виде ответа на вопрос, чтобы другие могли воспользоваться вашим опытом. Я помечу его как ответ.
Алан Гибизов, понял. сейчас напишу.

Answer 1 · 2021-04-26 18:20:17

Как посоветовал Алан Гибизов я прочитал тут и решил проблему заменив codecs.utf_8_decode(ff) на

codecs.decode(ff, encoding='utf-8', errors='replace')

и теперь, насколько я понял, символы которые невозможно прочитать заменяются на другие символы типо "�".

Answer 2 · 2021-04-23 00:27:23

При открытии указать правильную кодировку файла (выбрать подходящий - 'utf-8', 'cp1251', 'cp866', 'koi8_r', 'koi8_u' и т.д.) :
f = open(file,"rb", encoding='...')

Как исправить ошибку «UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa7 in position 11: invalid start byte»?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт