Есть текстовый файл объемом 1.2 ГБ, есть скрипт на питоне, который читает его построчно.
logFile = open(sys.argv[1], 'r')
count = 0;
for log in logFile:
print(count) #номер обрабатываемой строки.
count += 1
...
Но при чтении файла на 36934 строке возникает такая ошибка:
File "./parcer.py", line 75, in <module>
for log in logFile:
File "/usr/lib/python3.6/codecs.py", line 321, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc8 in position 867: invalid continuation byte
Как это починить?
Файл большой, и при попытке открыть файл каким либо текстовым редактором редактором он зависает.
работаю под linux'ом