Добрый день!
У меня есть файл csv, который дозаписывается каждый день уже несколько месяцев, в котором есть столбец с текстом. Читаю его обычно:
with open ('groups.csv', 'r', encoding='utf-8') as f:
df = pd.read_csv(f, sep=';', index_col = False, encoding='utf-8')
Файл именно дозаписывается и до этого момента всё было окей. Ни файл, ни скрипт не трогал, но сегодня чтение началось df = pd.read_csv срабатывать с ошибкой.
Ругается на символы, которые не может перекодировать (строки с такими символами уже давним числом).
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd1 in position 161660: invalid continuation byte
В эксели они просматриваются так:
Через Notepad они видятся "xD0", "xD1"
Подскажите, пожалуйста, кто знающий, как такие символы в строке можно вычистить (не строки с ними, а сами эти символы) или как правильно считать csv в данном случае?
Сам файл в кодировке utf-8, читаю его тоже utf-8.
Просьба статьи не скидывать, всё уже облазил