Почему два CSV файла после удаления нескольких строк читаются по разному?

Question

JRBRO @JRBRO

Python
CSV

Почему два CSV файла после удаления нескольких строк читаются по разному?

Вообщем, есть csv файл который прекрасно работает.

Я удалил несколько строк не меняя 1ую и на макбуке экспортировал его как .csv. Визуально они ничем не отличаются, но измененный выдает такой результат. Файлы хранятся локально

AttributeError: 'DataFrame' object has no attribute 'Nr.'

При вызове распечатки столбцов

data = pd.read_csv(sys.argv[1])
print(data.columns)

Отредактированный файл выдает
Index([';Nr.'], dtype='object')
А оригинальный

Index(['Nr.'],
      dtype='object')

Где может быть собака зарыта? Визуально первая строка ничем не отличается. Пробовал копировать одну в другую, ничего не помагает

Вопрос задан более трёх лет назад
88 просмотров

3 комментария

Подписаться 1 Простой 3 комментария

Модератор @TosterModerator

Название вопроса противоречит описанию. В названии сказано, что файлы одинаковые. В тексте вы пишете, что файлы разные.
Необходимо переименовать вопрос, в противном случае он будет удален, т.к. на него нельзя ответить однозначно.

Также рекомендую привести полноценный пример:
Два файла на файлообменнике или фрагменты файлов в вопросе, и код в вопросе, который с этими фрагментами файлов ведёт себя описанным образом.

Написано более трёх лет назад
JRBRO @JRBRO Автор вопроса

Подправил.

Написано более трёх лет назад
JRBRO @JRBRO Автор вопроса
Получается всему виной экспорт.

До экспорта показывает

Index(['Unnamed: 0', 'Nr.', '1', '2', '3', '4', '5'], dtype='object')

После
Index([';Nr.;1;2;3;4;5'], dtype='object')

Excel делает тоже самое
Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+3 ещё

Простой
Авто торговля на байбите?
- 1 подписчик
- 15 мая
- 328 просмотров
1

ответ
Python

Простой
Как научиться извлекать математическую модель для решения задач на программирование?
- 1 подписчик
- 14 мая
- 234 просмотра
2

ответа
Python

+3 ещё

Средний
Как перенести позу SMPL модели на игровую 3д модель?
- 2 подписчика
- 10 мая
- 283 просмотра
1

ответ
Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 280 просмотров
2

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 315 просмотров
2

ответа
Python

Простой
В чем ошибка в использовании ft.ResponsiveView в данном коде?
- 1 подписчик
- 08 апр.
- 103 просмотра
1

ответ
Python

Простой
Можно ли указывать во flet heigh и width через проценты?
- 1 подписчик
- 02 апр.
- 118 просмотров
1

ответ
Python

Простой
Как правильно позиционировать элементы во flet?
- 1 подписчик
- 02 апр.
- 108 просмотров
1

ответ
Python

Простой
Почему может не отображаться страница во view(flet)?
- 1 подписчик
- 25 мар.
- 128 просмотров
1

ответ
Python

Средний
Asyncio + PySide6 + Telethon: список чатов и треды грузятся 30 минут — где искать причину?
- 2 подписчика
- 16 мар.
- 487 просмотров
2

ответа
Показать ещё Загружается…

Название вопроса противоречит описанию. В названии сказано, что файлы одинаковые. В тексте вы пишете, что файлы разные.
Необходимо переименовать вопрос, в противном случае он будет удален, т.к. на него нельзя ответить однозначно.

Также рекомендую привести полноценный пример:
Два файла на файлообменнике или фрагменты файлов в вопросе, и код в вопросе, который с этими фрагментами файлов ведёт себя описанным образом.
Получается всему виной экспорт.

До экспорта показывает

Index(['Unnamed: 0', 'Nr.', '1', '2', '3', '4', '5'], dtype='object')

После
Index([';Nr.;1;2;3;4;5'], dtype='object')

Excel делает тоже самое

Answer 1 · 2022-10-10 15:13:53

Потому что надо учитывать разделители колонок. Задается параметром sep у pd.read_csv/to_csv. По умолчанию он считается запятой у этих функций, так же как и у англоязычного Excel. Но в российской версии Excel по умолчанию используется точка с запятой - ;
Поэтому видимо изначально этот файл был с разделителем - запятой, потому правильно читались колонки через read_csv, а затем Вы пересохранили (хотя не указали, как именно "на макбуке экспортировал его как .csv") видимо в русской локали, поэтому разделителями стала точка с запятой - отсюда перестал читаться через read_csv.
Так что указывайте тот разделитель, который реально в вашем файле, чтобы читалось правильно:
data = pd.read_csv(sys.argv[1], sep=';')

Почему два CSV файла после удаления нескольких строк читаются по разному?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт