Почему возникает ошибка «length mismatch: expected axis has 3 elements, new values have 4 elements»?

Question

Олег Медведев @cubinez85

Pandas

Почему возникает ошибка «length mismatch: expected axis has 3 elements, new values have 4 elements»?

Есть исходный файл Orders.xlsx :

Weekday	Shop1	Shop_2	Shop_3	Shop4
mon	7	1	7	8
tue	4	2		5
wed		5	2	3
thu	8		8	7
fri	15	11	13	9
sat	21	18	17	
sun	25	16	25	17

1) Нужно функцией rename_columns(test_df) переименовать столбцы исходного файла в формат shop_1, shop_2...
2) функцией fillna_values(test_df, n=0) заменить пробелы исходника на 1. ' n' - число и по умолчанию = 0
3) функцией etl() собрать итоговые отчеты в форматы 'csv' и 'xlsx' в дир исходного файла.
Вот мой код:

import pandas as pd
import os
orders_path = './data/Orders.xlsx'
n = 1
def rename_columns(test_df):
    test_df.columns = ['Shop_1', 'Shop_2', 'Shop_3', 'Shop_4']
    expected_columns = 4
    if len(test_df.columns) != expected_columns:
        print(f"Ожидалось {expected_columns} столбца, но найдено {len(test_df.columns)}.")
        return None
    return test_df
test_df = pd.read_excel(orders_path, index_col=0)
if not os.path.exists(orders_path):
    print(f"Файл {orders_path} не найден.")

def fillna_values(test_df, n=0):
    res = rename_columns(test_df)
    return res.fillna(n)

def etl():
    res = fillna_values(test_df, n)
    res.to_csv('./data/Orders_etl.csv')
    res.to_excel('./data/Orders_etl.xlsx')
    return 'Файлы успешно сохранены'
result = etl()
print(result)

Все работает, но тест не проходит:

E   ValueError: Length mismatch: Expected axis has 3 elements, new values have 4 elements
=========================== short test summary info ============================
ERROR tests/test_solution.py - ValueError: Length mismatch: Expected axis has...
!!!!!!!!!!!!!!!!!!!! Interrupted: 1 error during collection !!!!!!!!!!!!!!!!!!!!

длину проверил:

import pandas as pd
test_df = pd.read_excel('./data/Orders.xlsx', index_col=0)
print(len(test_df.columns))
test_df_res = pd.read_excel('./data/Orders_etl.xlsx', index_col=0)
print(len(test_df_res.columns))

Чего не так?

Вопрос задан более года назад
315 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Data Scientist с нуля

10 месяцев

Далее
Академия Эдюсон

Data Science + ИИ

8 месяцев

Далее
Бруноям

Data Scientist

8 месяцев

Далее

Решения вопроса 2

13 комментариев

Telcontar @Lord_of_Rings

С курсов, у него это не первый вопрос оттуда

Написано более года назад
dim5x @dim5x

Он работает с четырьмя колонками. Потому что: test_df = pd.read_excel(orders_path, index_col=0). Weekday будет индексом.
И столбцы переименовываются корректно.

Единственное, тестовая система, очевидно, не хочет, чтобы Weekday превращали из обычного столбца в индекс.

Написано более года назад
Олег Медведев @cubinez85 Автор вопроса

да, c курсов, но исходник читается : test_df = pd.read_excel(orders_path, index_col=0) и это 4 колонки. Или не так?

Написано более года назад
Максим Припадчев @Maksim_64

dim5x, Это в корне не правильный подход перименовывовать колонки, посредством df.columns, на курсах дожны показывать как это делать правильно. Это элементарное заполнение индекса. Насчет index_col=0 я не обратил на это внимание.,что не отменяет какую строчку кода он не может выполнить. Он говорит ожидаемый размер колонок 3 я получил 4.

Написано более года назад
Максим Припадчев @Maksim_64

Олег Медведев, Тебе говорят на вход твой фрейм имеет 3 колонки а ты пытаешься задать 4. Я даже не обратил внимание на твой index_col = 0.

Написано более года назад
dim5x @dim5x

Максим Припадчев, с чего бы вдруг? Это обычный подход.
Headers can be assigned directly: https://stackoverflow.com/questions/11346283/renam...

Ну и вы не объясняете почему он ждёт 3. От каких колонок автор должен отказаться?

З.Ы. вы бы запустили. Увидели бы, что строчка выполняется.

Написано более года назад
Максим Припадчев @Maksim_64

dim5x, df.rename(columns={'old',:'new'}), a df.columns это переопределение индекса (колонки тоже индекс) это в корне не правильно, как собственно в первом ответе не выбранном решением и указано.

Написано более года назад
Олег Медведев @cubinez85 Автор вопроса

df.rename(columns={'old',:'new'}) это если переименовать конкретные колонки, а если "списком" - то читать исходник с index_col=0?

Написано более года назад

dim5x @dim5x

Максим Припадчев,

import pandas as pd

# Создаем исходный DataFrame
data = {
    'A': [1, 2, 3],
    'B': [4, 5, 6]
}
df = pd.DataFrame(data)

# Переименование столбцов с помощью df.rename()
df_renamed = df.rename(columns={'A': 'Column1', 'B': 'Column2'})

# Переименование столбцов с помощью df.columns
df.columns = ['Column1', 'Column2']

# Проверяем, равны ли оба DataFrame
are_equal = df.equals(df_renamed)

print(are_equal)
>>> True

Написано более года назад

Максим Припадчев @Maksim_64

dim5x, Ну и при чем здесь сравнение? Тебе что кто то сказал что их данные будут отличатся? Я написал, так в корне не правильно.

Написано более года назад
dim5x @dim5x

Максим Припадчев, тыкать не надо.
Помимо данных equals проверяет структуру.

Ну, коли ВЫ написали, то ок.

Написано более года назад
Максим Припадчев @Maksim_64
Олег Медведев,

def rename_columns(test_df): print(test_df.shape) test_df.columns = ['Shop_1', 'Shop_2', 'Shop_3', 'Shop_4']

добавь print и разбирайся почему у тебя там там 3, колонки
Написано более года назад
Максим Припадчев @Maksim_64

dim5x, Я на вы не разговариваю, не устраивает не поддерживай беседу.
относительно в корне не правильно df.columns, то с ним работают например итерируются по нему то есть df.columns = [col.upper() for col in df.columns] или более сложные опреции, что по сути тоже самое, что прямое присвоение списка и там и там список. Но когда мне нужно перемеиновать определенные колонки, то используют rename кончено по скольку сама операция переименования это маппинг (было-> стало). Вторая история это избегают что либо менять во входящем фрейме. Его не трогают, а процессируют фкнкциями где у каждой функции на вход фрейм а на выход его трансформированная копия.

Написано более года назад

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Pandas

Простой
Почему с помощью функции pd.read_html() с индексом 1 не показывает таблицу?
- 1 подписчик
- 24 дек. 2025
- 170 просмотров
1

ответ
Pandas

Простой
Как забрать значение формулы в Excel таблице через pandas?
- 1 подписчик
- 12 авг. 2025
- 74 просмотра
0

ответов
Pandas

Простой
Как удалить строки в таблице с одинаковыми параметрами по столбцам?
- 1 подписчик
- более года назад
- 144 просмотра
1

ответ
Excel

+1 ещё

Простой
Как удалить пустые поля в Excel?
- 1 подписчик
- более года назад
- 221 просмотр
0

ответов
Pandas

Простой
Как пронумеровать столбец excel в python?
- 1 подписчик
- более года назад
- 168 просмотров
3

ответа
NumPy

+1 ещё

Средний
Можно ли через numpy или pandas удалить строки в многомерном массиве, элементы которого содержат два и более разных значений?
- 1 подписчик
- более года назад
- 149 просмотров
1

ответ
Pandas

Простой
Как сравнить 2 df в Пандасе?
- 1 подписчик
- более года назад
- 190 просмотров
1

ответ
Pandas

Простой
Как вставить строчки в exel через pandas?
- 1 подписчик
- более года назад
- 49 просмотров
1

ответ
Pandas

Простой
Как объединить две таблицы в pandas?
- 1 подписчик
- более года назад
- 104 просмотра
1

ответ
Показать ещё Загружается…

Answer 1 · 2024-12-16 17:20:25

мне вот интересно, это задания с курсов каких то безумных? Никто в реале не будет писать функции rename_columns или fillna_values. Реально, если это с курсов это ну совсем не куда не годится.

Что касается этого безумного кода.

исходный фрейм у тебя имеет 5 на самом деле 3 колонки, о чем и сказано в ошибке колонок а ты пытаешься установить, 4 вот в этой строке

test_df.columns = ['Shop_1', 'Shop_2', 'Shop_3', 'Shop_4']

пример того безумия, что происходит

df = pd.DataFrame({
    'A':[1,2,3],
    'B':[4,5,6],
    'C':[6,7,8]
})
df.columns = ['AA','BB']

Answer 2 · 2024-12-16 21:17:04

1. Я бы не стал, если этого нет в условиях, которые вы, быть может, не озвучили, менять сущность первого столбца. Прочёл бы без index_col=0: test_df = pd.read_excel(orders_path)
2. Переименовывание делал бы уже включая первый столбец:

test_df.columns = ['Weekday', 'Shop_1', 'Shop_2', 'Shop_3', 'Shop_4']

3.

test_df = pd.read_excel(orders_path, index_col=0)
if not os.path.exists(orders_path):
    print(f"Файл {orders_path} не найден.")

Делать проверку на наличие файла после того, как уже прочли его в датафрейм? Поменяйте последовательность.
4. Ну и меня смущает почему тестовая система хочет 3. Возникает вопрос о доп. условиях или что пытаетесь скормить результат тесту, не под той задачей, например.

Почему возникает ошибка «length mismatch: expected axis has 3 elements, new values have 4 elements»?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт