@san_m_m

Как объединить несколько дата сетов?

есть папка, куда складываются файлы разные. По признаку в названии нужно вытягивать и объединять файлы. Как это осуществить лучше?

#получил список из названий файлов с помощью библиотеки os и сохранил в переменную files
filess = []
for i in files:
    if «форма_125» in i:
        filess.append(i)

if len(filess) == 2: 
    df_1 = pd.read_excel(filess[0])
    df_2 = pd.read_excel(filess[1])
    df = pd.concat([df_1, df_2])


У меня в голове только такая полуручная идея, но было бы здорово это все улучшить.
  • Вопрос задан
  • 113 просмотров
Решения вопроса 2
@dmshar
Что такое "полуручная идея"? и что вы желаете улучшить? Если сделать вашу программу независимой от количества файлов, то вспоминаем, что на втором уроке по Python вам рассказывали про циклы и о том, когда, как и зачем их использовать. В вашем случае это будет выглядеть приметно так:

df=pd.DataFrame()
for i,unit in enumerate(filess):
    df=df.append(pd.read_excel(unit), ignore_index=True)


Ну а в точности "подогнать" под свой код - это как-нибудь самостоятельно.
Ответ написан
Комментировать
@twistfire92
Python backend developer
names - список имен файлов в каталоге

datasets = []
for file_name in filter(lambda x: "форма_125" in x, names)
    datasets.append(pd.read_excel(file_name))

df = pd.concat(datasets)
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы