Python cоздание переменной с значением генерируемой переменной?

Question

Aionclassic @Aionclassic

Pandas

Python cоздание переменной с значением генерируемой переменной?

Пытаюсь написать код который будет пересекать определенные колонки разных xlsx файлах и выводить одинаковые значения из колонок.
Алгоритм программы:
1.Читаем папку, получаем путь ко всем xlsx файлам
2. Генерируем переменные:
a) переменные df1 ... dfN (фреймы Pandas) создаются в количестве найденных xlsx файлов, в каждую отдельно заливается найденный xlsx файл.
б) переменные set_data_df1 .... N из переменой df1....N ДОЛЖНА создавать уникальный список внутри определенного столбца целью его последующего пересечения (set_data_df1 & set_data_df2 & .... N)
Проблема заключается не могу понять как создать правильно переменные Б?

list_file = []
data_directory = '111'
for root, dirs, files in os.walk(data_directory):
    for filename in files:
        list_file.append(os.path.join(root, filename))

ii=0
for i in list_file:
    ii += 1
    globals()[f'df{ii}'] = pd.read_excel(i) #РАБОТАЕТ
    globals()[f'set_data_df{ii}'] = f'set(df{ii}[name_column].tolist()) #НЕ РАБОАТАЕТ

Помогите подправить код "=f'set(df{ii}[name_column].tolist())". Спасибо.

Вопрос задан более двух лет назад
180 просмотров

1 комментарий

Подписаться 1 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Яндекс Практикум

Аналитик данных

7 месяцев

Далее
Skillbox

Профессия Data Analyst

12 месяцев

Далее
Нетология

Дата-инженер

16 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

4 комментария

Aionclassic @Aionclassic Автор вопроса

По задачи б) поясню детальнее, мне нужно уникальные значения столбца А фрейма 1, пересечь с уникальными значения столбца А фрейма 2, и так далее в зависимости сколько создано фреймов. Я пока мало знаком с Pandas и не знаю можно ли это реализовать внутри самого Pandas. Поэтому думал пойти по простому решению залить файлы в фреймы, из столбца фреймов сделать списки , дальше значения в эти списках через set() сделать уникальными и на последнем этапе пересечь все списки что бы выявить значение которое встречается во всех списках. Как Вы написали задача а) работает, генерируется переменная df1=pd.read_excel('111\\test_exel_3.xlsx') , а вот сгенерировать вторую переменную set_data_df1 = в значении которой будет вставляется генерируемое имя из первой переменной [f'df{ii}'] не получается. На основании первой переменой должна создаться вторая переменная вида set_data_df1=df1[name_column]

Написано более двух лет назад
Максим Припадчев @Maksim_64

Aionclassic, Да можно, в pandas вообще можно все. Что понимается по пересечением? Вернуть массив общих значений, то есть операция между наборами или нужно осуществить слияние фреймов джойны, или нужно осуществить выборку какую то. В pandas можно все не проблема ничего из вышеперечисленного.

Написано более двух лет назад
Aionclassic @Aionclassic Автор вопроса

Максим Припадчев, нужно вернуть выборку, ну например какие одинаковые номера автомобилей(или телефонов) присутствовали во всех фреймах. пример: только номера ххххх, yyyyyy были во всех фреймах

Написано более двух лет назад
Максим Припадчев @Maksim_64
Aionclassic, Ну собери их все в один фрейм, Например. Может быть там дата есть, и потом просто по дате сравнивать, или multiindex сделай, например.

df1 = pd.DataFrame({ 'A':[1,2], 'B':[2,3] }) df2 = pd.DataFrame({ 'A':[2,2], 'B':[2,3] }) df3 = pd.DataFrame({ 'A':[1,1], 'B':[2,2] }) dfs = [df1, df2, df3] pd.concat(dfs,keys=['first', 'second','third'])
Дальше почитай доки ты можешь делать выборки по любому уровню. На самом деле много способов решения. Если хочешь более конкретной помощи. Сделай 3 маленьких фрейма, как у меня в примере мне нужно вот из этих фреймов получить вот такой выхлоп. И сделай фрейм или series или массив что ты хочешь получить. А так мне сложно гадать, была конкретика есть вот это нужно получить вот то. И на конкретных маленьких фреймах. 3 фрейма или 3000 их потом будет это не важно. Принцип.
Написано более двух лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Pandas

Простой
Как забрать значение формулы в Excel таблице через pandas?
- 1 подписчик
- 12 авг.
- 59 просмотров
0

ответов
Pandas

Простой
Как удалить строки в таблице с одинаковыми параметрами по столбцам?
- 1 подписчик
- 22 мая
- 131 просмотр
1

ответ
Excel

+1 ещё

Простой
Как удалить пустые поля в Excel?
- 1 подписчик
- 14 мар.
- 193 просмотра
0

ответов
Pandas

Простой
Как пронумеровать столбец excel в python?
- 1 подписчик
- 18 февр.
- 160 просмотров
3

ответа
NumPy

+1 ещё

Средний
Можно ли через numpy или pandas удалить строки в многомерном массиве, элементы которого содержат два и более разных значений?
- 1 подписчик
- 28 янв.
- 140 просмотров
1

ответ
Pandas

Простой
Почему возникает ошибка «length mismatch: expected axis has 3 elements, new values have 4 elements»?
- 1 подписчик
- 16 дек. 2024
- 247 просмотров
2

ответа
Pandas

Простой
Как сравнить 2 df в Пандасе?
- 1 подписчик
- более года назад
- 158 просмотров
1

ответ
Pandas

Простой
Как вставить строчки в exel через pandas?
- 1 подписчик
- более года назад
- 37 просмотров
1

ответ
Pandas

Простой
Как объединить две таблицы в pandas?
- 1 подписчик
- более года назад
- 74 просмотра
1

ответ
Pandas

Простой
Как настроить порядок столбцов в таблице в pandas python?
- 1 подписчик
- более года назад
- 148 просмотров
1

ответ
Показать ещё Загружается…

Computer Vision Engineer

Алабуга • Москва

от 270 000 ₽

Разработчик встраиваемого ПО / Embedded developer

Алабуга • Санкт-Петербург

от 127 500 ₽

Аналитик-разработчик (команда Intelligent Search)

Сбер • Москва

от 250 000 до 400 000 ₽

Не надо ставить как можно больше тэгов. Лучше оставить один, но конкретный, с которым проблема.
См.п.3.1 Регламента. Также обратите внимание на п.3.4

Answer 1 · 2023-10-13 10:26:49

Всем спасибо, проблема решена путем в конвертации значения переменой из str в class object.
P.S. tolist() там не нужен, set() после конвертации

Answer 2 · 2023-10-12 12:00:50

Ну если ты только изучаешь python, зачем тебе pandas. Код не надо править его нужно выкидывать.

a) Ты хочешь прочитать каждый xlsx файл в отдельный фрейм, это нормально. Создаешь пустой список и складываешь в него фреймы.

dfs = []
for filename in fileanmes:
    df = pd.read_excel(filename)
    dfs.append(df)

где filenames твои пути для xlsx файлов.

б) Задача не ясна. На сколько я понял у этих файлов разные имена колонок и надо выбрать общий для всех набор.

from functools import reduce
import numpy as np

df1 = pd.DataFrame({
    'A':[1],
    'B':[2]
})

df2 = pd.DataFrame({
    'A':[1],
    'C':[2]
})

df3 = pd.DataFrame({
    'A':[1],
    'D':[2]
})

dfs_column_names = [df1.columns, df2.columns, df3.columns]
print(reduce(np.intersect1d, dfs_column_names))

Вот так ты можешь найти общие колонки у любого количества фреймов.
Естественно тебе не нужно хардкодить список с колонками прям в первом цикле заноси не только фрейм в список, но и в другой список заноси его колонки потом вне списка сохрани общий набор колонок как я привел в примере.

Ну и я так понимаю в дальнейшем ты собираешься выбрать по уникальным для всех фреймов колонкам и собрать все в единый фрейм. pd.concat(dfs). Где dfs это список фреймов, с едиными колонками. То есть предварительно, ты как я показал нашел common_columns. и затеам dfs=[df[common_columns] for df in dfs]. И затем конкатенируешь.

Python cоздание переменной с значением генерируемой переменной?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт