Как в сделать Pandas объединение строк группирую по определнному столбцу?

Question

vitafon007 @vitafon007

Как в сделать Pandas объединение строк группирую по определнному столбцу?

Не могу сформулировать вопрос, чтобы искать ответ.
Суть такая: приходит xlsx пример данных на скриншоте.
Необходимо по наличию данных в первом столбце объединить все строки до следующего наличия данных.
Пример результата также на скриншоте.

Скриншот приложил

Вопрос задан более двух лет назад
191 просмотр

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ответы на вопрос 1

4 комментария

vitafon007 @vitafon007 Автор вопроса

к сожалению файл прилетать будет по апи, нет возможности отредактировать. Спасибо!

Написано более двух лет назад
otdameskapizm @otdameskapizm

vitafon007, не разовая акция?

Написано более двух лет назад

otdameskapizm @otdameskapizm

Тогда попробуйте вот так:

df = pd.DataFrame([[1, 1], [np.nan, 2], [np.nan, 2], [2, 1], [np.nan, 3], [np.nan, 3], [3, 1]], columns = {'A', 'B'})
df = df \
    .loc[:,['A', 'B']] \
    .ffill() \
    .groupby('A')['B'] \
    .apply(list) \
    .reset_index()

Вот тут все сгруппируется

Написано более двух лет назад

vitafon007 @vitafon007 Автор вопроса

otdameskapizm, Спасибо!

Написано более двух лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- вчера
- 69 просмотров
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 86 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 292 просмотра
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 233 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 647 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 550 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 307 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 563 просмотра
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 227 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 140 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2024-01-26 15:18:51

Ну на сам деле задачка на 5 минут, есть определенные методы заполнения пропущенных значений, 'ffill' forward fill и 'bfill' backward fill. Они и есть ключ к решению, далее группировка происходит без проблем, и дальнешее дело техники, при чем многими способами, например так.

f = pd.DataFrame({
    'A':['a',np.NaN,np.NaN,'b',np.NaN,np.NaN,np.NaN,'v',np.NaN,np.NaN,'d',np.NaN,np.NaN],
    'B':['foo','foo','bar','bar','bar','foo','bar','foo','bar','foo','bar','foo','bar']
})
result = (
    df
    .groupby(df['A']
    .fillna(method='ffill'))['B']
    .apply(lambda x: ','.join(x))
    .reset_index()
)
result

Answer 2 · 2024-01-26 15:05:31

Ну я бы на Вашем месте просто предварительно сделал обработку файла в Power Query путем заполнения данного ряда "вниз". (раз уж это файл .xlsx). и уже далее бы просто сгруппировал по первому столбцу, используя для агрегации функцию "list".

1) Для первой части решения проблемы Вам понадобится вот это: https://learn.microsoft.com/ru-ru/power-query/fill...
2) Для второй части - вот это: https://stackoverflow.com/questions/22219004/how-t...

Как в сделать Pandas объединение строк группирую по определнному столбцу?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт