Как в сделать Pandas объединение строк группирую по определнному столбцу?

Question

vitafon007 @vitafon007

Как в сделать Pandas объединение строк группирую по определнному столбцу?

Не могу сформулировать вопрос, чтобы искать ответ.
Суть такая: приходит xlsx пример данных на скриншоте.
Необходимо по наличию данных в первом столбце объединить все строки до следующего наличия данных.
Пример результата также на скриншоте.

Скриншот приложил

Вопрос задан более года назад
173 просмотра

Комментировать

Подписаться 1 Средний Комментировать

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ответы на вопрос 1

4 комментария

vitafon007 @vitafon007 Автор вопроса

к сожалению файл прилетать будет по апи, нет возможности отредактировать. Спасибо!

Написано более года назад
otdameskapizm @otdameskapizm

vitafon007, не разовая акция?

Написано более года назад

otdameskapizm @otdameskapizm

Тогда попробуйте вот так:

df = pd.DataFrame([[1, 1], [np.nan, 2], [np.nan, 2], [2, 1], [np.nan, 3], [np.nan, 3], [3, 1]], columns = {'A', 'B'})
df = df \
    .loc[:,['A', 'B']] \
    .ffill() \
    .groupby('A')['B'] \
    .apply(list) \
    .reset_index()

Вот тут все сгруппируется

Написано более года назад

vitafon007 @vitafon007 Автор вопроса

otdameskapizm, Спасибо!

Написано более года назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Какой способ эффективнее при объединении двух словарей?
- 1 подписчик
- 49 минут назад
- 20 просмотров
1

ответ
Python

Простой
Автоматизация входа на устройство через Jumphost с целью передачи команд?
- 1 подписчик
- 3 часа назад
- 45 просмотров
0

ответов
Python

+1 ещё

Простой
В ffmpeg неправильно считывается имя пользователя, он видит в нем цифру и начинает ее раскладывать, как пофиксить?
- 1 подписчик
- 13 часов назад
- 84 просмотра
1

ответ
Python

+2 ещё

Средний
Бот долго отвечает сообщением, где фото+текст. Как исправить?
- 1 подписчик
- 16 часов назад
- 117 просмотров
1

ответ
Python

Простой
Как добавить в дату, записанную в строке, нули перед месяцем и днём?
- 1 подписчик
- вчера
- 145 просмотров
4

ответа
Python

Простой
Как завершить работу консольного приложения?
- 1 подписчик
- вчера
- 153 просмотра
1

ответ
Python

+1 ещё

Средний
В Coqui TTS есть поддержка русского языка для озвучки текста?
- 1 подписчик
- 04 мая
- 68 просмотров
1

ответ
Python

Простой
Как запустить VapourSynth-Editor?
- 1 подписчик
- 03 мая
- 65 просмотров
0

ответов
Python

Простой
Почему ошибка в терминале?
- 1 подписчик
- 03 мая
- 141 просмотр
0

ответов
Python

+2 ещё

Простой
Выбор кодогенератора для нового проекта (Автотесты)?
- 2 подписчика
- 03 мая
- 570 просмотров
0

ответов
Показать ещё Загружается…

Python-разработчик

BCraft

от 2 000 до 3 500 $

Python разработчик

DevTeam.Space • Москва

от 1 500 до 3 000 $

Python разработчик Senior

Туроператор «Русь» • Москва

от 200 000 до 300 000 ₽

Answer 1 · 2024-01-26 15:18:51

Ну на сам деле задачка на 5 минут, есть определенные методы заполнения пропущенных значений, 'ffill' forward fill и 'bfill' backward fill. Они и есть ключ к решению, далее группировка происходит без проблем, и дальнешее дело техники, при чем многими способами, например так.

f = pd.DataFrame({
    'A':['a',np.NaN,np.NaN,'b',np.NaN,np.NaN,np.NaN,'v',np.NaN,np.NaN,'d',np.NaN,np.NaN],
    'B':['foo','foo','bar','bar','bar','foo','bar','foo','bar','foo','bar','foo','bar']
})
result = (
    df
    .groupby(df['A']
    .fillna(method='ffill'))['B']
    .apply(lambda x: ','.join(x))
    .reset_index()
)
result

Answer 2 · 2024-01-26 15:05:31

Ну я бы на Вашем месте просто предварительно сделал обработку файла в Power Query путем заполнения данного ряда "вниз". (раз уж это файл .xlsx). и уже далее бы просто сгруппировал по первому столбцу, используя для агрегации функцию "list".

1) Для первой части решения проблемы Вам понадобится вот это: https://learn.microsoft.com/ru-ru/power-query/fill...
2) Для второй части - вот это: https://stackoverflow.com/questions/22219004/how-t...

Как в сделать Pandas объединение строк группирую по определнному столбцу?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт