Задать вопрос
docLamer
@docLamer

Как в python при чтении файла excel убрать дубликаты ячеек в одном столбце и сложить соответствующие значения в другом?

Прошу помочь разобраться со следующей проблемой - пишу веб-приложение в котором должен быть своего рода парсер excel файлов. Суть такова: загружается xls файл и из него вытаскиваются только значения из 2х столбцов: B и H и передаются так-же в модель, в соответствующие поля. Как можно избежать одинаковых строк в столбце B, при том, чтоб изменения учитывались и в столбце H (т.е. если убралось 5 дубликатов из номера, то в сумме значения этих 5и дубликатов сложились)?

6478830a36f74781246981.png
Буду благодарен за любую помощь.
  • Вопрос задан
  • 236 просмотров
Подписаться 1 Средний 1 комментарий
Решения вопроса 1
Maksim_64
@Maksim_64
Data Analyst
читай в pandas фрейм, методом read_excel.
Затем группируй по номеру и аггрегируй функцией sum.
Псевдо код будет такой.
df = pd.read_excel('Твой Файл')
df.groupby('Телефон A')['Сумма'].sum()

Функция, read_excel имеет огромное количество параметров, возможно что то придется настраивать. Остальное называется группировкой, и аггрегацией, на каждой группе. Результатом будет сумма по каждому номеру.
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
Mi11er
@Mi11er
A human...
Загнать в пандас. Там сделать группировку
https://pandas.pydata.org/pandas-docs/stable/user_...
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы