Как разобрать такую таблицу Excel в Python?

Question

sazhyk @sazhyk

Python

Как разобрать такую таблицу Excel в Python?

Есть такая табличка в экселе

Табличка

Её необходимо перенести в базу на Postgresql с помощью python'а. Но выглядеть она должна так

Что должно получиться

Чем конкретно парсить файл экселя не имеет особого значения, в этом вопрос не стоит. Вопрос в том, как мне для одинаковых значений поля USER создать новые поля NUMBER-CODE? Вопрос конкретно на алгоритм кода.
Например, я получил эти данные в csv

CSV

CODE,USER,NUMBER
AA01,U01,1375
AA02,U01,71
AA01,U02,957
AA02,U02,815
AA03,U02,65
AA01,U03,1189
AA02,U03,78
AA01,U04,1320
AA02,U04,80
AA01,U05,1100
AA02,U05,516
AA03,U05,61

Какими циклами с условиями я должен это дело обойти?

Вопрос задан более трёх лет назад
189 просмотров

3 комментария

Подписаться 1 Простой 3 комментария

Влад Григорьев @Vaindante

Ну условия вам придумывать надо самому, тут не очень понятны ваши преобразования)
но вам стоит почитать про itertools.groupby
Ну и может описать более понятно вашу проблему)

Написано более трёх лет назад
sazhyk @sazhyk Автор вопроса
Влад Григорьев, Я думаю, мне надо получить словарь примерно такого содержания
{ 'U01': { 'AA01': '1375', 'AA02': '71', 'AA03': '' } 'U02': { 'AA01': '957', 'AA02': '815', 'AA03': '65' } ... ну и далее }

А что с ним делать дальше, разберусь.
Написано более трёх лет назад
6elkka @6elkka

Что должно быть в получившейся колонке CODE? На картинке с исходной табличкой вообще нет значений "AA04" и "AA05", а на картинке "что должно получиться" есть.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 208 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 541 просмотр
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 491 просмотр
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 280 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 504 просмотра
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 213 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 124 просмотра
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 330 просмотров
1

ответ
Python

Простой
Стоит ли переходить на IDE?
- 1 подписчик
- 25 мая
- 663 просмотра
5

ответов
Python

+2 ещё

Простой
Где хранить сессию SQLAlchemy в FastAPI: в конструкторе сервиса или передавать в каждый метод?
- 2 подписчика
- 23 мая
- 345 просмотров
1

ответ
Показать ещё Загружается…

Ну условия вам придумывать надо самому, тут не очень понятны ваши преобразования)
но вам стоит почитать про itertools.groupby
Ну и может описать более понятно вашу проблему)
Влад Григорьев, Я думаю, мне надо получить словарь примерно такого содержания
{ 'U01': { 'AA01': '1375', 'AA02': '71', 'AA03': '' } 'U02': { 'AA01': '957', 'AA02': '815', 'AA03': '65' } ... ну и далее }

А что с ним делать дальше, разберусь.
Что должно быть в получившейся колонке CODE? На картинке с исходной табличкой вообще нет значений "AA04" и "AA05", а на картинке "что должно получиться" есть.

Answer 1 · 2019-02-15 17:10:48

Возможно наведет на мысли. Меня только смущает, что у вас отсутствует в таблице AA03 для U01, а вы его хотите получить пустым. По идее можно насильно добавлять через условия.

#!/usr/bin/env python3

import csv
import json

table_file = '/home/ratkin.roman/Документы/test.csv'
new_table = {}

with open(table_file, 'r', encoding='utf-8') as table:
    f = csv.reader(table, delimiter=',')
    next(f)
    for row in f:
        new_table.setdefault(row[1], {}).update([(row[0],row[2])])


print(json.dumps(new_table, sort_keys=True, indent=4))

Результат

{
    "U01": {
        "AA01": "1375",
        "AA02": "71"
    },
    "U02": {
        "AA01": "957",
        "AA02": "815",
        "AA03": "65"
    },
    "U03": {
        "AA01": "1189",
        "AA02": "78"
    },
    "U04": {
        "AA01": "132",
        "AA02": "80"
    },
    "U05": {
        "AA01": "1100",
        "AA02": "516",
        "AA03": "64"
    }
}

Answer 2 · 2019-02-15 17:46:36

Ну можно тогда так:

from itertools import groupby

source = [
    {'code': 'AA01', 'group': 'U01', 'user': '1375', },
    {'code': 'AA01', 'group': 'U01', 'user': '1575', },
    {'code': 'AA03', 'group': 'U02', 'user': '1375', },
    {'code': 'AA02', 'group': 'U02', 'user': '1345', },
    {'code': 'AA02', 'group': 'U03', 'user': '1315', },
    {'code': 'AA01', 'group': 'U04', 'user': '1615', },

]

 result = {k:list(v) for k,v in groupby(source, lambda x: x['group'])}
>>> print(result)
{'U01': [{'code': 'AA01', 'group': 'U01', 'user': '1375'}, {'code': 'AA01', 'group': 'U01', 'user': '1575'}], 'U02': [{'code': 'AA03', 'group': 'U02', 'user': '1375'}, {'code': 'AA02', 'group': 'U02', 'user': '1345'}], 'U03': [{'code': 'AA02', 'group': 'U03', 'user': '1315'}], 'U04': [{'code': 'AA01', 'group': 'U04', 'user': '1615'}]}
>>> result = {k:{row['user']: row['code'] for row in v} for k,v in groupby(source, lambda x: x['group'])}
>>> result
{'U01': {'1375': 'AA01', '1575': 'AA01'}, 'U02': {'1375': 'AA03', '1345': 'AA02'}, 'U03': {'1315': 'AA02'}, 'U04': {'1615': 'AA01'}}
>>>

Answer 3 · 2019-02-15 17:21:04

Попробуйте погуглить про itertools.groupby

from itertools import groupby

source = [
    {'code': 'AA01', 'group': 'U01', 'user': '1375', },
    {'code': 'AA01', 'group': 'U01', 'user': '1575', },
    {'code': 'AA03', 'group': 'U02', 'user': '1375', },
    {'code': 'AA02', 'group': 'U02', 'user': '1345', },
    {'code': 'AA02', 'group': 'U03', 'user': '1315', },
    {'code': 'AA01', 'group': 'U04', 'user': '1615', },

]

result = {}
for key, group in groupby(source, lambda x: x['group']):
    subgroup = {}
    for item in group:
        subgroup[item['code']] = item['user']
    result[key] = subgroup

Output

{
    'U01': {'AA01': '1575'},
    'U02': {'AA03': '1375',
            'AA02': '1345'}, 
    'U03': {'AA02': '1315'}, 
    'U04': {'AA01': '1615'}
}

Как разобрать такую таблицу Excel в Python?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт