Как распарсить датафрейм в пандас, когда сзначеним одной колонки являются словарь?

Question

dlysenko1311 @dlysenko1311

Python

Как распарсить датафрейм в пандас, когда сзначеним одной колонки являются словарь?

У меня есть такой пандас датафрейм:

Как распарсить поле Tuples и при этом не потерять поля Ordinal и Cardinality?
Как получить из этого датафрейма друго датафрейм без вложений в столбцах?

Вот откуда это у меня получилось (как пример):

data = [
        {
            "Ordinal": 0,
            "Cardinality": 1,
            "Hierarchies": [],
            "Tuples": [
                {
                    "Ordinal": 0,
                    "Members": []
                }
            ]
        },
        {
            "Ordinal": 1,
            "Cardinality": 4023,
            "Hierarchies": [
                {
                    "@odata.etag": "W/\"324214423423\"",
                    "Name": "Год"
                },
                {
                    "@odata.etag": "W/\"2314214134\"",
                    "Name": "Месяц"
                },
                {
                    "@odata.etag": "W/\"4273172132313214\"",
                    "Name": "Статья БДР"
                },
                {
                    "@odata.etag": "W/\"21343214213\"",
                    "Name": "Версия"
                },
                {
                    "@odata.etag": "W/\"3214213421\"",
                    "Name": "Контур"
                }
            ],
            "Tuples": [
                {
                    "Ordinal": 0,
                    "Members": [
                        {
                            "Name": "МСФО"
                        },
                        {
                            "Name": "Сегмент"
                        },
                        {
                            "Name": "Сегмент"
                        },
                        {
                            "Name": "ВСЕ"
                        },
                        {
                            "Name": "RUR"
                        },
                        {
                            "Name": "Сумма после Элиминации и Распределения"
                        }
                    ]
                }
            ]
        }
    ]

Здесь, есть еще один столбце Hierarchies, но он не обязательно должен быть в результируещей таблице (датфрейме)

Вопрос задан более трёх лет назад
547 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 2

Комментировать

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Сложный
Как решить задачу на 3D DP?
- 1 подписчик
- вчера
- 115 просмотров
2

ответа
Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- 19 июл.
- 92 просмотра
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 105 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 355 просмотров
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 239 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 671 просмотр
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 554 просмотра
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 309 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 572 просмотра
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 229 просмотров
2

ответа
Показать ещё Загружается…

Answer 1 · 2022-12-06 20:00:57

Поле Tuples имеет dtype, 'Object', что в pandas (малость упрощая) эквивалентно str. В pandas есть aкссесор str для того что бы применять по элементно функции строк python, регулярные выражения и т.д. синтаксис элементарный.
df['Tuples'].str.some_method()
распарсите строку и все. Если вы ищете готовое решение, то это во фриланс. Вы должны предоставить код в котором вы пытаетесь решить проблему, но не получается. Направление для начала написания такого кода я вам подсказал.

Answer 2 · 2022-12-06 20:04:00

Чтобы проанализировать поле Tuples в фрейме данных pandas, вы можете использовать метод DataFrame.apply для применения пользовательской функции к каждой строке фрейма данных. Эта пользовательская функция может извлекать поля Ordinal и Cardinality из словаря в столбце Кортежи и возвращать новый кортеж или список, содержащий эти значения.

Например:

def extract_ordinal_and_cardinality(row):
      tuples_dict = row['Tuples']
      return (tuples_dict['Ordinal'], tuples_dict['Cardinality'])

df['Tuples'] = df.apply(extract_ordinal_and_cardinality, axis=1)

Это создаст новый столбец в фрейме данных под названием Tuples, который содержит извлеченные Ordinal и Cardinality из словарей в исходном столбце Tuples.

Чтобы создать новый фрейм данных без столбцов Hierarchies и Tuples, вы можете использовать метод DataFrame.drop для удаления этих столбцов из исходного фрейма данных.

Например:

new_df = df.drop(columns=['Hierarchies', 'Tuples'])

Это создаст новый фрейм данных с именем new_df, который содержит все столбцы из исходного фрейма данных, за исключением столбцов Hierarchies и Tuples.

Как распарсить датафрейм в пандас, когда сзначеним одной колонки являются словарь?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт