Из стороннего сервиса выгружаются данные в виде json(csv):
[{ "customer_id": "5f9d7b0a100400c6f00ad1cb",
"customer_pet": "cat",
"customer_cat_color": "gold",
"customer_cat_name": "",
"timestamp": "2023-05-15 12:22:22.111241 UTC",
"list_cart": [
"cart_1",
"cart_2",
"cart_3" ]},
{"customer_id": "5f9d7b0a100400c6f00ad1cb",
"customer_pet": "cat",
"customer_cat_color": "gold",
"customer_cat_name": "",
"timestamp": "2023-05-15 13:33:33.111241 UTC",
"list_cart": [
"cart_3",
"cart_7",
"cart_1" ]}
]
Как лучше посчитать посчитать кол-во клиентов с каждым элементом из list_cart?
Т.е. итог нужен в виде
item count
cart_1 ---
2
cart_2 ---
1
cart_3 ---
2
cart_7 ---
1
Сейчас вижу вариант добавить уникальный id_event каждому событию и развернуть массив присваивая каждому элементу из list_cart значения id_event, customer_id и сформировать таким образом таблицу/датафрейм с которым работать.
Возможные технологии - Node.js/Python/Pandas/SQL(желательно MS SQL, но можно PostgreSQL и др. диалекты)/Mongo