Добрый день.
У меня есть блокнот со следующим:
import pandas as pd
df = pd.read_csv("yyy.csv")
df.shape
>>(52350, 14)
Одна из колонок "PP" со строками (целые числа, разделенные запятыми), остальные пусть будут колонкой "С" для иллюстрации поведения.
В таблице данные выглядят так:
PP | C
---------+-------
1, 2 | T
5 | C
18, 20 | S
7 | T
Надо сделать так:
PP | C
---------+-------
1 | T
2 | T
5 | C
18 | S
20 | S
7 | T
Элементы в колонке РР можно оставить текстовыми, по ним потом будет группировка. Количество элементов от 1 (85% записей) до 3 (2-3% записей). При переносе элемента в новую запись, информация по остальным колонкам просто дублируется.
Можно ли как-то исхитриться сделать это без "ручного" перебора в цикле по всем записям, учитывая количество записей?
В интернете масса примеров по разбиению на столбцы. К сожалению, варианта "по строкам" я не нашел.
Спасибо.