@Goblin1101

Как посчитать и вывести уникальные значения колонок dataframe, которые имеют тип коллекции/списка?

У меня есть датафрейм, выглядит следующим образом:
6652055092a4c262379259.png
Во второй колонке у меня жанры игр, и они хранятся как коллекция. Есть ли какой-то встроенный инструмент у pandas чтобы мне достать из этих столбцов уникальные значения или же мне придётся с помощью цикла проходить и проверять, встречался такой элемент ранее и добавлять его в отдельную коллекцию?
  • Вопрос задан
  • 42 просмотра
Решения вопроса 1
Maksim_64
@Maksim_64
Data Analyst
С помощью цикла однозначно не придется. Встроенный инструмент есть, даже много.
чтобы мне достать из этих столбцов уникальные значения
Вот это не совсем понятно, может имелось ввиду из списков, уникальные, и что значит достать.

Если у тебя твои данные в списках то можно использовать explode.
(
    pd.DataFrame({
        'ID':[1,2],
        'genres':[['Strategy'],['Fightening','Adventure','Arcade']]
    })
    .explode('genres')
)
Затем unique (уникальные) value_counts (посчитать каких и сколько у тебя там) или все что угодно, опций огромное количество. Обрати внимание структура фрейма не рушится (поведение колонки ID).

В качестве ответа. Цикл не использовать, можно все. Для более конкретного ответа. Предоставляешь игрушечный фрейм, и то что ты хочешь увидеть, на выходе. По скольку словами не очевидно, что именно ты хочешь.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы