Задать вопрос
@Goblin1101

Как посчитать и вывести уникальные значения колонок dataframe, которые имеют тип коллекции/списка?

У меня есть датафрейм, выглядит следующим образом:
6652055092a4c262379259.png
Во второй колонке у меня жанры игр, и они хранятся как коллекция. Есть ли какой-то встроенный инструмент у pandas чтобы мне достать из этих столбцов уникальные значения или же мне придётся с помощью цикла проходить и проверять, встречался такой элемент ранее и добавлять его в отдельную коллекцию?
  • Вопрос задан
  • 278 просмотров
Подписаться 1 Простой Комментировать
Решения вопроса 1
Maksim_64
@Maksim_64
Data Analyst
С помощью цикла однозначно не придется. Встроенный инструмент есть, даже много.
чтобы мне достать из этих столбцов уникальные значения
Вот это не совсем понятно, может имелось ввиду из списков, уникальные, и что значит достать.

Если у тебя твои данные в списках то можно использовать explode.
(
    pd.DataFrame({
        'ID':[1,2],
        'genres':[['Strategy'],['Fightening','Adventure','Arcade']]
    })
    .explode('genres')
)
Затем unique (уникальные) value_counts (посчитать каких и сколько у тебя там) или все что угодно, опций огромное количество. Обрати внимание структура фрейма не рушится (поведение колонки ID).

В качестве ответа. Цикл не использовать, можно все. Для более конкретного ответа. Предоставляешь игрушечный фрейм, и то что ты хочешь увидеть, на выходе. По скольку словами не очевидно, что именно ты хочешь.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы