Задать вопрос
@Goblin1101

Как посчитать и вывести уникальные значения колонок dataframe, которые имеют тип коллекции/списка?

У меня есть датафрейм, выглядит следующим образом:
6652055092a4c262379259.png
Во второй колонке у меня жанры игр, и они хранятся как коллекция. Есть ли какой-то встроенный инструмент у pandas чтобы мне достать из этих столбцов уникальные значения или же мне придётся с помощью цикла проходить и проверять, встречался такой элемент ранее и добавлять его в отдельную коллекцию?
  • Вопрос задан
  • 340 просмотров
Подписаться 1 Простой Комментировать
Решения вопроса 1
Maksim_64
@Maksim_64
Data Analyst
С помощью цикла однозначно не придется. Встроенный инструмент есть, даже много.
чтобы мне достать из этих столбцов уникальные значения
Вот это не совсем понятно, может имелось ввиду из списков, уникальные, и что значит достать.

Если у тебя твои данные в списках то можно использовать explode.
(
    pd.DataFrame({
        'ID':[1,2],
        'genres':[['Strategy'],['Fightening','Adventure','Arcade']]
    })
    .explode('genres')
)
Затем unique (уникальные) value_counts (посчитать каких и сколько у тебя там) или все что угодно, опций огромное количество. Обрати внимание структура фрейма не рушится (поведение колонки ID).

В качестве ответа. Цикл не использовать, можно все. Для более конкретного ответа. Предоставляешь игрушечный фрейм, и то что ты хочешь увидеть, на выходе. По скольку словами не очевидно, что именно ты хочешь.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
от 200 000 до 300 000 ₽
Greenway Global Новосибирск
от 150 000 ₽
Akronix Санкт-Петербург
от 150 000 до 200 000 ₽