Как в pandas с помощью groupby посчитать количество уникальных элементов?

Question

Mamol27 @Mamol27

Python

Как в pandas с помощью groupby посчитать количество уникальных элементов?

Здравствуйте, я пытаюсь в машинное обучение.
У меня есть датафрейм
df_c.head()

listing_id 	date 	available 	price
0 	241032 	2016-01-04 	t 	$85.00
1 	241032 	2016-01-05 	t 	$85.00
2 	241032 	2016-01-06 	f 	NaN
3 	241032 	2016-01-07 	f 	NaN
4 	241032 	2016-01-08 	f 	NaN

То есть на каждый день есть состояние каждого listing id.
Я пытаюсь получить количество уникальных id в каждом дне (как сгруппировать по отрезкам времени еще не понял), чтобы отследить появление новых, и построить по этому график.
При группировке по дате я полчил Series? хотя, вроде получилось два столбца.

Я сделал приведение типов
df_c.dtypes

listing_id             int64
date          datetime64[ns]
available               bool
price                float64
dtype: object

[In] g1 = df_c.groupby(['date']).listing_id.unique()

[In] type(g1)
[Out] pandas.core.series.Series

[In] g1.shape
[Out] (365,)

[In] g1.index

[Out] DatetimeIndex(['2016-01-04', '2016-01-05', '2016-01-06', '2016-01-07',
               '2016-01-08', '2016-01-09', '2016-01-10', '2016-01-11',
               '2016-01-12', '2016-01-13',
               ...
               '2016-12-24', '2016-12-25', '2016-12-26', '2016-12-27',
               '2016-12-28', '2016-12-29', '2016-12-30', '2016-12-31',
               '2017-01-01', '2017-01-02'],
              dtype='datetime64[ns]', name='date', length=365, freq=None))

[In] g1

[Out ]date
2016-01-04    [241032, 953595, 3308979, 7421966, 278830, 595...
2016-01-05    [241032, 953595, 3308979, 7421966, 278830, 595...
2016-01-06    [241032, 953595, 3308979, 7421966, 278830, 595...
2016-01-07    [241032, 953595, 3308979, 7421966, 278830, 595...
2016-01-08    [241032, 953595, 3308979, 7421966, 278830, 595...
                                    ...                        
2016-12-29    [241032, 953595, 3308979, 7421966, 278830, 595...
2016-12-30    [241032, 953595, 3308979, 7421966, 278830, 595...
2016-12-31    [241032, 953595, 3308979, 7421966, 278830, 595...
2017-01-01    [241032, 953595, 3308979, 7421966, 278830, 595...
2017-01-02    [241032, 953595, 3308979, 7421966, 278830, 595...
Name: listing_id, Length: 365, dtype: object

В общем вместо массивов я хочу получить размер этих массивов. Документация читаю, но пока не совсем понятно, в этом Series получается multiarraay?

Вопрос задан более трёх лет назад
1228 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Чтобы сделать несколько запросов к OpenAI серверу из Python, нужно каждый раз вызывать client.chat.completions.create?
- 1 подписчик
- вчера
- 95 просмотров
2

ответа
Python

Простой
Какой отлдачик для Python поставить новичку?
- 1 подписчик
- 20 дек.
- 136 просмотров
2

ответа
Python

Простой
Существует ли менеджер виртуальных окружений для python, который хранит все пакеты в одном месте?
- 3 подписчика
- 18 дек.
- 199 просмотров
1

ответ
Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 220 просмотров
1

ответ
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 77 просмотров
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 199 просмотров
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 233 просмотра
1

ответ
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 141 просмотр
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 251 просмотр
0

ответов
Python

Простой
Как получить конкретный атрибут приложенный в обьект?
- 1 подписчик
- 28 нояб.
- 240 просмотров
1

ответ
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Backend Developer

Hard Bootstrapping LLC. • Санкт-Петербург

от 175 000 до 350 000 ₽

Answer 1 · 2020-04-09 22:49:37

Читал-читал - ничего не понял. Какое-то "приведение типов" (зачем??), распечатка индексов, загадочные два столбца в серии, какие-то мультимассивы, и финальный аккорд "В общем вместо массивов я хочу получить размер этих массивов."
Если посчитать, сколько элементов попало в каждую группу - то вот так

df_c.groupby('date').count().listing_id
так
df_c.groupby('date').['listing_id'].count()
или так
df_c.groupby('date').listing_id.count()

Возможно, я не угадал, что вы имели ввиду - тогда попытайтесь более внятно сформулировать задачу.

Answer 2 · 2020-04-09 22:54:58

Я пытаюсь получить количество уникальных id в каждом дне

df_c.groupby('date')['listing_id'].nunique()

Как в pandas с помощью groupby посчитать количество уникальных элементов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт