Как правильно объединять таблицу, если index не чёткий в pandas?

Question

Кирилл Петров @Recosh

Программист студент

Python
NumPy

Как правильно объединять таблицу, если index не чёткий в pandas?

Приветствую! Теперь у меня вот такой вопрос. Допустим есть 2 таблицы:

index	param	paramJoined
0	-2	None
1	-2	None
2	0	None
3	2	None

и

index		param
0.000000	-3
0.434783	-3
0.869565	1
1.304348	0
1.739130	1
2.173913	3
2.608696	3
3.043478	6
3.478261	4
3.913043	7

И я хочу, не меняя индексы первой таблицы, присвоить ближайшее предыдущее значение по индексу из второй таблицы.

Вот такой какашечный код получился для реализации лиж бы работало:

# df1 первая таблица, df2 вторая
for index, item in df1.iterrows():
  df1.at[index, 'paramJoined'] = df2[df2.index <= index].param.tail(1).values[0]

И получился правильный результат:

index	param	paramJoined
0	-2	-3
1	-2	1
2	0	1
3	2	3

Но такой способ не производительный при большом объёме данных, подскажите как правильно оформить данный алгоритм?

Вопрос задан более трёх лет назад
66 просмотров

Комментировать

Подписаться 2 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Сложный
Как решить задачу на 3D DP?
- 1 подписчик
- 16 часов назад
- 82 просмотра
2

ответа
Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- 19 июл.
- 90 просмотров
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 95 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 331 просмотр
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 238 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 666 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 554 просмотра
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 309 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 569 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 228 просмотров
2

ответа
Показать ещё Загружается…

Answer 1 · 2020-05-25 20:12:04

В общем решил пока так:

#Переименовываем стобец
df2Renamed = df2.rename(columns={'param': 'paramJoined'})
#Объединяем и сортируем по индексу
df1concat = pd.concat([df1,df2Renamed]).sort_index()
#Заполняем пустышки
df1concat.paramJoined = df1concat.paramJoined.ffill()
#Удаляем вспомогательные данные
df1result = df1concat.dropna(subset=['param'])
df1result

Но если кто сделает красивее, буду благодарен)

Answer 2 · 2020-05-25 15:15:55

Очевидно, что такой индекс в таблице это какая-то ошибка, такого не должно быть, если мыслить разумно.
Индекс представляет собой идентификатор строки, он чаще всего не носит в себе информации, а тем более он не должен носить в себе вещественные числа (float).
Но если вам нужно объединить как-то эти таблицы, то мне кажется что сперва лучше поработать отдельно над индексом, чтобы он приводился к нужному виду, а затем уже сцеплять.
P.S. Поделитесь, что у вас за задача, что приходится городить такое?

Как правильно объединять таблицу, если index не чёткий в pandas?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт