Как найти разницу между двумя csv файлами по индексу используя Pandas?

Question

malvin @malvin

Python
CSV

Как найти разницу между двумя csv файлами по индексу используя Pandas?

Нужно (1)вычесть из цсв с айди и ссылками другой цсы с айди, (2)удалить ячейки без ссылок и (3)дубликаты.

Пробую вот этот метод, но он складывает данные вместо вычетания. Я так понимаю, потому что во втором файле нет поля сайты. Как быть?

df1 = pd.concat([df,cite_id]).drop_duplicates(keep=False)[['id','website']]

df - фрейм с двумя колонками.
cite_id - фрейм с одной колонкой id.

Вопрос задан более трёх лет назад
188 просмотров

Комментировать

Подписаться 3 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- час назад
- 24 просмотра
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 196 просмотров
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 222 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 618 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 531 просмотр
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 297 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 548 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 222 просмотра
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 131 просмотр
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 337 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2018-09-22 09:57:30

На StackOver подсказали ответ.

df.dropna().drop_duplicates()
cite_id.dropna().drop_duplicates()
df[~df.id.isin(cite_id.id.values)]

P.S. вот еще нашел крутую обучалку на трубе (Английский) - Pandas Tutorial

Как найти разницу между двумя csv файлами по индексу используя Pandas?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт