Нужно
(1)вычесть из цсв с айди и ссылками другой цсы с айди,
(2)удалить ячейки без ссылок и
(3)дубликаты.


Пробую вот этот метод, но он складывает данные вместо вычетания. Я так понимаю, потому что во втором файле нет поля сайты. Как быть?
df1 = pd.concat([df,cite_id]).drop_duplicates(keep=False)[['id','website']]
df - фрейм с двумя колонками.
cite_id - фрейм с одной колонкой id.