Как вывести названия столбцов csv файла в которых есть дубликат значения ячейки?
python 3, pandas последней версии.
Есть csv файл.
Строки - url товаров.
Столбцы - категории товаров. (То есть один товар может быть в нескольких категориях, как часто бывает)
Подскажите оптимальный (или любой) алгоритм который для каждой ячейки вернет перечень названий столбцов, где встречается ее дубликат.
Если ячейки не упорядочены (например, по алфавиту), то придётся идти по всем ячейкам.
Если упорядочены, то двоичный поиск, он качественно быстрее, чем полный перебор.