Как вывести названия столбцов csv файла в которых есть дубликат значения ячейки?

Question

Николай @rosweb2018

Python

Как вывести названия столбцов csv файла в которых есть дубликат значения ячейки?

python 3, pandas последней версии.
Есть csv файл.
Строки - url товаров.
Столбцы - категории товаров. (То есть один товар может быть в нескольких категориях, как часто бывает)
Подскажите оптимальный (или любой) алгоритм который для каждой ячейки вернет перечень названий столбцов, где встречается ее дубликат.

Спасибо!

Вопрос задан более трёх лет назад
552 просмотра

2 комментария

Подписаться 1 Простой 2 комментария

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Сложный
Как решить задачу на 3D DP?
- 1 подписчик
- 22 июл.
- 162 просмотра
2

ответа
Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- 19 июл.
- 104 просмотра
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 114 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 380 просмотров
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 244 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 691 просмотр
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 561 просмотр
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 312 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 585 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 231 просмотр
2

ответа
Показать ещё Загружается…

Пройтись циклом
Добавлять в словарь по урлу товара
Если ячейки не упорядочены (например, по алфавиту), то придётся идти по всем ячейкам.
Если упорядочены, то двоичный поиск, он качественно быстрее, чем полный перебор.

Answer 1 · 2018-10-04 10:43:33

Повернуть таблицу так, чтобы в каждой строке была пара (url, категория (которая раньше была именем столбца)).
Затем поиск дубликатов строк.

Как вывести названия столбцов csv файла в которых есть дубликат значения ячейки?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт