Задать вопрос
@alex1nd

Как найти одинаковые ссылки в документах excel?

Есть папки и файлы таблицы excel (в первой колонке url). Нужно как-то сделать поиск по всем этим файлам и удалить копии юрлов которые встречаются в этих файлах.

Оставить только в 1 файле.
  • Вопрос задан
  • 755 просмотров
Подписаться 2 Средний 3 комментария
Пригласить эксперта
Ответы на вопрос 2
zamboga
@zamboga
Аналитика данных, BI-аналитика, дашборды
Макрос. Примерный алгоритм:
1. Открыть все файлы по очереди, скопировать всю инфу из них на новый лист
2. Добавить новую колонку "файл с дублем", в каждую ячейку записать имя файла, откуда копировали данные — чтобы в будущем знать, в каком файле надо удалить.
2. Применить в новой колонке "Признак дубля" формулу =СЧЁТЕСЛИ(A2:A$1000;A2)-СЧЁТЕСЛИ(A:A;A2), эта формула выдаст признак дубля (ессно, если нужные вам данные находятся в колонке А).
Важно! Для следующей строки формула будет иметь вид =СЧЁТЕСЛИ(A3:A$1000;A3)-СЧЁТЕСЛИ(A:A;A3), для следующей =СЧЁТЕСЛИ(A4:A$1000;A4)-СЧЁТЕСЛИ(A:A;A4) и т.д.
Важно! В моем примере последняя ячейка A1000, у вас она будет другая, вместо 1000 поставите номер последней заполненной строки.
Пример
3. В итоге, все дубли получим с цифрой -1, -2, -3 и т.д, а все уникальные будут иметь флаг 0.
4. Повторно открываем все файлы, находим в них дубли через =ВПР или =ИНДЕКС(ПОИСКПОЗ()) и удаляем их, не забыв сделать проверку через =ЕСЛИ(И("имя файла"=ячейка колонки "файл с дублем";"Признак дубля" меньше нуля); то удалить; иначе ничего не делать).

Если файлов не много, то всё это можно и ручками сделать.
Ответ написан
@shushpanio
shushpanio
Сводим все в 1 массив.
Данные-Удалить дубликаты - выбираем по столбцу с URL.

Результат получаем без танцев с бубном и кучи формул.

P.S. В результате останется первое уникальное вхождение URL
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы