Возможен ли сложный поиск дубликатов?

Question

47911 @47911

Excel

Возможен ли сложный поиск дубликатов?

Здравствуйте. Есть excel файл с инфой вида:
Какие-то колонки = Адрес = какие-то колонки
ххххх = 000000, какая-то ОБЛАСТЬ, Г. неважно, УЛ. 8 сергия радонежского, Д.2, КВ.14 = ххххх
ххххх = 8 сергия радонежского, 2, 1 этаж = ххххх

Как автоматом определять что эти 2 строки по "адресу" - одинаковы?

пример файла

Надо получить все организации с "имя1", но по адресу.
Чтобы глазами пробежаться и удалить дубли. Самое главное их найти. Разовая операция, но по всей таблице с каждой организацией. И плевать что по более сложному адресу не найти, если нашёл по простому адресу(более коротко написанно) - сойдёт - человеку показать эти дубли, чтобы он сам решил. Требуется формула, чтобы пробежаться по 3000 строкам.

Вопрос задан более трёх лет назад
88 просмотров

2 комментария

Подписаться 1 Средний 2 комментария

Помогут разобраться в теме Все курсы

Нетология

Excel: от основ до анализа данных

2 месяца

Далее
Академия Эдюсон

Excel и Google-таблицы: от новичка до эксперта

1 месяц

Далее
ProductStar × РБК

Excel для аналитики

2 месяца

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Excel

+1 ещё

Простой
В какой складской программе можно это сделать?
- 1 подписчик
- 27 янв.
- 267 просмотров
4

ответа
Excel

Простой
Как отсортировать ячейки в 1 столбце EXCEL и далее в другом столбце вывести оборот в порядке убывания?
- 1 подписчик
- 31 дек. 2025
- 161 просмотр
2

ответа
Excel

+1 ещё

Средний
PowerQuery эффективность применения при работе с большим к-вом файлов?
- 2 подписчика
- 12 дек. 2025
- 401 просмотр
2

ответа
Excel

+1 ещё

Простой
Как в VBA открыть книгу EXCEL полностью скрытно от пользователя?
- 2 подписчика
- 04 дек. 2025
- 325 просмотров
1

ответ
Excel

Простой
Почему в Excel 2016 не сохраняет введенные данные?
- 2 подписчика
- 28 нояб. 2025
- 299 просмотров
2

ответа
PHP

+2 ещё

Простой
Как сконвертировать файл в формате excel в pdf?
- 4 подписчика
- 14 нояб. 2025
- 585 просмотров
4

ответа
Excel

+2 ещё

Простой
Как в Excel 2016 быстро, по всем ячейкам дописать нужные строки?
- 3 подписчика
- 14 нояб. 2025
- 352 просмотра
3

ответа
Excel

Простой
Почему не работают ссылки Excel в Р7-Офис?
- 2 подписчика
- 11 нояб. 2025
- 409 просмотров
0

ответов
Excel

Средний
Можно ли воскресить файл из excel дампа?
- 1 подписчик
- 20 окт. 2025
- 265 просмотров
2

ответа
C++

+1 ещё

Простой
Какую библиотеку для excel c++ посоветуете?
- 3 подписчика
- 01 окт. 2025
- 674 просмотра
1

ответ
Показать ещё Загружается…

idShura, прикрепил, извините, торопился, файла под другой не оказалось, но структуру набросал.

Answer 1 · 2023-04-07 20:46:59

Полноценно никак. Но можно создать рейтинг похожести:
1. Найти все слова длиннее 2 букв и все цифры в первой ячейке с адресом.
2. Проверить наличие каждого из этих слов и цифр в последующих ячейках.
3. За каждое совпадение повышать паре строк некий рейтинг похожести. Для этого надо иметь некий массив со всеми возможными парами строк.
4. Потом всё тоже самое повторить со второй и всеми последующими ячейками с адресами.
5. Потом как-то выдать этот рейтинг похожести пар (он будет не маленький с кучей ложных срабатываний) и пусть человек его вручную просматривает.

И это ещё не будет учитывать опечаток. Если хочется ул.Радонежского и раднежского считать одной улицей, то придётся ещё внедрять поиск похожих слов с точностью до 1-2 букв.

Возможен ли сложный поиск дубликатов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт