Как посчитать ФИО в колонках с неправильным порядком?

Question

Cricket @CricketIvan

Junior Programmer

Microsoft SQL Server

Как посчитать ФИО в колонках с неправильным порядком?

Дано:

id  |  col1       |  col2         |  col3
--------------------------------------
1   |  Иванов | Иван          | Иванович
2   |  Иван     | Иванович  | Иванов
3   |  Петров | Сергей        | Алексеевич
4   |  Петров | Сергей        | Алексеевич
5   |  Сергей  | Алексеевич| Петров

Иванов Иван Иванович и Иван Иванович Иванов - одно и тоже лицо, но id разный просто перепутан порядок Ф.И.О. Как привести в "правильный порядок" и посчитать (сгруппировать) по ФИО?

Вопрос задан более трёх лет назад
157 просмотров

2 комментария

Подписаться 1 Простой 2 комментария

Помогут разобраться в теме Все курсы

Merion Academy

Базы данных с нуля

2 месяца

Далее
Сетевая Академия ЛАНИТ

Выполнение запросов на языке Transact-SQL

1 неделя

Далее
Merion Academy

Основы реляционных баз данных SQL

1 месяц

Далее

Решения вопроса 1

3 комментария

Пригласить эксперта

Ответы на вопрос 2

4 комментария

Akina @Akina

Вот нафига делать кодом на клиенте то, что без проблем сделает SQL-сервер? чтобы погонять туда-сюда побольше данных?

Не надо анализировать никакие окончания - там только порядок может быть различным, а отдельные значения полностью совпадают. Иванов Евгений Петрович и Иванова Евгения Петровна - вот ни разу не дубликат.

Написано более трёх лет назад
ComodoHacker @ComodoHacker

отдельные значения полностью совпадают

Akina, уверены?

Написано более трёх лет назад
Ипатьев @ipatiev

ComodoHacker, а вы уверены в своей трактовке вопроса? Не выяснив далали, а сразу кинувшись строчить ответ? Который и не ответ вовсе, а так - досужие рассуждения?

Написано более трёх лет назад
Akina @Akina

ComodoHacker, я верю тому, что вижу в тексте вопроса.

Написано более трёх лет назад

9 комментариев

Ипатьев @ipatiev

Это учебная задача, а не практическая. И речь тут не про вырожденные случаи.
Рекомендую прочитать комментарий Akina под вопросом.

И заодно задуматься самому: почему профессионалы не кидаются сразу писать ответ, а сначала выясняют детали в коментариях? ;)

Написано более трёх лет назад
rPman @rPman

я и не просил никакие окончания исследовать

но про проблемные случаи помнить всегда полезно, тем более если это обучающая

Написано более трёх лет назад
Ипатьев @ipatiev

ну хорошо, без окончаний.
попробуйте сами решить задачу тем способом, который предложили

Написано более трёх лет назад
Cricket @CricketIvan Автор вопроса

Ф, И, О - даны так как есть в моем примере, ошибок нет, анализировать ни чего не надо, такая задача не стоит

Написано более трёх лет назад
Ипатьев @ipatiev

Ivan, а зачем вы приняли этот ответ? Он у вас работает? Серьёзно?

Написано более трёх лет назад
Cricket @CricketIvan Автор вопроса

Роман Юрьевич Ипатьев, Вы подали идею, сейчас пытаюсь оттокнуться от нее )
убрать отметку?)

Написано более трёх лет назад
Ипатьев @ipatiev

Ivan, эта идея вообще не работает.
правильную идею подсказал Akinа, с сортировкой.
Не нужно никогда помечать решением ответ, который у вас не работает
Нужно иногда думать не только о себе, но и о других людях, у которых будет такой же вопрос. И которые потратят кучу времени на нерабочее решение

Написано более трёх лет назад
Cricket @CricketIvan Автор вопроса

Роман Юрьевич Ипатьев, да, Вы правы, учту на будущее, спасибо

Написано более трёх лет назад
rPman @rPman

Да конечно мой косяк, ответ мой неверный, так как требует делать дополнительное пересечение результатов по ид

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Microsoft SQL Server

Простой
Как корректно выполнить удаление данных при наличии ограничений целостности (Foreign Key) и отсутствии триггеров или опции ON DELETE CASCADE?
- 1 подписчик
- 10 мар.
- 141 просмотр
1

ответ
Microsoft SQL Server

Сложный
Производительность SQL Server после INDEX REORGANIZE?
- 3 подписчика
- 05 февр.
- 372 просмотра
0

ответов
Microsoft SQL Server

Простой
Как проще всего проверить были ли какие активности в базе MSSQL?
- 2 подписчика
- 24 дек. 2025
- 142 просмотра
1

ответ
SQL

+2 ещё

Средний
Как правильно обрабатывать концевые пробелы в SQL Server и PostgreSQL?
- 2 подписчика
- 11 нояб. 2025
- 332 просмотра
1

ответ
Базы данных

+1 ещё

Средний
Какие методы синхронизации SQL Express и MSSQL Server порекомендуете?
- 3 подписчика
- 03 нояб. 2025
- 244 просмотра
1

ответ
Системное администрирование

+3 ещё

Простой
Не удается подключить сервер к консоли администрирования 1С. В чем может быть проблема?
- 3 подписчика
- 26 сент. 2025
- 373 просмотра
3

ответа
Microsoft SQL Server

+2 ещё

Средний
Может ли тормозить 1С из-за отключенного кэширования записи на диск на сервере с 1С+MSSQL?
- 5 подписчиков
- 20 авг. 2025
- 539 просмотров
3

ответа
1С

+1 ещё

Средний
Как правильно протестировать регламентные задания для обслуживания баз данный MSSQL?
- 2 подписчика
- 20 авг. 2025
- 334 просмотра
1

ответ
Microsoft SQL Server

Средний
Возможно ли в UPDATE «видеть» результат обновления предыдущих строк?
- 2 подписчика
- 01 авг. 2025
- 163 просмотра
1

ответ
Microsoft SQL Server

+2 ещё

Простой
Как создать связанный Oracle сервер с Ms SQL server?
- 1 подписчик
- более года назад
- 173 просмотра
0

ответов
Показать ещё Загружается…

Укажите конкретную СУБД, включая её версию.

Общий подход - конкатенация трёх полей с их сортировкой.
Akina,
это можно сказать учебная задача, выполняться будет на MS SQL Server, версию не могу сказать. Бьюсь над задачей уже несколько дней. Я тоже думал про конкатенацию но дальше не смог понять - что мне это даст

Answer 1 · 2021-10-22 09:48:46

Пример реализации для MySQL 8+:

WITH 
cte1 AS ( SELECT id, col1 val FROM test UNION ALL 
          SELECT id, col2 FROM test UNION ALL
          SELECT id, col3 FROM test ),
cte2 AS ( SELECT id, GROUP_CONCAT(val ORDER BY val) FIO
          FROM cte1 
          GROUP BY id )

SELECT test.id, test.col1, test.col2, test.col3, GROUP_CONCAT(cte2_2.id) ids
FROM test
JOIN cte2 cte2_1 USING (id)
JOIN cte2 cte2_2 USING (FIO)
GROUP BY test.id, test.col1, test.col2, test.col3

Вывод:

id	col1		col2		col3		ids
1	Иванов		Иван		Иванович	1,2
2	Иван		Иванович	Иванов		1,2
3	Петров		Сергей		Алексеевич	3,4,5
4	Петров		Сергей		Алексеевич	3,4,5
5	Сергей		Алексеевич	Петров		3,4,5

DEMO

Если нужна ещё и нормализация (т.е. строго в col1 сунуть фамилию, в col2 имя...) - наилучшим вариантом считаю загрузку справочников имён, отчеств и фамилий (вполне доступные справочники) и их использование для категорирования. 99% записей будут полностью обработаны по ним, а оставшийся десяток записей (где два или все три значения отсутствуют в справочниках) можно и вручную обработать, вернее, пополнить справочник, чтобы при втором запуске все 100% были распознаны и категорированы корректно.

выполняться будет на MS SQL Server, версию не могу сказать.

Для MS SQL вместо GROUP_CONCAT будет STRING_AGG(column) [WITHIN GROUP ( ORDER BY column)]. https://docs.microsoft.com/ru-ru/sql/t-sql/functio...

Answer 2 · 2021-10-22 09:31:44

Можно только вряд ли запросом. Скорее кодом.

Анализировать окончания слов, составить списки окончаний, характерных для фамилий, имен, отчеств. А также списки исключений. И все равно результат нужно будет проверять глазами и кое-где исправлять.

Очистка данных дело такое, дорогое и хлопотное. И проводить ее желательно до попадания в базу.

Answer 3 · 2021-10-22 09:38:20

так как цель найти одних и тех же людей с перепутанным порядком
найди записи в которых col1 совпадает с col2 потом с col3, потом col2 с col3, получишь список пар, в которых это перепутано, осторожно, вырожденные случаи (например в ФИО записаны инициалы) или к примеру восточные имена (там встречаются очень сложные составные фио, которые записывают кто во что горазд), эти моменты лучше обработать отдельной логикой

select a.*,b.*
from table a inner join table b on
a.col1=b.col2
-- a.col1=b.col3
-- a.col2=b.col3

Как посчитать ФИО в колонках с неправильным порядком?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт