Как выбирать в базе данных уникальные значения, сравнивая два массива?

Question

hbrmdc @hbrmdc

Как выбирать в базе данных уникальные значения, сравнивая два массива?

База данных имеет таблицу "Контакты", в которой ~100.000 строк.
Пользователям №1 и 2 принадлежит по 1000 строк (контактов) из этой таблицы.
Примерно 30% контактов этих пользователей совпадают (то есть это одни и те же строки из таблицы "Контакты").

Нужно сделать так, чтобы пользователь №1 получил список тех контактов пользователя №2, которых нет у пользователя №1.

Пользователь №1 может быстро добавлять себе контакты пользователя №2, после чего список не совпадающих контактов нужно обновлять.

Какую базу данных для этого использовать и как это правильно реализовать?
Мне не приходит в голову ничего, кроме простых регулярных функций. Но вот проблема, если у этих пользователей по 10.000 контактов и 90% из них совпадает, то регулярная функция уже будет тяжела. А если добавлять к каждому контакту список пользователей, у которых есть этот контакт, то проблемы будут, когда 1000+ пользователей добавят этот контакт, так как придется каждый раз запрашивать полный список пользователей, имеющих этот контакт, добавлять еще одного пользователя и сохранять потом все это.
С NoSQL не работал, но если это то, что мне нужно - то я изучу это.

Вопрос задан более трёх лет назад
440 просмотров

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Продвинутый SQL

5 недель

Далее
Академия Эдюсон

SQL-разработчик: тариф Базовый

2 месяца

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

6 комментариев

nozzy @nozzy

здесь вроде будут все контакты, которые отсутствуют и у user_id = 1 и у user_id = 2.

Написано более трёх лет назад
romy4 @romy4

nozzy: ну да. ничего не мешает добавить having.

Написано более трёх лет назад
nozzy @nozzy

romy4:
Having используется с агрегатными функциями, коих я в вашем запросе не вижу. Без агрегатных функций это будет обычный where. И кстати работать будет не во всех базах данных, например в Oracle будет ошибка.

Написано более трёх лет назад
romy4 @romy4

nozzy: мне всё равно как в последствии отсеять поля второго юзераЮ текущий вопрос поставленную задачу решает. кстати, в postgres он тоже без group_by вызывает ошибку :)

Написано более трёх лет назад
nozzy @nozzy

romy4:
Сделаю за вас :)

select t.*
from
(
select
c1.user_id as uid,
c1.contact_id as cid
from contacts c1
outer join contacts c2 on c1.id=c2.id
where c1.user_id=x and c2.user_id=y
) t
where t.uid = х
;

Написано более трёх лет назад
romy4 @romy4

nozzy: именно так. просто это не я должен был додумать, а юзер, задавший вопрос.

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 4

6 комментариев

hbrmdc @hbrmdc Автор вопроса

то есть использовать $nin с тысячей аргументов возможно? И эффективно?

Написано более трёх лет назад
lega @lega

hbrmdc: Добавил пример, запрос будет по индексу - максимально эффективно, гораздо лучше чем нагромождения из селектов.

Написано более трёх лет назад
nozzy @nozzy

lega:
У товарища наверно будет так:
db.x.insert({ name: 'ubuntu', user_id: [1] })
db.x.insert({ name: 'ubuntu', user_id: [2] })

Написано более трёх лет назад
lega @lega

nozzy:
"Примерно 30% контактов этих пользователей совпадают (то есть это одни и те же строки из таблицы "Контакты")."

Написано более трёх лет назад
nozzy @nozzy

lega:
lega:
Да.
Как я понимаю есть таблица:
contact_id | user_id
1 | 1
1 | 2
В монгу будет добавляться 2 документа:
db.x.insert({ contact_id: '1', user_id: [1] })
db.x.insert({ contact_id: '1', user_id: [2] })
а не один:
db.x.insert({ contact_id: '1', user_id: [1, 2] })

Написано более трёх лет назад
lega @lega

nozzy: Автор же написал "это одни и те же строки из таблицы "Контакты", т.е. не будет "раздвоения", да и вообще нет смысла дублировать данные в данном случае, даже вредно.

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Базы данных

Простой
Как решить проблему когда две запущенные транзакции изменяют одну и ту же строку, но одна из транзакций видит старые данные а не новые?
- 1 подписчик
- 28 мар.
- 240 просмотров
3

ответа
1С-Битрикс

+1 ещё

Простой
Как получить доступ к SQL-базе Bitrix 14.5?
- 2 подписчика
- 18 мар.
- 274 просмотра
2

ответа
Базы данных

Простой
Когда использовать рекурсивное удаление?
- 1 подписчик
- 10 мар.
- 146 просмотров
2

ответа
SQL

+2 ещё

Простой
Как ИИ использовать для написания sql запросов?
- 1 подписчик
- 02 мар.
- 828 просмотров
5

ответов
SQL

Простой
Как мне перестроить sql-запрос так, чтобы сообщение не удалялось, с изменением его содержания в начале?
- 1 подписчик
- 01 февр.
- 189 просмотров
1

ответ
Базы данных

+1 ещё

Простой
Где взять актуальный список городов в странах с таймзонами на русском?
- 1 подписчик
- 21 дек. 2025
- 147 просмотров
1

ответ
SQL

Простой
Как получить последнюю запись для определённого поля?
- 1 подписчик
- 03 дек. 2025
- 326 просмотров
2

ответа
SQL

+2 ещё

Средний
Как правильно обрабатывать концевые пробелы в SQL Server и PostgreSQL?
- 2 подписчика
- 11 нояб. 2025
- 310 просмотров
1

ответ
Базы данных

Простой
Как настроить десятки связей и не потеряться в модели (prisma orm)?
- 1 подписчик
- 10 нояб. 2025
- 105 просмотров
0

ответов
PostgreSQL

+1 ещё

Простой
Как вести историю работы с записями во всех таблицах для всех пользователей?
- 2 подписчика
- 08 нояб. 2025
- 291 просмотр
2

ответа
Показать ещё Загружается…

C# Developer (WinForms + SQL)

Ляпунов и Резниченко • Санкт-Петербург

от 350 000 ₽

Администратор баз данных (Middle/Senior DBA)

Street Falcon • Москва

от 250 000 ₽

Go Developer

ITK academy • Казань

от 75 000 до 125 000 ₽

Answer 1 · 2015-12-10 12:54:57

romy4 @romy4

Exception handler

решается например в посгресе внешним джойном
select *
from contacts c1
outer join contacts c2 on c1.id=c2.id
where c1.user_id=x and c2.user_id=y

Ответ написан более трёх лет назад

6 комментариев

Answer 2 · 2015-12-10 12:44:24

Нужно сделать так, чтобы пользователь №1 получил список тех контактов пользователя №2, которых нет у пользователя №1

В монге можно использовать $ne и $nin

Пример:

> db.x.insert({ name: 'linux', user_id: [1] })
> db.x.insert({ name: 'unix', user_id: [2] })
> db.x.insert({ name: 'ubuntu', user_id: [1, 2] })
> db.x.insert({ name: 'windows', user_id: [3] })
> db.x.ensureIndex({user_id: 1})   //  Делаем индекс

Сам запрос: все документы пользователя 2, но там где нет пользователя 1

> db.x.find({ user_id: { $eq: 2, $ne: 1 }})
{ "_id" : ObjectId("56695f1e9349d7e6c71d83f1"), "name" : "unix", "user_id" : [ 2 ] }

Answer 3 · 2015-12-10 12:52:04

Самая простая реализация будет как раз таки на sql:

SELECT id, cotact_id FROM contacts
WHERE user_id = 2
AND id NOT IN (SELECT id FROM contacts
WHERE user_id = 1)

Answer 4 · 2015-12-10 13:25:45

nozzy @nozzy

Symfony, Laravel, SQL, Python, Telegram

select 
contact_id
from contacts
where 1=1
and user_id = 1
and contact_id not in (
	select 
	distinct contact_id
	from contacts
	where user_id = 2
)

Ответ написан более трёх лет назад

Комментировать

Answer 5 · 2015-12-17 12:02:21

В T-SQL (MS SQL) можно через операции над множествами:

WITH User1Contacts AS (
    SELECT id as cotact_id FROM contacts  WHERE user_id = 1
),
User2Contacts AS (
    SELECT id as cotact_id FROM contacts  WHERE user_id = 2
)
SELECT * FROM User1Contacts 
EXCEPT
SELECT * FROM User2Contacts

INTERSECT наоборот выберет только общие контакты
UNION - объединение контактов обоих пользователей (без дубликатов)

Т.е. говоря языком операций над множествами
INTERSECT = A ∩ B
UNION = A U B
EXCEPT = A \ B

Как выбирать в базе данных уникальные значения, сравнивая два массива?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт