Как эффективно хранить «связность» между пользователями?

Question

Enuriru @Enuriru

Дизайнер, веб-разработчик

Как эффективно хранить «связность» между пользователями?

Приветствую!

Имеется алгоритм, вычисляющий показатель (число), характеризующий отношение пользователя А к пользователю В.
Алгоритм транзитивный, симметричный, т.е. A->B = B->A.

С ростом числа пользователей потребуется хранить результаты и пересчитывать их (например, при изменении некоторых параметров пользователя A нужно пересчитать его отношение ко всем остальным).

Встает вопрос, как эффективно хранить, быстро обновлять и считывать такие данные? SQL, NoSQL? Какой движок/база подойдет лучше? Ведь всего на 1000 пользователей будет уже 1 000 000 записей.

Спасибо!

Вопрос задан более трёх лет назад
2588 просмотров

2 комментария

Подписаться 3 Оценить 2 комментария

Помогут разобраться в теме Все курсы

Merion Academy

Базы данных с нуля

2 месяца

Далее
OTUS

Базы данных

6 месяцев

Далее
Нетология

Python-разработчик с нуля

6 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 4

1 комментарий

Комментировать

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Юриспруденция в IT

+1 ещё

Простой
Агрегаторы мессенджеров (WhatsApp/Telegram/Instagram) в РФ: технически кто отвечает за данные?
- 1 подписчик
- 26 нояб.
- 248 просмотров
1

ответ
Базы данных

Простой
Как настроить десятки связей и не потеряться в модели (prisma orm)?
- 1 подписчик
- 10 нояб.
- 84 просмотра
0

ответов
PostgreSQL

+1 ещё

Простой
Как вести историю работы с записями во всех таблицах для всех пользователей?
- 2 подписчика
- 08 нояб.
- 262 просмотра
2

ответа
Хранение данных

Простой
Сервер (хранит) для хранения файлов и получение по ссылке?
- 1 подписчик
- 07 нояб.
- 272 просмотра
4

ответа
Хранение данных

+1 ещё

Средний
Масштабируемое хранилище. На основе чего?
- 1 подписчик
- 06 нояб.
- 138 просмотров
1

ответ
Хранение данных

+1 ещё

Сложный
Как сделать Service Structure рабочими в Tempo?
- 1 подписчик
- 06 нояб.
- 49 просмотров
0

ответов
Базы данных

+1 ещё

Средний
Какие методы синхронизации SQL Express и MSSQL Server порекомендуете?
- 3 подписчика
- 03 нояб.
- 194 просмотра
2

ответа
Алгоритмы

Средний
Как создать алгоритм для ракеты в игре?
- 2 подписчика
- 30 окт.
- 280 просмотров
1

ответ
Алгоритмы

Простой
Как решать алгоритмические хакатоны и учится?
- 1 подписчик
- 27 окт.
- 195 просмотров
2

ответа
Базы данных

+1 ещё

Простой
Как правильно реализовать обновление порядка (поле order) в бд?
- 1 подписчик
- 19 окт.
- 205 просмотров
2

ответа
Показать ещё Загружается…

Frontend Lead (Vue3)

Cobalt Lab

от 3 700 до 5 500 $

Разработчик 1С (МСФО)

LIAN

До 250 000 ₽

Fullstack-разработчик (Python и React.JS)

Chad AI

от 200 000 ₽

Интересный вопрос. А что означает транзитивность алгоритма? Сколько времени он работает для отдельной пары пользователей?
Еще, я так понимаю, для пары пользователей считается некоторое число d(A, B). Оно является метрикой? d(A, B) + d(B, C) >= d(A, C), d(A, A) = 0? И какие оно принимает значения?

Answer 1 · 2015-03-01 04:07:03

Транзитивность в моем понимании означает
A->B + B->C = A->C
Среди тысячи пользователей вряд ли все связны.

В таких посылках речь идет о связности графа. Иерархические структуры данных(дерево, граф) инородны для реляционной алгебры SQL. Известные решения Adjacency list и Nested sets. Adjacency list требует применения WITH RECURSIVE. Nested sets предполагает очень много пересчета при операциях(особенно INSERT).
Нужную вам модель данных было бы удобней реализовать в hierarchical DB (например просто hierarchical key value, Redis или levelDB сойдет) или graph DB или документарной DB (например просто в XML который в сути своей иерархичен)

Answer 2 · 2015-03-01 07:57:58

Если алгоритм задает метрику, и готовы пожертвовать точностью, можно всех пользователей отобразить в O(log n)-мерное пространство. В худшем случае расстояния испортятся в O(log n), но при этом можно хранить всего O(n log n) бит информации.

Answer 3 · 2015-03-01 11:57:20

Вам точно нужно хранить эту циферку таки для всех? Если только для тех, у кого она меньше/болше некоего порога - то это O(N) или O(NlogN), что уже влезет в обычный SQL, а не O(N^2), что действительно плохо.

Answer 4 · 2015-03-28 05:01:09

Y V @targetjump

думаю neo4j именно то, что Вам нужно

Ответ написан более трёх лет назад

Комментировать

Как эффективно хранить «связность» между пользователями?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт