Как правильно организовать архитектуру MongoDB?

Question

qovalenko @qovalenko

Как правильно организовать архитектуру MongoDB?

Нужно спроектировать БД, подскажите правильное решение:
В своей логике пришел к такому решению:
MongoDB. Первая коллекция это однотипные документы, каждый из которых содержит: пол, вес, рост, возраст и ссылка на одежду в которую одет. Вторая коллекция содержит документы на которые ссылаются первые: Тип одежды(футболка, джинсы), ее цвет и кто на нее ссылается.
Как мне теперь организовать выборку: Выбрать все значения роста, который ссылается на синие брюки.
Я понимаю, что для решения этой задачи подходит логика SQL, дело в том, что я сильно упростил для вопроса пример, на самом деле в первой коллекции документы содержат большое число параметров и в некоторых они присутствуют а в некоторых отсутствуют для этой цели я и выбрал Mongo а теперь и в другую коллекцию вынесены данные точно сгрупированные по параметрам, получилось очень удобно, за исключением одного НО!

Вопрос задан более трёх лет назад
1619 просмотров

1 комментарий

Подписаться 2 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Merion Academy

MongoDB для разработчиков и DevOps

4 месяца

Далее
Нетология

Разработчик на Python совместно с МФТИ

7 месяцев

Далее
Академия Эдюсон

FullStack-разработчик: тариф PRO

14 месяцев

Далее

Решения вопроса 2

3 комментария

qovalenko @qovalenko Автор вопроса

Я Вас понимаю, дело в том, что если добавить данные второй коллекции к данным первой, то при обновлении этих данных нужно будет изменять их в нескольких документах первой коллекции, а это не так уже и удобно.

Написано более трёх лет назад
nrgian @nrgian

qovalenko,
Я Вас понимаю, дело в том, что если добавить данные второй коллекции к данным первой, то при обновлении этих данных нужно будет изменять их в нескольких документах первой коллекции, а это не так уже и удобно.

Это нормально.
Это следствие денормализации.
Это такая плата за плюсы Mongo.

Подробно ответил, дополнив основной мой ответ выше.

Написано более трёх лет назад
qovalenko @qovalenko Автор вопроса

nrgian, Понял!!! Спасибо!!!

Написано более трёх лет назад

Комментировать

Пригласить эксперта

Ответы на вопрос 2

Комментировать

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Django

+2 ещё

Простой
Можно ли на Django сервере разместить базу данных?
- 1 подписчик
- 26 мая
- 188 просмотров
4

ответа
MongoDB

Простой
Как получить записей содержащих нужное значение в массиве?
- 1 подписчик
- 18 дек. 2025
- 78 просмотров
1

ответ
API

+1 ещё

Простой
Точь в точь ли маппятся поля json-сущности на поля в таблицах базы данных?
- 1 подписчик
- более года назад
- 260 просмотров
2

ответа
Python

+1 ещё

Простой
Как искать primary в реплике Монги?
- 1 подписчик
- более года назад
- 133 просмотра
0

ответов
Проектирование баз данных

Простой
Правильно ли построена ER диаграмма?
- 1 подписчик
- более года назад
- 299 просмотров
1

ответ
Информационная безопасность

+2 ещё

Простой
Данная схема реализации базы данных подходит под рамки 152-ФЗ?
- 2 подписчика
- более года назад
- 592 просмотра
2

ответа
Python

+2 ещё

Простой
Как использовать pymongo асинхронно?
- 1 подписчик
- более года назад
- 258 просмотров
1

ответ
PostgreSQL

+1 ещё

Простой
Проектирование БД: чем сейчас люди пользуются?
- 1 подписчик
- более года назад
- 509 просмотров
3

ответа
Node.js

+2 ещё

Средний
Почему иногда отваливается volume в mongo docker compose?
- 4 подписчика
- более года назад
- 346 просмотров
0

ответов
Проектирование баз данных

Простой
Как лучше сделать базу данных?
- 1 подписчик
- более года назад
- 409 просмотров
4

ответа
Показать ещё Загружается…

Архитектуру MongoDB уже реализовали разработчики Монго.
А вы максимум что можете сделать - это реализовать с MongoDB

Answer 1 · 2019-05-10 00:50:18

Низзя так.
Вы поступаете как поступали бы с реляционной СУБД типа MySQL и т.п.
Там связи между таблицами - это норма.

А Mongo их очень плохо обрабатывает.
В ней делают денормализацию.

Тут я присоединяюсь к grinat
Если уж вы методами предназначенными для реляционных СУБД работаете, то:

Правильно будет удалить mongo и поставить mysql/posgres

UPDATED:
qovalenko,

Я Вас понимаю, дело в том, что если добавить данные второй коллекции к данным первой, то при обновлении этих данных нужно будет изменять их в нескольких документах первой коллекции, а это не так уже и удобно.

Это нормально.
Это следствие денормализации.
Это такая плата за плюсы Mongo.

Если хотите пользоваться нормальной формой, без дублей - то вам прямой путь к реляционным СУБД: PostgreSQL/MySQL/MS-SQL/Oracle и т.п.

Ведь NoSQL не просто так быстры и не просто так хорошо масштабируются.
Неужели вы думаете, что разработчики реляционных СУБД более 40 лет их создают и не могут добиться таких впечатляющих результатов, как за смешные 10 лет достигли NoSQL?

В Mongo и прочих NoSQL много чего урезанно по сравнению со строгими СУБД каковыми являются реляционными. И только это и позволяет им работать быстро и масштабироваться просто.

Но за все нужно платить.

Ну например, чего только стоит, что данные на серверах Mongo при репликации станут верными "когда-нибудь потом, но когда точно мы не знаем" Согласованные в конечном счете (Eventually Consistent)

Или же упомянутая вами проблема с тем, что необходимо отслеживать дубли при денормализации.

Я вам больше скажу - если вы не хотите чтобы производительность вашей системы проседала - то эти дубли вам придется устранять не сразу при изменении, а какой-то отдельной процедурой синхронизации, запускаемой, к примеру, раз в час. А в течении этого часа в одном части вашей Mongo будут одни данные, а в другой части - другие данные.

То, как вы хотите сделать - с нормализаций - в Mongo делать нельзя из соображений производительности и корректности работы транзакций.

Ну не предназначена она для этого. Именно это в Mongo и вырезано (точнее изначально не реализовано) по сравнению с реляционными СУБД.

Только в реляционных СУБД как раз всё можно сделать именно так, как вы и хотите (но там вы заплатите ограничениями при масштабировании).

Если проект не очень большой (скажем так: размеры данных на несколько терабайтов или меньше, что позволяет использовать 1 сервер для всех данных; и максимальное число серверов при репликации 2-3) - тогда реляционные СУБД будут весьма производительны и смысла в Mongo нет.

Вот здесь на видео все доходчиво объяснено - где у кого какие преимущества и какие недостатки:
Postgres vs Mongo / Олег Бартунов

Если же вам нравится Mongo, потому что она schemaless, то подобное уже есть и в PostgreSQL
"Умное" индексирование jsonb | Олег Бартунов, Ники...
Отныне вам необязательно все поля прописывать отдельно в CREATE TABLE (но желательно все же отдельно прописывать, через которые осуществляются связи между таблицами - то есть всяческие ID - чтобы оптимизатор запросов лучше работал)

Внимание, для этого в PostgreSQL используется тип данных JSONB, не путать с просто JSON

Если же вы хотите оставаться с Mongo, то делать нужно так, чтобы 1 запрос пользователя в вашем интернет-магазине (или что там у вас) в конечном итоге сводился к 1 запросу на извлечение данных из одной-единственной коллекции Mongo.

А это значит, что будет нужна денормализация, которая и означает дублирование данных. Что ведет к необходимости синхронизации дублей.

При этом, если изменение данных интенсивное, то синхронизацию дублей придется делать отложенную (по cron и т.п.), а не сразу в момент записи.

Это нормально в Mongo. Разработчики Mongo сами так и рекомендуют делать.