Какой принцип использовать для хранения данных в MongoDB?

Question

makerkz @makerkz

Какой принцип использовать для хранения данных в MongoDB?

Пишется веб-сервис (скажем, для каталога книг). Используются node.js + MongoDB. Возник вопрос по хранению данных в базе. Какой подход лучше использовать? Есть два основных типов данных - пользователь, книга. Присутствие дополнительных типов зависит от варианта.

Есть 2 варианта:
1) Не использовать дополнительные типы данных, то есть все данные о произведении хранить в отдельном документе коллекции "Произведения" (то есть отзывы о нём, имя автора, категория и т.д.)
2) Использовать дополнительные типа данных, то есть создавать связанные коллекции с "Произведениями" - "Отзывы", "Категории произведений", "Авторы".

В будущем потребуется хранить и редактировать огромные объёмы информации, и поэтому интересно, что же будет лучше в плане масштабирования системы?

Возможны вы посоветуете избрать какой-то другой подход? Допустим, отказаться от использования schemaless БД? Все данные должны быть чётко структурированы.

Вопрос задан более трёх лет назад
3363 просмотра

Комментировать

Подписаться 8 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Node.js для backend-разработки

6 месяцев

Далее
Академия Эдюсон

Node.js-разработчик

8 месяцев

Далее
ProductStar × РБК

Профессия: Frontend-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 5

Комментировать

1 комментарий

6 комментариев

makerkz @makerkz Автор вопроса

Вот этого я и понять не могу. Будут ли еще какие то плюшки кроме динамической схемы? Все же с позиции проектирования базы для большого проекта на ноде, какая база данных будет лучше?

Написано более трёх лет назад
makerkz @makerkz Автор вопроса

Если буду использовать монго, то буду использовать mongohq, что скажете? Или же лучше у себя хранить?

Написано более трёх лет назад
makerkz @makerkz Автор вопроса

Каким образом лучше хранить историю изменений?

Написано более трёх лет назад
lega @lega

> Будут ли еще какие то плюшки кроме динамической схемы?
Масштабирование, разные типы индексов: geo, ttl и др. Очень удобны массивы, попробуйте на sql сделать поиск по нескольких тегам.

Написано более трёх лет назад
lega @lega

Историю можно делать по разному, я обычно просто сохраняю старую версию документа в коллекцию history с ссылкой на активный документ.

Написано более трёх лет назад
Андрей @kaasius

Вот товарищ выше ответил. Хранить я бы стал у себя, но у меня 50 серверов. Вам надо понимать для себя, что удобнее/лучше.

Написано более трёх лет назад

2 комментария

3 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Node.js

Простой
Как сохранить картинку на сервере, переданную пользователем на сервер node js сокетом?
- 1 подписчик
- 01 июл.
- 85 просмотров
2

ответа
JavaScript

+1 ещё

Сложный
Как сделать логику post запроса покупки товара, если 1 товара не хватает — отменить покупку?
- 2 подписчика
- 10 июн.
- 219 просмотров
1

ответ
Базы данных

Средний
В чем разница между логической и физической модели в БД?
- 1 подписчик
- 27 мая
- 294 просмотра
3

ответа
Базы данных

Простой
Как решить проблему когда две запущенные транзакции изменяют одну и ту же строку, но одна из транзакций видит старые данные а не новые?
- 1 подписчик
- 28 мар.
- 286 просмотров
3

ответа
Node.js

Простой
Как решить данную ошибку?
- 2 подписчика
- 20 мар.
- 308 просмотров
1

ответ
Базы данных

Простой
Когда использовать рекурсивное удаление?
- 1 подписчик
- 10 мар.
- 166 просмотров
2

ответа
MySQL

+1 ещё

Простой
Как удалить число содержащееся в ячейке таблицы бд Mysql среди чисел через запятую, если таких чисел 2 или более удалить только первое найденое?
- 1 подписчик
- 19 февр.
- 245 просмотров
1

ответ
JavaScript

+1 ещё

Простой
Как правильно сделать запрос на страницу для получения данных не по апи?
- 1 подписчик
- 12 февр.
- 293 просмотра
2

ответа
Node.js

+2 ещё

Средний
Как правильно поставить Newman + Allure reporter через nvm, чтобы не ловить EACCES и «could not find allure»?
- 1 подписчик
- 23 янв.
- 139 просмотров
0

ответов
Node.js

Простой
Почему на vps с pm2 сбрасывается server.js?
- 1 подписчик
- 16 янв.
- 152 просмотра
1

ответ
Показать ещё Загружается…

Answer 1 · 2014-04-02 23:27:59

Рекомендую почитать "50 Tips and Tricks for MongoDB". Текста не много, а информации полно. Здесь в ответах немного напутали - то, что у вас под 1ым пунктом - это денормализованная коллекция. Плюсы в том, что за один запрос имеете всю информацию по обьекту, ну а минусы соответственно, что сложно применять правки. А 2ой пункт, это уже нормализованная - и тут всё наоборот. Но главное, это грамотно балансировать между ними, а не выбирать одну из сторон. Структура очень зависит не только от структуры данных, но и того - как мы используем эти данные (какие выборки делать будем) и на сколько важна их актуальность. Пару советов из разных сторон:
- если идете по первому пути - то можете хранить также все подсущности в отдельных коллекциях. Изменяя подсущность, изменяете её в своей коллекции, и не бойтесь писать скрипты для нормализации, которые по крону будут актуализировать основную коллекцию.
- а если по второму, то храните не только `_id` подсущностей, но также часть обьекта, которая всегда будет нужна, что бы минимизировать запросы.

Answer 2 · 2014-04-02 20:22:46

Зависит от использования, например если отзывы будут выводится на странице книги и больше с ними ничего не будет происходить, то их удобно сделать вложенными, + экономия на запросах, одним запросом будет доставаться книга и отзывы.
А вот авторов лучше (можно) в отдельную коллекцию, т.к. их данные будут изменятся (имя, фотка, описание, теги?), Хотя если эти изменения очень редкие или вовсе нет, то можно сделать вложенными, при этом будет больший расход диска, но экономия на запросах.

Answer 3 · 2014-04-02 20:38:32

Тут нужна разумная нормализация. Как писали выше, одна сущность - один документ. Но не забываем при этом, что излишнее дублирование информации (вроде автора) не есть хорошо. Ибо, если у автора что-то изменится, надо будет перелопачивать все документы с этим автором.

Прелесть schemaless именно в отсутствии схемы. То есть вы можете разным сущностям придать разные атрибуты, при этом держать все в одной коллекции и индексировать все эти атрибуты. Если же структура предполагается более регулярной, если схема будет присутствовать - то стоит обратиться к хранилищам со схемой.

Answer 4 · 2014-04-03 09:12:08

В будущем потребуется хранить и редактировать огромные объёмы информации

На счет объемов, у вас наверняка для книг будут картинки (постеры), дак вот они могут занимать большую часть хранилища (+ большую часть расхода), я работал с одним книжным сайтом - на каждую книгу с отзывами (~4kb) есть несколько картинок (~120kb), т.е. ~97% (от книг) это картинки.

Answer 5 · 2014-04-03 10:49:27

Пума Тайланд @opium

Просто люблю качественно работать

Книги все таки хорошо ложатся в реляционную модель, зачем там монго?

Ответ написан более трёх лет назад

3 комментария

Какой принцип использовать для хранения данных в MongoDB?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт