Для чего идеальна MongoDb? Примеры приложений, где монга будет лучше mysql?

Question

Антон Середний @smidl

WordPress-разработчик

MongoDB

Для чего идеальна MongoDb? Примеры приложений, где монга будет лучше mysql?

Перечитал кучу хабромыслей и все же хочу спросить? Можете привести реальные примеры, когда использование монги будет более удобной и удачной альтернативой реляционным бд.

На хабре писали об обычном блоге. Но в обсуждению подняли вопрос комментариев к записям блогов, учитывая что в монго нет связей между таблицами

помогите понять)

Вопрос задан более трёх лет назад
27265 просмотров

6 комментариев

Подписаться 23 Простой 6 комментариев

Max Payne @YardalGedal

Почти всегда.

Исключения: в тот момент, когда понимаешь что здесь монго точно не подойдёт.

Написано более трёх лет назад
sim3x @sim3x

Arti Markelov, сколько больших проектов уже сменили монгу на постгрес?

Написано более трёх лет назад
Max Payne @YardalGedal

sim3x, Не слишком хорошо знаком с постгрес, к сожалению.

Написано более трёх лет назад
WayMax @WayMax

Arti Markelov,
- я забиваю гвозди микроскопом
- но ведь для этого есть молоток
- не слишком хорошо знаком с молотком, продолжу забивать микроскопом

Написано более трёх лет назад
Max Payne @YardalGedal

WayMax, Не самое удачное сравнение. Попробуй рассмотреть бактерии молотком.

Написано более трёх лет назад
sim3x @sim3x

Arti Markelov, ну, яндекс диск уже сменил монгу, от которой плевался, на нормальнуюс обьектную СУБД постгрес?

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Merion Academy

MongoDB для разработчиков и DevOps

4 месяца

Далее
Нетология

Разработчик на Python совместно с МФТИ

7 месяцев

Далее
Академия Эдюсон

FullStack-разработчик: тариф PRO

14 месяцев

Далее

Решения вопроса 7

7 комментариев

chupasaurus @chupasaurus

Также, ограничение в 16 МБ на документ (встроенный Grid для увеличения этого лимита только усложняет архитектуру с поддержкой и понижает производительность), определённые странности в области отказоустойчивости... Очень специфичная СУБД, для очень специфичных задач.

Написано более трёх лет назад
lega @lega

да, на конференциях по MongoDB, Вы вряд ли увидите, как кто-то будет рассказывать, что [их любимая] монга "хуже" некоторых других движков...

да, на конференциях по Posrges, Вы вряд ли увидите, как кто-то будет рассказывать, что [их любимая] бд "хуже" некоторых других движков...

Написано более трёх лет назад
Евгений Вольф @Wolfnsex

lega, тут я с Вами полностью согласен, хотя иногда на конференциях где обсуждается Postgres -
проскакивают эпитеты вроде "пока это слабое место нашей БД, но мы работаем над решением проблемы". А вообще, было бы удивительно, если бы кто-то на конференции начал (массово) озвучивать недостатки [любимого] продукта (вместо того, что бы рассказывать о его успехах) :)

Написано более трёх лет назад
Евгений Вольф @Wolfnsex

chupasaurus, я сначала хотел написать про размер документа в 16Мб... но потом чего-то решил, что и так уже дофига написано :)))

Написано более трёх лет назад
lega @lega

Евгений Вольф chupasaurus , размер документа в 16Мб

Чего все прикапываются к размеру документа? Если вам не хватает 16Мб на документ (строку в таблице, в переводе на sql), значит у вас не данные а свалка в документах и нужно пересмотреть архитектуру, так же большие документы (строки) негативно сказываются на производительность. Тот же gridFS режет файлы по 200-260kb для лучшей производительности (возможность потоково работать с данными, а не целыми блоками).

Написано более трёх лет назад
Евгений Вольф @Wolfnsex

lega, на каком-нибудь очень оживленном форуме или в комментариях под каким-нибудь супер-популярным клипом (или иным другим медиа-объектом, вызывающим большой резонанс в обществе) - могут и больше 16Мб понаписать. Да, я понимаю, что 16Мб текста - это реально дохрена, но бывает такое что и больше пишут... А помимо комментариев, есть ещё и остальные части документа, которые тоже "что-то занимают". И тут возникает резонный вопрос: ~~кто виноват и что делать?~~, как быть, если в очень редких случаях у нас размер документа может внезапно превысить 16Мб на сайте? Заранее спроектировать сайт таким образом, что бы комментарии хранились отдельно от поста, т.е. сделать реляционную модель? Или запретить пользователям писать комментарии в какой-то момент, когда размер документа превысит некий порог (например, в 15Мб), или... ?

Кстати, транзакционная/атомарная целостность операций в MongoDB всё так же поддерживается только на уровне одного документа?

Написано более трёх лет назад
lega @lega

Евгений Вольф, могут и больше 16Мб понаписать

Да, но ни один сервис не будет вам вываливать все 16Мб комментариев при открытии, оно ни нужно ни пользователю ни сервису, можно хранить первые/последние/ключевые 100-1000* коментариев в документе, а остальные комментарии хранить чанками для редких маньяков которые листают по страницам.

Кстати, транзакционная/атомарная целостность операций в MongoDB всё так же поддерживается только на уровне одного документа?

Да, и это плохо, хотя у них оно в роадмапах есть, но непонятно через сколько лет будет реализовано и будет ли вообще. Это сильно ограничивает монгу в приминении.

Написано более трёх лет назад

7 комментариев

Дон Ган @PravdorubMSK

Но бизнес-процессы в реальной жизни не являются транзакционными
щито???
даже оплата приведенная как пример - вполне может быть на уровне транзакции

Написано более трёх лет назад
terrier @terrier

Высокопроизводительные распределенные интернет-приложения. Конкретные примеры: ... netflix.com

Очень смешно. В нетфликсе используется множество всяких баз, включая, конечно же MySQL и Oracle, у которых якобы "проблемы с горизонтальным масштабированием", но вот монги там нет.
см. например
В общем-то, тамошние инженеры выразили как-то разумное мнение о монге:
We considered and experimented with MongoDB, yet the operational overhead and complexity made it unmanageable so we quickly backed away from it.

здесь

Написано более трёх лет назад
xfg @xfg

terrier, я не писал, что в нетфликс используют монго. Я о nosql в целом. Из вашей же статьи

This appetite for more data, is pushing the boundaries of traditional RDBMS systems and forcing companies to research alternative data stores.
...
From customer/subscriber information, to movie metadata, to monitoring stats, it’s all hosted in Cassandra.
In most of our uses, Cassandra is the source of truth database. There are a few legacy datasets in other solutions, but are actively being migrated.

Они всё хранят в кассандре, а что не хранят, то в процессе миграции. Кассандра у них это "the source of truth database". От монго они отказались не потому что это плохое решение, а потому что кассандра проще в конфигурации и требует меньшего вмешательства человека.

MySQL и Oracle, у которых якобы "проблемы с горизонтальным масштабированием"

Нет, не якобы. Почитайте хотя бы статью, на которую вы ссылаетесь.

One team even built a sharded RDBMS cluster, with every node in the cluster being replicated twice. This solution is also very complex to manage. We are currently working to migrate to C* for that application.

Очень смешно.

Смешно, это когда читаешь, что "монго/кассандра/etc заточено под конкретные задачи". И начинают потом выдумывать эти самые мифические задачи. У кого насколько фантазии хватит. Всё что угодно, кроме современных интернет-приложений. Для интернет-приложений у них есть реляционные базы. Всё верно. Концепция РСУБД появилась же раньше, чем сам интернет. Никакой логической ошибки здесь нет. Так что да, MySQL. Ну а Mongo это для чего-то там.

Написано более трёх лет назад
xfg @xfg

PravdorubMSK, вы не можете передать транзакционно деньги даже из рук в руки. Есть момент, когда деньги уже не ваши, но еще и не вашего получателя. Можете на стол деньги выложить. С которого их заберет получатель. Станет очевиднее.

Поэтому вы не можете сделать транзакционный перевод денежных средств между банками. Это гетерогенные системы. Денежные средства будут списаны со счета отправителя. И вы будете это видеть. Как будете видеть и то, что они отсутствуют на счете получателя какое-то время. Как минимум здесь нарушены свойства Isolation и Consistency из ACID. И это нормально для бизнеса. Если произойдет сбой, то денежные средства вернут на счет отправителя. Но это будет отдельная операция на уровне приложения, а не роллбек на уровне базы данных. Я даже не стану вам объяснять почему у вас не получится подружить SOA и ACID.

Написано более трёх лет назад
sim3x @sim3x

А зачем делать роллбек операции, в которой не произошло сбоя?

И в каком конкретно месте при передаче денег от одного клиента банка к другому клиенту теряется консистентность и изоляция?

Написано более трёх лет назад
xfg @xfg

sim3x, бизнес-процесс стоит не из одной операции, а из набора операций. Если какая-то из операций дает сбой, то мы имеем частично завершенный бизнес-процесс. Необходимо либо попробовать выполнить неудачную операцию еще раз либо каким-то образом откатить все уже успешно завершенные операции внутри этого бизнес-процесса, чтобы система пришла в консистентное состояние.

По поводу изоляции и согласованности. Чтобы лучше понимать где эти свойства теряются, давайте сначала посмотрим на выдержку из википедии:

Наконец, ещё одно замечание касается того, что в ходе выполнения транзакции согласованность не требуется. В нашем примере, списание и зачисление будут, скорее всего, двумя разными подоперациями и между их выполнением внутри транзакции будет видно несогласованное состояние системы. Однако не нужно забывать, что при выполнении требования изоляции, никаким другим транзакциям эта несогласованность не будет видна.
Тем самым эта промежуточная несогласованность является скрытой.

При межбанковских переводах требование изоляции не выполняется. Мы видим результат каждой операции во время выполнения бизнес-процесса, а не по его окончанию. Это проявляется как факт того, что деньги уже были списаны с одного счета, но еще не были зачислены на другой. Промежуточная несогласованность данных теперь является явной для всех параллельно идущих бизнес-процессов и для самого клиента.

Можете почитать статью Your Coffee Shop Doesn’t Use Two-Phase Commit за редакцией Мартина Фаулера. Если не согласны со мной и это имя для вас хоть что-то значит.

Написано более трёх лет назад
iMegaMaximus @iMegaMaximus

кто его вообще лайкает?

Написано более трёх лет назад

2 комментария

intnzy @intnzy

Например хранение истории болезни пациентов в масштабе страны. Каждая карточка может быть разного типа со множеством пол

Отличный пример как делать НЕ надо! Раз делается система в масштабе страны - должна быть единая форма медкарты. Вариации - тяжелое наследие раздробленности. Сама по себе карта - довольно незатейливая структура. Там просто не может быть множества полей у записи. А вот связи - да. Реляционная модель туда вписывается как родная.

Написано более трёх лет назад
Philipp @zoonman

intnzy, интересно, в какой такой универсальной форме вы собираетесь хранить данные томографа, кардиографа, УЗИ и тонометра, да так, чтобы их потом можно было обработать?
Приборов существует великое множество, каждый день появляются новые.

Написано более трёх лет назад

1 комментарий

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

MongoDB

Простой
Как получить записей содержащих нужное значение в массиве?
- 1 подписчик
- 18 дек. 2025
- 78 просмотров
1

ответ
Python

+1 ещё

Простой
Как искать primary в реплике Монги?
- 1 подписчик
- более года назад
- 133 просмотра
0

ответов
Python

+2 ещё

Простой
Как использовать pymongo асинхронно?
- 1 подписчик
- более года назад
- 258 просмотров
1

ответ
Node.js

+2 ещё

Средний
Почему иногда отваливается volume в mongo docker compose?
- 4 подписчика
- более года назад
- 347 просмотров
0

ответов
MongoDB

Простой
Как оптимизировать мой запрос mongodb к огромной коллекции?
- 1 подписчик
- более года назад
- 152 просмотра
0

ответов
MongoDB

+1 ещё

Средний
Почему падает Graylog при недоступности одной из нод MongoDB?
- 1 подписчик
- более года назад
- 128 просмотров
1

ответ
MongoDB

Простой
Как ограничить подключение к MongoDB?
- 1 подписчик
- более года назад
- 126 просмотров
1

ответ
MongoDB

Простой
Что делать, если mongodb обрезает числа?
- 1 подписчик
- более года назад
- 114 просмотров
0

ответов
Python

+1 ещё

Простой
Pymongo как добавлять значение в список и удалять его?
- 1 подписчик
- более года назад
- 148 просмотров
0

ответов
MongoDB

Простой
Почему mongodb_exporter не выдает нужные метрики?
- 1 подписчик
- более года назад
- 59 просмотров
0

ответов
Показать ещё Загружается…

Почти всегда.

Исключения: в тот момент, когда понимаешь что здесь монго точно не подойдёт.
Arti Markelov, сколько больших проектов уже сменили монгу на постгрес?
sim3x, Не слишком хорошо знаком с постгрес, к сожалению.
Arti Markelov,
- я забиваю гвозди микроскопом
- но ведь для этого есть молоток
- не слишком хорошо знаком с молотком, продолжу забивать микроскопом
WayMax, Не самое удачное сравнение. Попробуй рассмотреть бактерии молотком.
Arti Markelov, ну, яндекс диск уже сменил монгу, от которой плевался, на нормальнуюс обьектную СУБД постгрес?

Answer 1 · 2017-11-03 00:03:17

Я расскажу Вам про личный опыт, без претензий на истину в последней инстанции...

Для чего идеальна MongoDb? Примеры приложений, где монга будет лучше mysql?

Для человека который привык работать с реляционными БД, смириться с логикой и вообще с подобными БД - довольно сложно. Для тех, кто работает с реляционными БД профессионально - сделать это ещё сложнее...

Если сравнивать с реляционными БД и с оглядкой на конкретно MySQL - монга идеально вписывается там, где структура данных заранее неизвестна. Тут я хотел привести пример, но не смог придумать ни одного дельного примера, после того как начал плотно работать с PostgreSQL... Давайте попробую из практики. Мы один раз применяли монгу в проекте где есть десятки и сотни тысяч товарных позиций и у каждой из них свой уникальный набор различных свойств. На основе уже имеющихся свойств, "соседних" товаров, контентщику предлагался наиболее вероятный набор параметров, которые нужно заполнить, но в любой момент он мог удалить или добавить любое поле и/или множество значений одного из них, например, "Цвет: черный, серый, фиолетовый". Всё это дело попадало под разные динамические фильтры и далее по цепочке... В то время, насколько я помню ещё не было поддержки JSONB-формата у PostgreSQL, по этому мы остановились на MongoDB. Ну и конечно же, желание "воткнуть ультра новую и модную БД в проект" сыграло свою роль...

Что в монге определённо не нравится (и это не моя "идея", об этом пишут даже в учебниках под монге) - это тотальная денормализация данных. Которая в некоторых случаях может сыграть злую шутку. Например, все комментарии "поста" обычно хранятся прямо в самой сущности поста. Это очень удобно и довольно быстро работает, но... иногда это приводит к полному коллапсу. Особенно, когда у Вас перекрестная ссылочность.

Безусловно, не редко можно встретить проекты в которых даже в реляционных БД не прописаны, например, внешние ключи и контроля целостности данных как такового нет, но обычно это происходит по следующим причинам:
1. Очень низкая квалификация администратора БД проекта
2. В попытке выжать из базы больше производительности, не найдя других методов оптимизации
3. Данных настолько много, что БД/ключи - начинают "сыпаться", не редко это связано с п.1

Так же, последние тесты показывают, что PostgreSQL почти не уступает MongoDB даже в её родной среде (на уровне данных в формате JSON). А в некоторых аспектах даже превосходит её... Подробности Вы можете увидеть на некоторых конференциях по Postgres (да, на конференциях по MongoDB, Вы вряд ли увидите, как кто-то будет рассказывать, что [их любимая] монга "хуже" некоторых других движков...). Кстати, поддержку формата JSON стандартизировали (наконец-то) на уровне SQL-стандарта (если я не ошибаюсь) и в самом ближайшем будущем, думаю стоит ожидать полноценную поддержку оного в SQL-базах, в т.ч. поддержку в бинарном виде с возможностью индексации данных (кстати, некоторые SQL-базы уже такое умеют).

Моё понимание, ответа на вопрос, "когда действительно стоит использовать MogoDB?" звучит примерно так: Исключительно в тех случаях, когда Вы понимаете, что она станет действительно хорошим решением для поставленной задачи и сейчас и в будущем. В моей практике, таких проектов можно было бы насчитать ничтожно мало, а точнее около нуля, особенно с учётом развития некоторых современных SQL-БД и вообще направления "JSON в SQL" в целом. Но, безусловно такие проекты могут быть и есть (в данном случае, не у меня). Но, тут стоит обратить внимание на крайне важный факт - когда всплывает такой проект, что бы адекватно оценить наиболее оптимальную БД под него - нужно знать как минимум пару-тройку SQL-БД, со всеми их особенностями, достоинствами и недостатками... причем не просто "знать", а хорошо знать, "изнутри". А так же знать все характерные черты монги, а так же её особенности, достоинства и т.д. То есть, если Вы задаётесь вопросом, "а хорошо ли впишется монга в проект N?" и не можете найти на него однозначного ответа, вероятнее всего, что в долгосрочной перспективе, в "проект N" она впишется плохо.

P.S. В заключение, хочу ещё раз напомнить, что "JSON в SQL" - активно развивается... Со всеми вытекающими.

Answer 2 · 2017-11-03 03:26:50

Высокопроизводительные распределенные интернет-приложения. Конкретные примеры: amazon.com, netflix.com, ebay.com. NoSQL движение возникло как ответ на проблемы масштабируемости. Реляционные базы ориентируются на требования ACID и как следствие имеют проблемы с горизонтальным масштабированием. Для таких баз необходимо реализовывать шардинг на уровне приложения. Но тогда будет необходимо отказаться от ACID, объединения таблиц и контроля целостности. В таком случае реляционная база теряет все козыри перед NoSQL. Но оставляет на плечах разработчика заботу о шардинге.

Интернет забит вопросами о том как жить без транзакций в NoSQL. Но бизнес-процессы в реальной жизни не являются транзакционными. Вы не можете человека, который покушал в вашем ресторане, а теперь отказывается платить по счетам заставить сделать роллбек вашей еды. Фактически посетитель вам бросил эксепшен. И даже если вам удастся извлечь еду из вашего посетителя, то маловероятно, что она будет готова к последующему употреблению. Но можно взыскать с него все затраты через суд и придти таким образом в согласованное состояние. Любому бизнесмену это очевидно. Но программисту нет. Он хочет транзакционно. Но пишет систему для автоматизации бизнес-процессов. Парадокс.

Answer 3 · 2017-11-03 16:13:40

Я работаю с MongoDB на протяжении уже 4х лет. Имеется ряд проектов, созданных как с использованием этой БД, так и использованием классических RDBMS.
MongoDB это не MySQL и не PostgreSQL. Большинство людей пытается сравнить оба типа баз данных, но это абсолютно глупо и неприемлемо. Это все равно что сравнивать врачей и инженеров.
MongoDB подойдет там, где нужна гибкость структуры и большие объемы данных. Например хранение истории болезни пациентов в масштабе страны. Каждая карточка может быть разного типа со множеством полей. И их могут быть триллионы. Для классических реляционных БД это выливается в весьма нетривиальную задачу горизонтального масштабирования, которая в MySQL решается через перенастройку сервера, а в PostgreSQL через специальную промежуточную таблицу. Горизонтальный рост и ввод новых узлов кластера сопряжен с большими трудностями и плохо автоматизируется для реляционных БД.
Еще классические БД очень плохо работают со смешанной нагрузкой, когда у вас запись/чтение примерно 1:1 и данных очень много. Это вызывает непрерывное перестроение индексов и их использование больше мешает. Это тот тип нагрузки, при которой InnoDB частенько повреждается без возможности восстановления или что вызывает значительный простой на реорганизацию структур данных.
Также существует очень много задач, для которых использование MongoDB исключительно неприемлемо. Если вам необходимо работать с нормализованными данными - используйте реляционные БД. Если нужна мощная аналитика - колоночные. Разумеется, каждая из этих опций имеет свою цену.
На рынке нет универсального решения. Каждое заточено под свои задачи.

Answer 4 · 2017-11-03 14:03:33

MongoDB и MySQL - разные вещи.
MySQL служит для хранения связанных данных, контроля их целостности и манипуляции с ними, а Mongo хранит документы, которые по-сути никак не зависят от других документов, но к ним осуществляется быстрый доступ. Надо быстро отображать данные на сайте не собирая их все по куче таблиц - используйте Mongo, нужна операция с данными и бизнес-логикой - используйте MySQL.
Альтернативный вариант - всё хранить в MySQL, а данные на сайт выводить с Mongo, периодически производя выгрузку из Мускула в Монгу.

Answer 5 · 2017-11-03 00:42:34

Была у меня задача где монга с шардингом подошла идеально - сбор и архивирование логов действий пользователей. Были десятки миллионов действий в день. Тут понадобилась и гибкая структура и легкий шардинг на запись. Шардили коллекции по дате записи. TTL не использовали.

Answer 6 · 2017-11-03 02:12:16

Её можно применить там где не нужны транзакции, либо простые "транзакции" (микросервисы, веб).

Табличные БД не оптимальны, их приходится использовать т.к. новые инстументы не достаточно развиты, с другой стороны некоторые новые инстументы предлагают продвинутые подходы.

Answer 7 · 2017-11-09 08:24:16

MongoDB (NoSQL) - лучше всего подходит для _быстрого_ развёртывания проекта, у которого структура объектов до конца не определена. Не подходит, если _очень_ _много_ аггрегирующих операций или статистических срезов. Монго может, но она не для этого.

Если вам надо хранить отношение объект<=>документ в БД. (Ограничения 10МБ на один документ). На Хабре где-то есть пост про соц.сеть и как они попробовали там использовать NoSQL - при прочтение становится понятнее, что к чему.

Быстр для фильтрации по рейнджу, после того, как БД попадёт в память (после первого запроса), на некоторых _фильтрующих_ выборках становится быстрее даже Redis.
Если надо гонять JSON объекты (но сейчас и PostgreSQL говорят, что хорош).

SQL - если подготовке проекта предшествовала фаза проектирования, там где надо много статистики и аггрегации. Если вам надо объекты постепенно расширять связями (JOIN).
Одним словом - классика

Для чего идеальна MongoDb? Примеры приложений, где монга будет лучше mysql?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт