Брать ли mongodb для нового проекта?

Question

Александр Дементеев @progressor0

Брать ли mongodb для нового проекта?

Всем привет. Мы разрабатываем сервис - типа сбор и последующий анализ статистических данных. Выбираем базу и есть сомнения.

Думаю про mongo:
Есть коллекция с проектами. С определенной периодичностью по каждому проекту собираются данные и вносятся в другую коллекцию: одна запись за каждый день. Внутри такой записи вложен набор всяких разных характеристик. Вот с этими характеристиками и работает конечный пользователь.

Получается логика работы с mongo: чтобы выбрать данные для последующей обработки и вывода пользователю (графики, анализ) нужно сделать так:
1. Выбрать проект по ID - по-идее должно происходить очень быстро, чтобы проверить права доступа к проекту, какие-то настройки, плюс там хранятся категории данные к которым будут выбраны на шаге 2.
2. Выбрать записи данных по проекту за определенный период, сгруппировав их по категориям (ну т.е. пройтись по всем категориям и выбрать для каждой данные за период) - тут вроде бы тоже нормально должно быть.
3. Дальше обработка данных происходит внутри скрипта и довольно шустро.
На почти пустой базе весь этот цикл занимает 22-35 мс

Если делать то же самое на MySQL смысл остается таким же, но приходится использовать join'ы и большее количество запросов, что увеличивает время работы до 57-76 мс.

Сбор статистики в первый год прогнозируется такой: около 1 000 000 операций вставок и обновлений в сутки, т.е. ~12 запросов в секунду. Чтений - больше.

Вот и думаю. С одной стороны скорость, конечно, подкупает да и mongo все же "повзрослел" и многие косяки первых версий сейчас вроде бы как ушли. Хотя дело не только в скорости, но и в логичности. Например, не планируются какие-то страшные выборки на стороне базы - в основном, вся логика забита в скрипты. Опять же понравилось работать с документом, а не с данными. С другой стороны в mongo есть очень много отрицательных или просто не вполне понятных моментов - потери данных, блокировки на всю базу. С традиционным MySQL чувствуешь себя уверенно.

В общем, хочется узнать мнение людей, которые уже испытали на себе работу с mongo в серьезных проектах. Насколько сложно потом будет расширяться, насколько вероятна потеря данных (кстати говоря, так и не понял при каких обстоятельствах они могут потеряться), какие вообще еще есть подводные камни? Взяли бы вы его второй раз в работу для тех же целей, или стали бы работать старым-добрым способом?

Спасибо, что дочитали.

Вопрос задан более трёх лет назад
3646 просмотров

Комментировать

Подписаться 4 Оценить Комментировать

Решения вопроса 2

1 комментарий

2 комментария

Пригласить эксперта

Ответы на вопрос 3

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

MySQL

Простой
Почему у некоторых таблиц Update_time равен null?
- 1 подписчик
- 4 часа назад
- 44 просмотра
2

ответа
Python

+1 ещё

Простой
Как создать параметризированный SQL запрос через pyodbc к Mysql?
- нет подписчиков
- 16 авг.
- 132 просмотра
2

ответа
Python

+1 ещё

Простой
Как сделать экранирование символов в Python для SQL запроса?
- 1 подписчик
- 16 авг.
- 132 просмотра
1

ответ
MySQL

Простой
Какой установщик MySQL использовать?
- 1 подписчик
- 12 авг.
- 194 просмотра
4

ответа
MySQL

Простой
Как свзять столбцы по внешнему ключу?
- 1 подписчик
- 06 авг.
- 109 просмотров
1

ответ
MySQL

Простой
Как подсчитать количество строк в sql запросе?
- 1 подписчик
- 05 авг.
- 223 просмотра
1

ответ
PHP

+2 ещё

Средний
Как одновременно сделать две записи в разных таблицах в Laravel?
- 1 подписчик
- 27 июл.
- 260 просмотров
1

ответ
JavaScript

+3 ещё

Простой
Почему при отправке HTML-формы данные не поступают в mysql?
- 1 подписчик
- 25 июл.
- 292 просмотра
1

ответ
Linux

+2 ещё

Простой
Как запустить mysql после ошибки?
- 1 подписчик
- 22 июл.
- 178 просмотров
3

ответа
MySQL

Простой
Какое отставание MySQL Slave от MySQL master считать проблемным?
- 1 подписчик
- 21 июл.
- 171 просмотр
2

ответа
Показать ещё Загружается…

Nest.js разработчик

Qtim

от 100 000 до 180 000 ₽

DBA в команду базовой инфраструктуры

SMALL

от 2 000 до 4 500 $

PHP-разработчик

Wanted

До 300 000 ₽

Answer 1 · 2014-02-25 01:12:34

Возьмите лучше Postgres.
Он умеет JSON-поля из коробки (9.2) и запросы по JSON-полям (9.3).

Да, он чуть медленнее MySQL, но они оба быстрее Монги - залейте внутрь хотя бы 10М рандомных записей и убедитесь сами.
Да, кластер будет построить немного сложнее, но это вполне по силам разработчику, потратившему день на чтение документации.

И не будет, в отличие от Монги, ограничения в один поток на запись. Это в Монге так и не починили и похоже никогда не починят. (Очень обидно было наткнуться на это при росте проекта, когда база данных просто не успевала прожевать записи и зависала). Не будет загадочной добавки в 100 миллисекунд к любому запросу от mongos при шардировании.
Кроме того, в MongoDB неудобная агрегация - фактически приходится руками писать план выполнения запроса, с классическим SQL же всё более или менее просто и понятно.

Для совсем-совсем больших объемов статистики, по которым нужно будет делать аналитику, рекомендую рассмотреть колоночные базы данных, некоторые показали себя очень хорошо.

Answer 2 · 2014-03-21 00:39:39

> потери данных
Какая может быть потеря данных когда есть реплика?

> блокировки на всю базу.
Конечно это звучит не очень хорошо, но на зарубежных форумах пишут, что в первую очередь система упирается в io, на фоне чего локи выглядят не существенно (т.е. долгие локи как раз возникают из-за io)

Вчера делал примитивное тестирование локов у себя на ноутбуке: из питона делал insert документов, вышло 12k документов в сек, mongostat показывал 20% lock при этом запросы на чтение выполнялись без задержек. На сервере показатели должны быть лучше.

Answer 3 · 2014-02-19 09:57:50

Если я правильно понял, то по факту это time-series data, но структуру данных представляет собой своего рода дерево, и нотацию можно представить в виде
Domain.Group.Entity.Properties, и вам нужно иметь возможность группировать по каждому из узлов.
Может тогда посмотреть на специализированные решения вроде influxdb.org ?

Answer 4 · 2014-02-19 11:54:31

MongoDB вполне можно использовать. Я для схожей задачи в текущем проекте её взял и пока не жалуюсь. Тоже сбор и обработка статистики различной. Из удобного - некоторые выборки/аггрегации вынес в серверный js, который в самой монго, ну типа хранимых процедур. Соотв. в коде приложения вызовы стали проще. Пока что крутится в тестовом режиме, но форсмажоров и потерь пока небыло. Но стоит помнить про правильную репликацию. Блокировки на базу как-то особо пока не мешают, но и 10gen обещаются скоро сделать их на уровне коллекций.

Answer 5 · 2014-02-20 01:31:09

grossws @grossws

На тему негарантированной записи -- docs.mongodb.org/manual/core/write-concern

Ответ написан более трёх лет назад

Комментировать

Брать ли mongodb для нового проекта?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт