Стоит ли использовать Mongo?

Question

Chvanikoff @Chvanikoff

Стоит ли использовать Mongo?

Приветствую!

В последнее время все чаще слышу упоминания про NoSQL и MongoDB в частности. Тема меня заинтересовала, но вот пока не могу найти интересующей меня информации, поэтому спрошу здесь — наверняка уже многие успели поэкспериментировать, а может и разработать серьезные высоконагруженные приложения в связке с MongoDB.
Заранее предупрежу, если где-то я ошибся в отношении MongoDB — я не специально. Просто я с ней еще даже не пытался работать, а лишь почитывал статьи на Хабре, да те примеры, что лежат на оф.сайте.

Сейчас я занимаюсь разработкой тизерной сети. Задача, на первый взгляд кажущаяся тривиальной, на деле выходит довольно хитровыделанной в плане организации структуры БД. Огромное кол-во связей, множество таблиц-посредников для связей М-М и т.д… Чем меня привлекла идея MongoDB, так это своим принципом построения связей. Вопрос №1:
действительно ли работа с МонгоБД при наличии кучи связей менее затратна в плане ресурсов? Ну, хотя бы на простейшем примере (буду писать на «псевдо SQL») — выборка из 2 таблиц, связанных отношением М-М через промежуточную таблицу:
table sites(
id int primary key auto_increment,
url varchar
)

table categories(
id int primary key auto_increment,
name varchar
)

table sites_categories(
site_id int,
category_id int
)

Задача вывести список сайтов и категорий, в которых он есть:

SELECT * FROM sites

while(SITE = mysql_result...)
{
//отображаем данные сайта
SELECT * FROM categories WHERE id IN (SELECT category_id FROM sites_categories WHERE site_id = SITE)
//в цикле отображаем категории
}

Также меня интересует, можно ли работать одновременно с MySQL и MongoDB? Вернее, насколько это будет правильно? Полностью переносить БД на Монго не хочется, лишь отдельные, особо-хитрые участки, нагрузка на которых выше, чем хочется.

Также читал, что в MongoDB можно беспроблемно хранить файлы — действительно ли это так и что же будет лучше — хранить по-старинке в специальной папке с подкаталогами по именам/ид пользователей, или использовать MongoDB? (допустим, при таком раскладе: пользователей около 1к, у каждого 40-50 небольших картинок. картинки отдаются в кол-ве примерно 100-150 в минуту.

P.S.: прошу прощения за возможные неточности в вопросах, излишнюю или недосказанную информацию о нуждах и текущем положении дел, разработка структур БД — не мое основное достоинство…

Вопрос задан более трёх лет назад
5948 просмотров

Комментировать

Подписаться 8 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 6

5 комментариев

Vlad911 @Vlad911

Может быть надежда на репликацию? Тогда JOIN нельзя юзать.

Написано более трёх лет назад
Chvanikoff @Chvanikoff Автор вопроса

это псевдо-sql, я же написал :)
Просто с Join'ами я не очень хорошо до сих пор разбираюсь, если без манов под рукой, поэтому так и написал, чтобы просто суть донести :)

Написано более трёх лет назад
professor_kuvalda @professor_kuvalda

> Просто с Join'ами я не очень хорошо до сих пор разбираюсь

отличный подход: с join'ами не разбираюсь, так разберусь тогда с mongodb.

Написано более трёх лет назад
Chvanikoff @Chvanikoff Автор вопроса

Разбираюсь, хоть и не так хорошо и быстро, как хотелось бы.
А какая связь между моим пониманием JOIN'ов и желанием попробовать MongoDB?

Написано более трёх лет назад
professor_kuvalda @professor_kuvalda

никакой, по-ходу
я тупость написал

Написано более трёх лет назад

Комментировать

2 комментария

Chvanikoff @Chvanikoff Автор вопроса

так ведь М-М это две 1-М… Почему же такая разница?

Написано более трёх лет назад
Владимир Чернышев @VolCh

Mongo эффективен, когда один объект (или массив объектов) можно вложить в другой и первый без второго не имеет никакого смысла. Примеры — профиль в учётной записи, комменты к постам, адреса и телефоны в адресной книги. В таком случае связанные данные хранятся вместе и осуществляется, грубо говоря, одна операция поиска по идентификатору («первичному ключу») и получения объекта (с разной глубиной вложенности в зависимости от цели запроса) — эффективность можно сравнивать с денормализованной РСУБД. Если же используются ссылки («внешние ключи»), то таких операций нужно производить несколько — по сути от JOIN ничем не отличается. Хотя, конечно, можно денормализовать и Mongo базу или использовать для вашего примера в качестве «первичного ключа» категорий их название, а в качестве первичного ключа сайтов их урлы (тогда типичные задачи «вывод деталей сайта и названия его категорий» и «вывод деталей категории и урлы входящих в неё сайтов» будут осуществляться за одну операцию)

Написано более трёх лет назад

Комментировать

2 комментария

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

MySQL

Простой
Почему у некоторых таблиц Update_time равен null?
- 1 подписчик
- 20 авг.
- 76 просмотров
2

ответа
Python

+1 ещё

Простой
Как создать параметризированный SQL запрос через pyodbc к Mysql?
- нет подписчиков
- 16 авг.
- 147 просмотров
2

ответа
Python

+1 ещё

Простой
Как сделать экранирование символов в Python для SQL запроса?
- 1 подписчик
- 16 авг.
- 146 просмотров
1

ответ
MySQL

Простой
Как свзять столбцы по внешнему ключу?
- 1 подписчик
- 06 авг.
- 110 просмотров
1

ответ
MySQL

Простой
Как подсчитать количество строк в sql запросе?
- 1 подписчик
- 05 авг.
- 226 просмотров
1

ответ
PHP

+2 ещё

Средний
Как одновременно сделать две записи в разных таблицах в Laravel?
- 1 подписчик
- 27 июл.
- 264 просмотра
1

ответ
JavaScript

+3 ещё

Простой
Почему при отправке HTML-формы данные не поступают в mysql?
- 1 подписчик
- 25 июл.
- 294 просмотра
1

ответ
Linux

+2 ещё

Простой
Как запустить mysql после ошибки?
- 1 подписчик
- 22 июл.
- 179 просмотров
3

ответа
MySQL

Простой
Какое отставание MySQL Slave от MySQL master считать проблемным?
- 1 подписчик
- 21 июл.
- 172 просмотра
2

ответа
MySQL

Простой
MYSQL --skip-grant-tables?
- 1 подписчик
- 04 июл.
- 94 просмотра
1

ответ
Показать ещё Загружается…

Nest.js разработчик

Qtim

от 100 000 до 180 000 ₽

DBA в команду базовой инфраструктуры

SMALL

от 2 000 до 4 500 $

Инженер технической поддержки

Fornex • Москва

от 90 000 ₽

Answer 1 · 2010-10-17 00:43:08

Извиняюсь за оффтоп, но в ваших примерах вроде
SELECT * FROM categories WHERE id IN (SELECT category_id FROM sites_categories WHERE site_id = SITE)
JOIN принципиально не используется???

А картинки попробуйте на Amazon хранить

Answer 2 · 2010-10-17 01:00:12

Будьте внимательны! Принципы построения БД в Mongo другие. Нужно понимать, как она хранит объекты и что загружает объект целиком.

Answer 3 · 2010-10-17 02:22:29

Вообще, имхо, связи многие-ко-многим не являются сильной стороной Mongo (да и других NoSQL БД, с которыми знаком). Наиболее эффективно они работают со встроенными объектами, то есть связями один-к-одному и односторонними один-ко-многим.

Answer 4 · 2010-10-17 03:21:05

Для монго каждый сайт должен включать в себя есть category_id с перечислением категории. То есть, для nosql связь много-ко-многим реализуется хранением в одном из объектов полного перечисления отношений ко второму.

Answer 5 · 2010-10-17 05:37:28

Для начала ознакомьтесь с документом www.mongodb.org/pages/viewpage.action?pageId=5079114

Вот пример как это может выглядеть
pastie.org/1226804

И запрос например получить все тизеры для Москвы где еще остались клики, к примеру больше 10
pastie.org/1226857

Относительно надежности и скорости, честно хз, еще не экспериментировал глобально, тут вам придется самостоятельно провести изыскания, одно могу сказать, скорость внедрения и расширения радует :)

Answer 6 · 2010-10-17 13:53:24

Снова оффтопик:
Вообще я дорабатывал тизерную сеть одну… Там нет таргетинга но нормально отрабатывало около 90 млн показов тизеров в сутки (сейчас обороты спали примерно до 50 млн). Все это крутится на одном единственном довольно мощном сервере (и второй сервер — только картинки).
Там все данные о тизерах, забаненных айпишниках, ценой за показ/клик забираются из мемкеша. Если в мемкеше каких то данных почему-то нет (Eviction например или холодный старт), то только тогда забирается из БД и кладется сразу обратно в мемкеш. Статистика за последнюю минуту тоже кладется в мемкеш и раз в минуту данные из него собираются, обсчитываются и обобщенная статистика кладется в MySQL. Т.е. фактически для открутки тизеров БД вообще не трогается.
(До мемкеша вообще использовали файловую систему для этих данных — летало почти так же как на мемкеше)

Но вам может не подойти потому что не представляю толком как там можно таргетинг реализовать.

Стоит ли использовать Mongo?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт