MongoDB + Sphinx + 100Gb стоит ли?

Question

Multigame @Multigame

MongoDB + Sphinx + 100Gb стоит ли?

Добрый день.
До того момента как выйдет sphinx 3.0, единственный метод связать sphinx и mongo это xmlpipe
Вопрос в том, насколько это надежное и производительное решение на 100Gb+ данных?

В базе хранится информация состоящая из Ид+текста.
+ у текстов могут быть переменные характеристики... ссылки, картинки(url), различные примечания.
В принципе заранее можно предположить какие вообще возможны аттрибуты у текстов и запихнуть все это в формат одной или связанных таблиц....
Возможно стоит отказаться от mongo в пользу pg или mysql-hs ?

Вопрос задан более трёх лет назад
1154 просмотра

3 комментария

Подписаться 3 Сложный 3 комментария

un1t @un1t

100ГБ это в монге или где? Я так понимюа надо полостью переиндексировать? Как часто?

Написано более трёх лет назад
Multigame @Multigame Автор вопроса

да. не совсем я верную метрику назвал. 10кк текстов.
Полностью переиндексировать нужды нет.... база текстов пополняется, нужно добавлять новые тексты в индекс. Периодически извне приходят запросы к БД(не через сфинкс) на выборку одного или группы текстов.

Написано более трёх лет назад
un1t @un1t

Вобщем xmlpipe2 нормально работает со стороны сфинкса, но тут сильно зависит от того на чем вы бутете релизовывать и какое количество документов вам надо индексировать. У меня ежедневно индексируются 6 миллионов книг, правда, в индекс отправляется только частить информации (название, автор). Реализовано на С++, работает за пару минут.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Merion Academy

MongoDB для разработчиков и DevOps

4 месяца

Далее
Нетология

Разработчик на Python совместно с МФТИ

7 месяцев

Далее
Академия Эдюсон

FullStack-разработчик: тариф PRO

14 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 3

2 комментария

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+1 ещё

Простой
Как работать с Manticore Search на php?
- 1 подписчик
- 29 апр.
- 163 просмотра
1

ответ
MongoDB

Простой
Как получить записей содержащих нужное значение в массиве?
- 1 подписчик
- 18 дек. 2025
- 73 просмотра
1

ответ
Sphinx

Простой
Возможно ли настроить wordforms в Manticore с добавлением нескольких синонимов к указанному слову, а не только один?
- 1 подписчик
- 06 окт. 2025
- 84 просмотра
1

ответ
Sphinx

+1 ещё

Простой
Не ставится Sphinx в виртуальной машине Bitrix 7.5.5?
- 1 подписчик
- 14 авг. 2025
- 67 просмотров
0

ответов
Python

+1 ещё

Простой
Как искать primary в реплике Монги?
- 1 подписчик
- 28 июн. 2025
- 126 просмотров
0

ответов
Python

+2 ещё

Простой
Как использовать pymongo асинхронно?
- 1 подписчик
- более года назад
- 252 просмотра
1

ответ
Node.js

+2 ещё

Средний
Почему иногда отваливается volume в mongo docker compose?
- 4 подписчика
- более года назад
- 341 просмотр
0

ответов
Sphinx

Средний
Как указать --skip-ssl в конфиге manticore?
- 3 подписчика
- более года назад
- 369 просмотров
1

ответ
MongoDB

Простой
Как оптимизировать мой запрос mongodb к огромной коллекции?
- 1 подписчик
- более года назад
- 146 просмотров
0

ответов
MongoDB

+1 ещё

Средний
Почему падает Graylog при недоступности одной из нод MongoDB?
- 1 подписчик
- более года назад
- 123 просмотра
1

ответ
Показать ещё Загружается…

100ГБ это в монге или где? Я так понимюа надо полостью переиндексировать? Как часто?
да. не совсем я верную метрику назвал. 10кк текстов.
Полностью переиндексировать нужды нет.... база текстов пополняется, нужно добавлять новые тексты в индекс. Периодически извне приходят запросы к БД(не через сфинкс) на выборку одного или группы текстов.
Вобщем xmlpipe2 нормально работает со стороны сфинкса, но тут сильно зависит от того на чем вы бутете релизовывать и какое количество документов вам надо индексировать. У меня ежедневно индексируются 6 миллионов книг, правда, в индекс отправляется только частить информации (название, автор). Реализовано на С++, работает за пару минут.

Answer 1 · 2015-05-15 17:06:26

с учетом того что тексты не меняются просто делайте основной индекс и дельта индекс, производительно будет очень сильно.

Answer 2 · 2015-05-15 23:36:51

lega @lega

Почему единственный? Я использую sphinxql.

Ответ написан более трёх лет назад

1 комментарий

Answer 3 · 2015-05-18 12:47:17

Возможно кстати и не нужно делать импорт mongo->sphinx. А сделать RT-index и дублировать запросы. При заполнении данных заполнять параллельно RT и mongo.... Вопрос тут будет только в регенерации индекса при его повреждении....

Или у такого решения есть свои минусы?

MongoDB + Sphinx + 100Gb стоит ли?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт