Добрый день.
До того момента как выйдет sphinx 3.0, единственный метод связать sphinx и mongo это xmlpipe Вопрос в том, насколько это надежное и производительное решение на 100Gb+ данных?
В базе хранится информация состоящая из Ид+текста.
+ у текстов могут быть переменные характеристики... ссылки, картинки(url), различные примечания.
В принципе заранее можно предположить какие вообще возможны аттрибуты у текстов и запихнуть все это в формат одной или связанных таблиц.... Возможно стоит отказаться от mongo в пользу pg или mysql-hs ?
да. не совсем я верную метрику назвал. 10кк текстов.
Полностью переиндексировать нужды нет.... база текстов пополняется, нужно добавлять новые тексты в индекс. Периодически извне приходят запросы к БД(не через сфинкс) на выборку одного или группы текстов.
Вобщем xmlpipe2 нормально работает со стороны сфинкса, но тут сильно зависит от того на чем вы бутете релизовывать и какое количество документов вам надо индексировать. У меня ежедневно индексируются 6 миллионов книг, правда, в индекс отправляется только частить информации (название, автор). Реализовано на С++, работает за пару минут.
Это как? sphinxQL это интерфейс доступа к сформированному индексу. Обсуждается метод загрузки данных из базы в индекс(формирование индекса).... может я не знаю чего-то?
Возможно кстати и не нужно делать импорт mongo->sphinx. А сделать RT-index и дублировать запросы. При заполнении данных заполнять параллельно RT и mongo.... Вопрос тут будет только в регенерации индекса при его повреждении....