Комментарии пользователя imaginationunicorn

Задать вопрос

Комментарии

Как организовать пагинацию, если БД и поисковая машина - это раздельные сервисы?

imaginationunicorn @imaginationunicorn Автор вопроса

Boris Korobkov, на данный момент атрибутов 43 (из них 14 MVA с кол-вом внутри до 110) - и уже проверено, что полнотекстовый индекс (он, кстати, достаточно слабый - индексируются слова без словоформ и большим количеством стоп-слов) с атрибутами и без них различаются по объему на 63%. Не удвоенние, но ощутимо.

Однако я так понял, что вариант здесь только один (предложенный вами) и других решений попросту пока не существует.

Единственная реальная проблема - это обновление данных в этом индексе (обновлений много и они регулярные). Оно попросту не успевает выполняться, 16 воркеров на сервере с 24 ядрами отведены сфинксу - и все равно не успевает. Пересматриваем архитектуру, важность некоторых атрибутов, но все равно пока что слабо работает поиск.

Написано более трёх лет назад
Как организовать пагинацию, если БД и поисковая машина - это раздельные сервисы?

imaginationunicorn @imaginationunicorn Автор вопроса

В тексте вопроса указано, что поисковая машина справляется куда медленнее с фильтрацией по атрибутам, поскольку они хранятся в индексе поисковой машины неиндексированными. Все, для чего годится информация в индексе поисковой машины - добавочные фасеточные запросы. Плюс требуется содержать полную копию данных в индексе поисковой машины, по которым требуется фильтрация и сортировка - а это банальное удвоение занимаемого места на жестком диске / SSD (при 100 миллионах документов это очень ощутимые объемы).

Еще один крайне неприятный момент - это чрезвычайно медленный UPDATE в real-time индексе SPHINX'a / Manticore - от 0.06 до 0.25 с на одну строчку (это даже если просто меняется значение одного атрибута). Поддерживать строки в индексе поисковой машины в актуальном состоянии становится проблематичным (а обновления частые)

Написано более трёх лет назад

Самые активные сегодня

Пума Тайланд
- 3 ответа
- 0 вопросов
zyyxell
- 1 ответ
- 1 вопрос
vitz84
- 0 ответов
- 1 вопрос
Юрий
- 0 ответов
- 1 вопрос
Luchiano
- 1 ответ
- 0 вопросов
VoidVolker
- 1 ответ
- 0 вопросов

Как организовать пагинацию, если БД и поисковая машина - это раздельные сервисы?

Как организовать пагинацию, если БД и поисковая машина - это раздельные сервисы?

Войдите на сайт