Есть ли у кого опыт использования Apache Lucene в качестве основного провайдера данных?
Всем привет.
Прикрутили мы значит Apache Lucene к приложению. Используем его для полнотекстового поиска по системе. Ну знаете, это как тот инпут вверху "Найти вопрос, ответ, тег или пользователя". И тут возник вопрос, а можно ли использовать Apache Lucene в качестве основного источника данных? Т.е. не ходить в БД за данными, от слова совсем. Приложение из области "кровавого ынтэрпрайза" - СЭД. Данных становится все больше, выборки становятся все медленнее. Понятно, что можно оптимизировать запросы, оптимизировать саму СУБД. Но ведь Lucene не плохо справляется с задачей быстрого доступа к данным по заданным критериям.
Собственно хотелось бы услышать советы по использованию (или не использованию) Lucene, или аналогичного движка, в качестве основного источника данных приложения.
Имел опыт с elasticsearch, но не в качестве основного хранилища.
Смежная команда использовала в качестве основного, далее с их слов (за что купил, за то продаю).
Опыт был скорее негативным. Были проблемы с надежностью, бэкапами и пр. Данные денормализованы, если что не так - будет большая проблема скорректировать. Пару раз индексы ломались. В случае с традицонной РСУБД в качестве основного хранилища, пришлось бы просто запустить реиндекс. А тут полная, извините, задница. Больше они так не делают.
Я понимаю, что прошло много времени, но Elasticsearch использует движок Apache Lucene и имеет дополнительные слои поверх него, поэтому некорректно отвечать на заданный вопрос.
Кроме того, мы не знаем какие практики использовались при работе с Elasticsearch и насколько они являются правильными.