Посоветуйте решение для полнотекстового поисковика

Возникла идея сайта, на котором должен быть реализован полнотекстовый поиск и вывод фрагмента текста с подсветкой найденных слов. Размер текста после форматирования в txt — 500-1500 кб. Общий объем текста около 20 Гб. Поддержка высоких нагрузок. Возможно подскажите готовое решение, или на чем должен быть написан код и какую базу данных лучше выбрать?
  • Вопрос задан
  • 3564 просмотра
Пригласить эксперта
Ответы на вопрос 2
Комментировать
@Spamkit
Посмотрите Solr. Lucene стала частью проекта Solr. Рекомендую пролистать Apache Solr Cookbook (вот туточки описание книги http://www.packtpub.com/solr-3-1-enterprise-search-server-cookbook/book). Из бесплатного: https://people.apache.org/~hossman/apachecon2008us/ootb/apache-solr-out-of-the-box.pdf

Почему Solr, а не Sphinx: по моему личному субьективному мнению Solr изначально куда более гибок и кросс-платформен за счет Java.

С уважением,

С
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы