inlanger
@inlanger
Django программист

Полнотекстовый поиск на mongodb

В официальной документации mongodb есть пример реализации полнотекстового поиска, когда строки разбивают на массив из слов. Но разве это не дублирование данных получается? Плюс у меня данные в базе — полноценные html страницы, которые содержат в себе кучу тегов и другой повторяющейся информации. Может кто-то сталкивался с такой проблемой и может подсказать более изящное решение полнотекстового поиска?
  • Вопрос задан
  • 5054 просмотра
Пригласить эксперта
Ответы на вопрос 4
sajgak
@sajgak
теги это выход в некоторых ситуациях, но точно не в вашей (я не понимаю, зачем в базе хранить полностью отрендеренные страницы, но мы не об этом). В вашем случае подойдет любой поисковый движок. Я юзаю сфинкс и доволен как слон
Ответ написан
DanielWolf
@DanielWolf
Посоветую использовать Solr, как движок поиска
http://lucene.apache.org/solr/
Ответ написан
Комментировать
GearHead
@GearHead
Fullstack разработчик и предприниматель
рещение №1: Solr, Elastic Search и прочие приблуды, основанные на lucene: они в отличие от сфинкса принимают любой формат ID
решение №2: для mongo на разных языках существуют модули прикручивания сфинкса. вы бы уточнили платформу, проще бы было советовать. я к примеру для Ruby on Rails с этой целью свой гем писал.
Ответ написан
Комментировать
un1t
@un1t
Попробуй Sphinx, прикручивается легко. Пример тут
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы