bit
@bit

Структуры данных Sphinx & Lucene

Добрый день.
Не поделится ли кто сокровенным знанием? :)
Нужны структуры данных индексных файлов поисковиков Sphinx, Lucene. Если есть аналогичная информация по другим — тоже не откажусь, если движок достаточно шустрый. Поставленная перед собой задача — понять механизм наполнения поисковых баз и поиска по ним. Хотелось бы избежать нудного и неблагодарного кодокопательства.
Общая файловая структура Lucene описывается, но очень общая, хотелось бы поподробней.
  • Вопрос задан
  • 2854 просмотра
Пригласить эксперта
Ответы на вопрос 2
philpirj
@philpirj
Посмотрите на Riak Search, он отчасти совместим с Solr, а данные можно посмотреть в виде пары ключ-значение.
Ответ написан
Sphinx — open-source, соответственно любые нюансы, которые вас интересуют, вы можете посмотреть напрямую в исходниках:
code.google.com/p/sphinxsearch/source/browse

Internal index format вроде как раз то, что вам надо:
code.google.com/p/sphinxsearch/source/browse/trunk/doc/internals-index-format.txt
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы