Задать вопрос
bit
@bit

Структуры данных Sphinx & Lucene

Добрый день.
Не поделится ли кто сокровенным знанием? :)
Нужны структуры данных индексных файлов поисковиков Sphinx, Lucene. Если есть аналогичная информация по другим — тоже не откажусь, если движок достаточно шустрый. Поставленная перед собой задача — понять механизм наполнения поисковых баз и поиска по ним. Хотелось бы избежать нудного и неблагодарного кодокопательства.
Общая файловая структура Lucene описывается, но очень общая, хотелось бы поподробней.
  • Вопрос задан
  • 2855 просмотров
Подписаться 2 Оценить 1 комментарий
Помогут разобраться в теме Все курсы
  • Яндекс Практикум
    Python-разработчик
    10 месяцев
    Далее
  • Skillbox
    1C-разработчик
    8 месяцев
    Далее
  • Нетология
    Python-разработчик с нуля
    6 месяцев
    Далее
Пригласить эксперта
Ответы на вопрос 2
philpirj
@philpirj
Посмотрите на Riak Search, он отчасти совместим с Solr, а данные можно посмотреть в виде пары ключ-значение.
Ответ написан
Sphinx — open-source, соответственно любые нюансы, которые вас интересуют, вы можете посмотреть напрямую в исходниках:
code.google.com/p/sphinxsearch/source/browse

Internal index format вроде как раз то, что вам надо:
code.google.com/p/sphinxsearch/source/browse/trunk/doc/internals-index-format.txt
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы