Добрый день.
Не поделится ли кто сокровенным знанием? :)
Нужны структуры данных индексных файлов поисковиков Sphinx, Lucene. Если есть аналогичная информация по другим — тоже не откажусь, если движок достаточно шустрый. Поставленная перед собой задача — понять механизм наполнения поисковых баз и поиска по ним. Хотелось бы избежать нудного и неблагодарного кодокопательства.
Общая файловая структура Lucene описывается, но очень общая, хотелось бы поподробней.
Меня интересует не факт установки и настройки какого-либо поисковика, а внутренние схемы работы. Общие принципы общеизвестны, но «дьявол кроется в деталях» — вот в этих деталях и хотелось бы разобраться. НА данном этапе это скорее академический интерес, чем практический.