Из статьи Яндекса
habrahabr.ru/company/yandex/blog/204282 взял терминологию "быстрые и медленные факторы ранжирования".
Факторы бывают двух типов: быстрые и медленные. Медленные факторы считаются однократно и присваиваются исключительно документу. Быстрые вычисляются для документа вместе с поисковым запросом.
С медленными факторами все предельно ясно, строим обратный индекс. Все это уже реализовано в Sphinx, ElasticSearch и т.д. А где подробнее узнать о релизации поиска с быстрыми факторами? Или может есть готовые опенсорс реализации алгоритма?
К примеру есть 10М документов и 100K поисковых запросов. Не проблема хранить отдельно обратный индекс для документов и отдельно понижающие/повышающие коэффициенты для связки запрос-документ. Но как при этом выполнять поиск, совмещая эти данные, укладываясь в 0.1 сек не представляю.