Как осуществить поиск Django моделей по наибольшему количеству совпадений свойств?
Всем привет, возник такой вопрос. Есть задача - реализовать нечто вроде фильтра товаров как на Яндекс.Маркете на Django.
Конкретизирую:
Есть класс модели, и соответственно, куча записей в БД, соответствующих это модели. На странице интерфейса будет форма с редактированием параметров этой модели, на выходе должен быть список из N инстансов этой модели, в которых наибольшее количество совпадений с введенными на странице значениями. Упорядочить, соответственно, по количеству совпавших свойств.
Почему спрашиваю:
В голову приходила следующая идея: брать из БД те строки, в которых есть хотя бы одно совпадение с введенными параметрами, и уже программно генерировать тот список. Но есть одно но, по такому запросу может получиться огромный массив объектов, а так как ожидается, что на странице этот список будет обновляться асинхронно, аяксом, по любому изменению одного из параметров пользователем, получится очень частый запрос очень большого объема данных, как бы это не сказалось на скорости, да и звучит крайне не оптимально.
Кто-нибудь сталкивался с реализацией подобного функционала? Какие алгоритмы и приемы для этого используются. или может в Django есть уже готовые инструменты (пусть даже от сторонних разработчиков) для решения таких задач?
Я не собираюсь отображать все объекты, и мне не нужен постраничный вывод. Мне нужно вывести N наиболее подходящих запросам пользователя объектов. N, допустим, равен 10. Пользователь выбрал параметры, если работать по моему алгоритму, выберется из БД, например, 100000 записей, из них мне нужно отдать браузеру лишь 10 с наибольшим количеством совпадений. Пользователь поменял один из параметров на единичку - новый запрос - снова выбирается 100500 записей, из них выбирается 10 наиболее подходящих и отдается клиенту. Вопрос в том, как минимизировать количество выбираемых объектов. Если делать как я сказал выше, по наличию хотя бы одного совпадения значения параметра - будет запрашиваться много объектов, которые в итоге отсеются.
потому что если выбирать тупо хотя бы с одним совпадением и LIMIT делать 10, то не факт что в выборку попадут строки с наибольшим количеством совпадающих параметров
въехал в проблему, тут бы я использовал elasticsearch там можно настроить такой способ получения данных, а релевантность он сам посчитает как раз на основе большего количества совпадения по параметрам ну и лимит можно указать, и выберет тольк оте что наиболее релевантные