Как объяснить sphinx что рукав и рукавичка — разные слова?
Настраиваю поиск sphinx для интернет магазина. На запрос «рукавичка» находит и рукавички и все товары с упоминание рукав. При чем видимо в процессе индекса выделен корень «рукав» потому что даже при релевантной сортировки «рукавички» не все выдаются в начале. Как сделать чтоб по рукавам и рукавичкам искал отдельно?
Запросил на форуме sphinx, порекомендовали использовать словарь словоформ в формате:
Рукавичка > Рукавич
Рукавички > Рукавич
В общем пришлось добавить склонение во всех падежах в единственном и множественном числах, по факту это: 7 строк
Вроде помогло.
Может быть вам сделать индекс не по стемме (у слов рукав и рукавичка стемма одинаковая ), а по лемме, подключить морфологический словарь? В новой версии, он уже поддерживается.