Почему-то ранжирование с точным совпадением в словах с дефисом — не коректное?

Question

Лариса .•º @barolina

turn coffee into code

Sphinx

Почему-то ранжирование с точным совпадением в словах с дефисом — не коректное?

у меня есть запрос

select * from appl_index() where MATCH('Синее, яблоко') OPTION ranker=expr('sum(lcs*user_weight)*1000+bm25');

если в базе есть слова с дефисом, то результат такого запроса след

Синее, яблоко-дерево 1
Синее, яблоко-дерево 4
Синее, яблоко-дерево 3
Синее, яблоко

хотелось видеть наоборот

Синее, яблоко
Синее, яблоко-дерево 1
Синее, яблоко-дерево 3
Синее, яблоко-дерево 4

если в базе нет слов с дефисом, то результате, вроде все верно, первыми идут результаты с точным совпадением

Настройки индекса след:

index_exact_words =1
min_stemming_len = 3
min_word_len = 3
min_prefix_len = 3
expand_keywords = 1

Вопрос задан более трёх лет назад
104 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Пригласить эксперта

Ответы на вопрос 1

2 комментария

Лариса .•º @barolina Автор вопроса
попробовала сделать так

select * from appl_index() where MATCH('Синее, яблоко') OPTION ranker=expr('abs(query_word_count - doc_word_count) +sum(lcs*user_weight)');

Результат получился весьма странным )
Синее, яблоко-дерево 3 Синее, яблоко Синее, яблоко-дерево 1 Синее, яблоко-дерево 4

"Синее, яблоко" вроде поднялось )), но не совсем
Написано более трёх лет назад
Сергей Тихонов @tumbler

Включайте уже отладку) Сниппеты, экспорт ранкера. Как мне кажется, у всех этих четырех строк в примере вполне может быть одно и то же значение, а на слово "яблоко" из-за синонимов матчится "яблоко-дерево". Маловероятно, но всё же.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Sphinx

Простой
Возможно ли настроить wordforms в Manticore с добавлением нескольких синонимов к указанному слову, а не только один?
- 1 подписчик
- 06 окт. 2025
- 82 просмотра
1

ответ
Sphinx

+1 ещё

Простой
Не ставится Sphinx в виртуальной машине Bitrix 7.5.5?
- 1 подписчик
- 14 авг. 2025
- 63 просмотра
0

ответов
Sphinx

Средний
Как указать --skip-ssl в конфиге manticore?
- 3 подписчика
- более года назад
- 367 просмотров
1

ответ
Linux

+2 ещё

Простой
Как установить Sphinx на Alma Linux 9?
- 1 подписчик
- более года назад
- 175 просмотров
4

ответа
PHP

+1 ещё

Средний
Как заставить sphinxsearch 3.6.1 выводить несколько полей?
- 1 подписчик
- более года назад
- 91 просмотр
2

ответа
1С-Битрикс

+1 ещё

Сложный
Как сделать чтобы sphinx выдавал сперва точные совпадения а потом остальные?
- 1 подписчик
- более года назад
- 196 просмотров
1

ответ
Sphinx

Простой
Какие существуют ограничения на количество записей у real time индексов manticoresearch?
- 6 подписчиков
- более года назад
- 368 просмотров
0

ответов
CentOS

+1 ещё

Простой
Почему SPHINX не стартует после остановки какой-то службы?
- 1 подписчик
- более года назад
- 125 просмотров
1

ответ
Sphinx

Средний
Почему текстовое поле из real time индекса пустое при запросе?
- 1 подписчик
- более года назад
- 49 просмотров
1

ответ
1С-Битрикс

+1 ещё

Средний
Как сделать так чтобы sphinx не искал вместе с «тест» слово «test»?
- 2 подписчика
- более года назад
- 114 просмотров
1

ответ
Показать ещё Загружается…

PPC Manager (Yandex Direct)

Freuders

от 4 000 до 6 000 $

LEAD AI/ML ENGINEER

Selecty • Москва

от 400 000 ₽

Fullstack PHP Laravel/VueJS разработчик

Emsoft

До 150 000 ₽

Answer 1 · 2018-10-23 18:35:16

Добавьте сниппеты чтобы понять, что именно сматчилось
ranker=export() чтобы посмотреть, что там насчитал sphinx по показателям
lcs не учитывает расстояние между сматчившимися словами, только порядок. Посмотрите на [w]lccs
Добавьте в ранкер abs(query_word_count - doc_word_count), тогда впереди будут идти результаты в которых столько же слов сколько в запросе)

Почему-то ранжирование с точным совпадением в словах с дефисом — не коректное?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт