ну и если вы хотите очень релевантный поиск то используете леммы а не тупой стемминг?
именно потому, что я не знаю, какой вариант лучше, в тех же статьях (в т.ч. и Вашей) обычно пишут именно про stem, про лематайзер либо вообще ни слова, либо просто упомянут, что такой есть, а в чем его преимущества - ни слова.
А глубоко вникать в это нет особо времени - поиск это просто одна небольшая и не самая важная часть задачи. Нужен просто краткий совет, как улучшить :)
В общем лематайзер помог - теперь релевантность значительно повысилась. По крайней мере по моим примера находит то, что нужно - те же саяны - саяны :)
На этом и закончим. Спасибо. И извините за беспокойство :)
Пума Тайланд: какие именно слова? про инфикс и префикс? конфиг я привел, больше ничего нет
соответственно инфикс и префикс у меня не установлены - значит видимо по умолчанию.
и я никогда до этого со сфинксом не работал - поэтому мне и нужна помощь специалистов
Ищем бочкари, находим:
Бочкари
ООО "ЭЛАР", Бочкари
Бочкари, ЭЛАР, ИП Ладнер
ООО "Элар",ИП "Ладнер",Бочкари
ООО "Элар" Бочкари Ладнер А.Р.
ООО «Бочкаревский пивоваренный завод» (Бочкари)
Ищем бочки, находим:
боу спо во тотемский политехнический колледж
Фарш & Бочка
Дело мастера боится
Фарш & Бочка
БОУ-БОЛ
ИП Бочков
P.S.: То, что много одинаковых - это значит так наши работнички их вносили - дублировали одно и тоже несколько раз, но это уже их проблемы, пусть объединяют или как хотят
дело в том, что по обоим запросам найдено 6 компаний
но они разные!!!
и в первом случае действительно нашел только те, где есть бочкари, а во втором еще и всякий хлам
Пума Тайланд: Действительно, мне больше нечем заняться, я буду обманывать.
Если можете чем-то реально помочь - то помогите, если нет - то на этом и закончим, спасибо.
Пума Тайланд:
[Thu Jun 1 16:19:40.497 2017] 0.001 sec 0.001 sec [ext2/0/ext 18 (0,100000)] [test1] саяны
находит как я и писал выше
[Thu Jun 1 16:22:14.492 2017] 0.001 sec 0.001 sec [ext2/0/ext 21 (0,100000)] [test1] водитель
находит все что надо и ничего лишнего
[Thu Jun 1 16:30:31.710 2017] 0.001 sec 0.001 sec [ext2/0/ext 0 (0,100000)] [test1] бо
ничего не нашел (ну и не должен был)
[Thu Jun 1 16:30:39.610 2017] 0.001 sec 0.001 sec [ext2/0/ext 6 (0,100000)] [test1] бочкари
нашел только то, что нужно
[Thu Jun 1 16:30:56.754 2017] 0.001 sec 0.001 sec [ext2/0/ext 6 (0,100000)] [test1] бочки
нашел то, что нужно - Фарш & Бочка, но и много лишнего по слову 'бо' - 'дело мастера боится', 'боу спо во тотемский политехнический колледж', 'БОУ-БОЛ'
Пума Тайланд: Позволяет индексировать части слова инфиксы, и искать по ним с применением *, вроде search*, *search и *search*.
К примеру при min_infix_len = 2 и попаданию в индекс слова “тест”, будут сохранены в индекс “те”, “ес”, “ст”, “тес”, “ест”, “тест” и по запросу “ес” будет найдено это слово.
т.е. как у меня - если бы я искал "са" - находил бы слова
а я наоборот ищу 'саяны' - нахожу 'са'
Нет, я не ставил искать минимум по двум буквам. Как я понимаю - min_infix_len - это несколько другое.
Но я пробовал ставить min_infix_len равным и 0 и 3 - разницы нет.
И я же не спрашиваю 2 буквы - я спрашиваю целиком слово.
Почему он не ищет то, что я спрашиваю, а отрезает от запроса две буквы?
И не всегда, а только в некоторых запросах - типа как я в примере написал.
MhMadHamster: безусловно обнадеживает - "По всей видимости именно ей и буду пользоваться"
все остальное - чисто рассуждения https://googlemaps.github.io/js-marker-clusterer/s... - копирайта Google тут не нашел, поэтому и брюзжал
и кроме того - статья написана December 2010 - была надежда, что эти возможности появились в базовом коде Google Maps API
Илья Шатохин: По всей видимости именно ей и буду пользоваться - ничего другого нормального не нашел - хотя не уверен что google имеет отношение к этой библиотеке :
* @name MarkerClusterer for Google Maps v3
* @version version 1.0
* author Luke Mahe
Как видми никаких копирайтов google тут нет.
Вероятно это личный проект Luke Mahe - хотя он, возможно, и работает в google
al3ch5: я как-то больше доверяю коду, включенному в API, все-таки компоненты проходят гораздо более полное тестирование, чем библиотека, написанная каким-нибудь студентом (хотя ничего против студентов не имею :) )
Илья Шатохин: Эта библиотека не является частью API и да и сделана как-то не очень - есть нюансы - при изменении масштаба слишком на большом расстоянии объединяются объекты
именно потому, что я не знаю, какой вариант лучше, в тех же статьях (в т.ч. и Вашей) обычно пишут именно про stem, про лематайзер либо вообще ни слова, либо просто упомянут, что такой есть, а в чем его преимущества - ни слова.
А глубоко вникать в это нет особо времени - поиск это просто одна небольшая и не самая важная часть задачи. Нужен просто краткий совет, как улучшить :)
В общем лематайзер помог - теперь релевантность значительно повысилась. По крайней мере по моим примера находит то, что нужно - те же саяны - саяны :)
На этом и закончим. Спасибо. И извините за беспокойство :)