N, так можно и при индексации сокращать world of tanks => wot, не суть важно
просто ранкер bm25, потому мне проще добавить в запрос слова, а не изменять оригиналы текстов....
fenrir, на wikidata есть сокращение вов, которое ведет на войну
Мне кажется это не перс. поиск, т.к. Мне DDG тоже показал про войну, в то же время гугл и яндекс без кук через разные впн - игры. Но не суть)
Подскажите, вот именно это я и хочу - ""нужно самостоятельно их слова генерировать все что вы зовёте "синонимами" и искать по ним"".
Как этого добиться можно?
Если брать пример с варкрафт, то "Wrath of the Lich King Classic" должно быть также "рядом" с "вов"... и т.д.
Как выдрать именно такие пары из текста без эмбеддингов?
а как гугл взял, что вов - варкрафт, а не война?
но по факту, нужен парсер именно вышеуказанных сочитаний. Никакие инструменты в ElasticSearch не найдут
world of warcraft, если забить в поиск "вов". А вручную этот словать составлять никто не будет.
просто ранкер bm25, потому мне проще добавить в запрос слова, а не изменять оригиналы текстов....