Как организовать автокомплит адреса в Elasticsearch?

Question

ordinary_pavel @ordinary_pavel

Как организовать автокомплит адреса в Elasticsearch?

Доброго времени суток! Возникла необходимость в написании автокомплита адресов. Для этого решили брать адреса из БД ФИАСа и индексировать в еластике в виде строки адреса типа "Магаданская область, г. Магадан, ул Пролетарская, д. 117".
По этой строке я делаю полнотекстовый поиск.
Анализатор кастомный. Настройки следующие:
https://gist.github.com/anonymous/dc84e31ff7f40ea3...

Для запросов использую match_phrase_prefix:
'match_phrase_prefix': {
"plaintext": {
"query": "ленина 7",
"analyzer": "address"
}

}

Ищет более-менее вменяемо. Однако, есть две проблемы.
1) как бы мне не учитывать порядок слов, по которым происходит поиск в фразе? Есть ли варианты кроме slop?
2) При поиске по префиксам когда делаешь запрос вида: "Ленина 1" результаты "Ленина д. 1", "Ленина д. 12", "Ленина д. 113" и т.п. имеют одинковый score в выдаче (предполагаю, что еластик побайтово анализирует строку при поиске по префиксу и как только находит совпадение по некоторому токену включает результат в выдачу независимо от того, то идет за совпадением). Соответственно, возникает неприятная ситуация, когда по запросу "Ленина 1" первый дом получить невозможно (при ограничении числа результатов 10), т.к. выдачу засоряют дома вроде "Ленина д. 112", "Ленина д. 113").
Как бы мне дать бонус для точного совпадения?

Пробовал также suggest поле, но искало не очень хорошо, в виду того что по inputу нельзя сделать нормальный query
Ну и вообще возможно идея организации автокомплита полнотекствым поиском не лучшая. Есть ли у кого то идеи как правильно делать автокомплит адреса?

Вопрос задан более трёх лет назад
1456 просмотров

Комментировать

Подписаться 4 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

MySQL

Простой
MySQL JSON_OBJECT Приводит значение к строковому типу, возможно ли это как то обойти?
- 1 подписчик
- вчера
- 93 просмотра
1

ответ
MySQL

+1 ещё

Простой
Как исправить ошибку «No connection could be made because the target machine actively refused it»?
- 1 подписчик
- 02 сент.
- 207 просмотров
1

ответ
MySQL

Простой
Почему у некоторых таблиц Update_time равен null?
- 1 подписчик
- 20 авг.
- 107 просмотров
2

ответа
Python

+1 ещё

Простой
Как создать параметризированный SQL запрос через pyodbc к Mysql?
- нет подписчиков
- 16 авг.
- 164 просмотра
2

ответа
Python

+1 ещё

Простой
Как сделать экранирование символов в Python для SQL запроса?
- 1 подписчик
- 16 авг.
- 171 просмотр
1

ответ
MySQL

Простой
Как свзять столбцы по внешнему ключу?
- 1 подписчик
- 06 авг.
- 120 просмотров
1

ответ
MySQL

Простой
Как подсчитать количество строк в sql запросе?
- 1 подписчик
- 05 авг.
- 246 просмотров
1

ответ
Elasticsearch

Простой
Почему opensearch создает кучу процессов?
- 2 подписчика
- 04 авг.
- 277 просмотров
1

ответ
PHP

+2 ещё

Средний
Как одновременно сделать две записи в разных таблицах в Laravel?
- 1 подписчик
- 27 июл.
- 286 просмотров
1

ответ
JavaScript

+3 ещё

Простой
Почему при отправке HTML-формы данные не поступают в mysql?
- 1 подписчик
- 25 июл.
- 311 просмотров
1

ответ
Показать ещё Загружается…

Администратор баз данных (DBA) (MariadDB Galera, ClickHouse Cluster)

Безлимит

от 300 000 ₽

PHP разработчик

BGStaff • Москва

До 300 000 ₽

Senior PHP разработчик

Хабр • Москва

от 250 000 до 320 000 ₽

Answer 1 · 2017-07-21 16:07:07

Натравить analyzer ниже, вписав его в индекс и к нужным полям:

{
  "settings": {
    "analysis": {
      "analyzer": {
        "address_analyzer_toster": {
          "tokenizer": "whitespace",
          "char_filter": [
            "useless_symbols",
          ],
          "filter": "useless_words": {
                    "type":       "stop",
                    "stopwords": ["ул", "д", "проезд", ...]
          }
        }
      },
      "char_filter": {
        "useless_symbols": {
          "type": "pattern_replace",
          "pattern": "[,\.:].*",
          "replacement": ""
        }
      }
    }
  }
}

Как организовать автокомплит адреса в Elasticsearch?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт