Задать вопрос

saprykinoff @saprykinoff

elasticsearch

Elasticsearch

Как исправить Elasticsearch конфликт hunspell и синонимов?

При таком запросе (Брал hunspell словарь с https://cgit.freedesktop.org/libreoffice/dictionar...)

GET /_analyze

{
  "tokenizer": "standard",
  "filter": [
    {
        "type": "hunspell",
        "locale": "ru_RU"
    },
    {
        "type": "synonym",
        "synonyms": [
            "разогрев, прогрев"
        ]
    }
  ],
  "text": "разогрев"
}

получаю ошибку

{
    "error": {
        "root_cause": [
            {
                "type": "illegal_argument_exception",
                "reason": "failed to build synonyms"
            }
        ],
        "type": "illegal_argument_exception",
        "reason": "failed to build synonyms",
        "caused_by": {
            "type": "parse_exception",
            "reason": "Invalid synonym rule at line 1",
            "caused_by": {
                "type": "illegal_argument_exception",
                "reason": "term: разогрев analyzed to a token (разогреть) with position increment != 1 (got: 0)"
            }
        }
    },
    "status": 400
}

Выяснил, что конфликт возникает когда hunspell находит несколько основ для слова, которое встречается в списке синонимов (при этом, само слово не обязано находится в запросе). Так например, для слова "разогрев" находит две основы:

{
  "tokenizer": "standard",
  "filter": [
    {
        "type": "hunspell",
        "locale": "ru_RU"
    }
  ],
  "text": "разогрев"
}

{
    "tokens": [
        {
            "token": "разогрев",
            "start_offset": 0,
            "end_offset": 8,
            "type": "<ALPHANUM>",
            "position": 0
        },
        {
            "token": "разогреть",
            "start_offset": 0,
            "end_offset": 8,
            "type": "<ALPHANUM>",
            "position": 0
        }
    ]
}

Насколько я понял, проблема в том, что оба токена имеют position: 0 (`with position increment != 1 (got: 0)`).
Подскажите, какие у проблемы есть решения

Вопрос задан 25 авг. 2024
113 просмотров

Комментировать

Подписаться 4 Простой Комментировать

Пригласить эксперта

Ответы на вопрос 1

Luchanno @Luchanno

Поменять фильтры местами

Ответ написан 03 февр.

Комментировать

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

1С-Битрикс

+1 ещё

Простой
Как сделать простой фильтр с фасетом?
- 1 подписчик
- 16 февр.
- 96 просмотров
1

ответ
MySQL

+1 ещё

Простой
Как построить индекс в ElasticSearch с фильтрами по полям содержащим тысячи значений?
- 4 подписчика
- 23 янв.
- 440 просмотров
1

ответ
PHP

+1 ещё

Средний
Как сортировать новости в результатах поиска по дате публикации?
- 5 подписчиков
- 19 дек. 2024
- 1223 просмотра
1

ответ
PHP

+1 ещё

Средний
Как писать логи напрямую в Elastic?
- 1 подписчик
- 17 дек. 2024
- 135 просмотров
3

ответа
Elasticsearch

Средний
Правильный способ реализовать поиск с автодополнением по одному слову?
- 2 подписчика
- 07 дек. 2024
- 392 просмотра
1

ответ
PostgreSQL

+2 ещё

Средний
Как организовать фасетный поиск в postgres?
- 4 подписчика
- 11 нояб. 2024
- 894 просмотра
0

ответов
Elasticsearch

Средний
Как решить проблему unassigned shards в кластере OpenSearch приводящей к статусу red?
- 3 подписчика
- 28 окт. 2024
- 138 просмотров
0

ответов
Elasticsearch

Средний
Как решить проблему со статусом «red» кластера OpenSearch?
- 1 подписчик
- 20 окт. 2024
- 81 просмотр
1

ответ
Elasticsearch

Простой
Как сформировать поисковой запрос по 2 полям в Elastic Search?
- 1 подписчик
- 17 окт. 2024
- 46 просмотров
0

ответов
Elasticsearch

Простой
Как реализовать подсказки для поиска на ElasticSearch?
- 2 подписчика
- 01 окт. 2024
- 118 просмотров
1

ответ
Показать ещё Загружается…

Backend-разработчик PHP

Wanted. • Тбилиси

До 3 500 €

Senior Golang Engineer в команду Отелло

2GIS

До 550 000 ₽

Backend developer (PHP/Laravel)

СпросиВрача • Москва

от 150 000 до 300 000 ₽