Настройка Elasticsearch под русский язык

Проблема: как только встречаются в данных русские буквы то процесс добавление записи падает. Скорей всего нужно вместо дефольного индекса создать что то такое (ссылка):

curl -XPUT "http://localhost:9200/project/_settings?pretty=true" "{\"index\":{\"index.analysis.analyzer.english.language\" : \"English\",\"index.analysis.analyzer.russian.filter.0\" : \"lowercase\",\"index.analysis.analyzer.russian.filter.1\" : \"russian_morphology\",\"index.number_of_shards\" : \"1\",\"index.analysis.analyzer.russian.filter.2\" : \"stop\",\"index.analysis.analyzer.russian.language\" : \"Russian\",\"index.analysis.analyzer.russian.tokenizer\" : \"standard\",\"index.analysis.analyzer.english.type\" : \"snowball\",\"index.number_of_replicas\" : \"1\"}}"


но пока все варианты не приводят к желаемому. Буду благодарен, если кто то кинет скрипт-пример создания индекса работающего с русским языком.
  • Вопрос задан
  • 14659 просмотров
Пригласить эксперта
Ответы на вопрос 1
@vitalybaev
Какой версии используете elasticSearch и ОС?
Мы в своем проекте используем следующий плагин для поддержки русской морфологии:

https://github.com/imotov/elasticsearch-analysis-m...

Хотя не припомню, чтобы при отсутствии оного падал процесс добавления любых русских (и других UTF-8) символов.
Использовали ES начиная с версии 0.2.x вплоть до 1.0.1 на ОС Debian 6 Squeeze
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы