Всем привет.
Использую вот этот плагин:
https://github.com/imotov/elasticsearch-analysis-m...
И вот такую настройку индекса:
index:
number_of_shards: 5
analysis:
char_filter:
ru:
type: mapping
mappings: ['Ё=>Е', 'ё=>е']
analyzer:
default_index:
alias: [index_ru]
type: custom
tokenizer: nGram
filter: [stopwords_ru, stop, custom_word_delimiter, lowercase, russian_morphology, english_morphology]
char_filter: [ru]
default_search:
alias: [search_ru]
type: custom
tokenizer: standard
filter: [stopwords_ru, stop, custom_word_delimiter, lowercase, russian_morphology, english_morphology]
char_filter: [ru]
tokenizer:
nGram:
type: nGram
min_gram: 4
max_gram: 20
filter:
stopwords_ru:
type: stop
stopwords: [а,без,более,бы,был,была,были,было,быть,в,вам,вас,весь,во,вот,все,всего,всех,вы,где,да,даже,для,до,его,ее,если,есть,еще,же,за,здесь,и,из,или,им,их,к,как,ко,когда,кто,ли,либо,мне,может,мы,на,надо,наш,не,него,нее,нет,ни
ignore_case: true
custom_word_delimiter:
type: word_delimiter
# "PowerShot" ⇒ "Power" "Shot", части одного слова становятся отдельными токенами
generate_word_parts: true
generate_number_parts: true # "500-42" ⇒ "500" "42"
catenate_words: true # "wi-fi" ⇒ "wifi"
catenate_numbers: false # "500-42" ⇒ "50042"
catenate_all: true # "wi-fi-4000" ⇒ "wifi4000"
split_on_case_change: true # "PowerShot" ⇒ "Power" "Shot"
preserve_original: true # "500-42" ⇒ "500-42" "500" "42"
split_on_numerics: false # "j2se" ⇒ "j" "2" "se"
Индекс новых документов идет достаточно медленно, порядка 10 документов в секунду.
При отключении анализа морфологии скорость возрастает в несколько раз.
Можно как-то ускорить индексацию новых документов, или это нормальная скорость?
Проверяю на макбуке Late 2013, Core i7 2.6, памяти для эластика выделено 5 GB
Заранее спасибо.