Как определить какие операции вызвают высокую дисковую нагрузку в elasticsearch?

Question

elenium @elenium

Как определить какие операции вызвают высокую дисковую нагрузку в elasticsearch?

В кластере DC/OS есть контейнер с elasticsearch 5.6.13(одиночный), который получает данные из logstash, около 300 индексов, 1400 шардов. Индексы от 5мб до 500мб.
После запуска некоторое время работает корректно, затем в логах появляется запись

[o.e.c.m.MetaDataMappingService] [-n4ixxd] [имя индекса созданного сегодня] update_mapping [имя индекса созданного сегодня]

Не уверен что дальнейшее связано с этим событием,но количество процессов внутри контейнера сильно вырастает и все они что-то очень активно пишут/читают с диска. LA под 80, пару часов это все-таки работает, затем начинаются сообщения от GC, судя по всему потихоньку отъедается память и контейнер падает.

Настройки эластика - почти дефолтные, увеличен heap size до 4Гб (cамому контейнеру выделено 8).
bootstrap.memory_lock: true
refresh_interval - увеличен до 5 минут

Вопрос задан более трёх лет назад
115 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Stepik

Docker + Ansible - с нуля, деплой и управление Swarm

1 неделя

Далее
Учебный центр IBS

ADM-019 Основы Docker

1 неделя

Далее
Слёрм

Docker для админов и разработчиков

4 недели

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Docker

Простой
Почему не стартуют контейнеры Docker Desktop?
- 1 подписчик
- вчера
- 119 просмотров
2

ответа
Docker

+1 ещё

Средний
Почему не работает healthcheck внутри Docker-контейнера?
- 1 подписчик
- 14 дек.
- 166 просмотров
2

ответа
Ubuntu

+2 ещё

Средний
Кто сталкивался с 'Nginx invalid URL prefix' и 'Promtail client version too old' после обновления Docker на Ubuntu 24.04?
- 1 подписчик
- 13 дек.
- 144 просмотра
0

ответов
Docker

+1 ещё

Средний
Как настроить авторизацию через ansible community.docker.docker_login?
- 1 подписчик
- 11 дек.
- 66 просмотров
1

ответ
Docker

+1 ещё

Простой
Docker, forgejo, как подключить woodpecker-ci?
- 2 подписчика
- 07 дек.
- 62 просмотра
0

ответов
Elasticsearch

Простой
ElasticSearch, поиск в стиле google?
- 2 подписчика
- 07 нояб.
- 164 просмотра
1

ответ
Docker

+1 ещё

Простой
Откуда скачивать bitnami/kafka?
- 1 подписчик
- 29 окт.
- 745 просмотров
1

ответ
Nginx

+2 ещё

Простой
Контейнер rabbitmq docker стартует раньше чем сервис nginx. Как указать согласованность запуска?
- 6 подписчиков
- 26 окт.
- 991 просмотр
4

ответа
Docker

Средний
Как использование переменные в Entrypoint Dockerfile?
- 1 подписчик
- 17 окт.
- 158 просмотров
2

ответа
Laravel

+1 ещё

Средний
Production.ERROR: No alive nodes. All the 1 nodes seem to be down -- laravel?
- 1 подписчик
- 14 окт.
- 124 просмотра
0

ответов
Показать ещё Загружается…

Fullstack разработчик (TypeScript+React). Свободный график. Фулл тайм.

Круглый Квадрат

от 300 000 до 450 000 ₽

Junior Backend Developer (NestJS) One Day Offer

critica agency

До 50 000 ₽

Golang Developer

SMALL

от 280 000 до 350 000 ₽

Answer 1 · 2019-02-07 23:49:19

Так как эластик написан на яве, а в яве есть jmx, mbeans и jconsole, то проблем помониторить не вижу никаких. Можно даже снять эти данные через logstash и засунуть обратно в эластик для просмотра в кибане. pavanrp1.blogspot.com

Answer 2 · 2019-02-14 06:14:46

Не совсем по теме, конечно, но скажу. Зачем Вам 1400 шардов для единого инстанса эластика, особенно при размерах индекса от 5 до 500мб? По рекомендациям производителя, размер шарда, при котором требуется шардирование (прошу прощения за тавтологию), около 50Гб... Опять же, для 4Гб 300 индексов это прям очень не слабо, т.к. эластик держит много информации в памяти. Оптимизируйте или дайте ему больше ресурсов.

Как определить какие операции вызвают высокую дисковую нагрузку в elasticsearch?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт