Как решить проблему со статусом «red» кластера OpenSearch?

Question

dmvlch_dev @dmvlch_dev

Elasticsearch

Как решить проблему со статусом «red» кластера OpenSearch?

Всем привет!

Собрал кластер Opensearch состоящий из трех нод, две дата ноды и один кластер менеджер.

ip            heap.percent ram.percent cpu load_1m load_5m load_15m node.role node.roles      cluster_manager name
10.220.101.40           18          93   0    0.03    0.07     0.03 di        data,ingest     -               opensearch-d1
10.220.101.7            58          95   0    0.05    0.07     0.02 m         cluster_manager *               opensearch-cluster_manager
10.220.101.41           30          93   0    0.19    0.29     0.24 di        data,ingest     -               opensearch-d2

При этом статус кластера находится в "red"

{
  "cluster_name": "graylog",
  "status": "red",
  "timed_out": false,
  "number_of_nodes": 3,
  "number_of_data_nodes": 2,
  "discovered_master": true,
  "discovered_cluster_manager": true,
  "active_primary_shards": 0,
  "active_shards": 0,
  "relocating_shards": 0,
  "initializing_shards": 0,
  "unassigned_shards": 10,
  "delayed_unassigned_shards": 0,
  "number_of_pending_tasks": 0,
  "number_of_in_flight_fetch": 0,
  "task_max_waiting_in_queue_millis": 0,
  "active_shards_percent_as_number": 0.0
}

Вот конфиги трех нод

Cluster manager:

cluster.name: graylog
node.name: opensearch-cluster_manager
node.roles: [ cluster_manager ]
path.data: /var/lib/opensearch
path.logs: /var/log/opensearch
network.host: 10.220.101.7            
discovery.seed_hosts: ["10.220.101.40", "10.220.101.7", "10.220.101.41"]
cluster.initial_cluster_manager_nodes: ["opensearch-cluster_manager", "opensearch-d1", "opensearch-d2"]
plugins.security.disabled: true

dn1:

cluster.name: graylog
node.name: opensearch-d1
node.roles: [ data, ingest ]
path.data: /data/opensearch
path.logs: /var/log/opensearch
network.host: 10.220.101.40
discovery.seed_hosts: ["10.220.101.40","10.220.101.7", "10.220.101.41"]
cluster.initial_cluster_manager_nodes: ["opensearch-cluster_manager", "opensearch-d1", "opensearch-d2"]
plugins.security.disabled: true

dn2:

cluster.name: graylog
node.name: opensearch-d2
node.roles: [ data, ingest ]
path.data: /data/opensearch
path.logs: /var/log/opensearch
network.host: 10.220.101.41
discovery.seed_hosts: ["10.220.101.40", "10.220.101.7", "10.220.101.41"]
cluster.initial_cluster_manager_nodes: ["opensearch-cluster_manager", "opensearch-d1", "opensearch-d2"]
plugins.security.disabled: true

В логах не нашел каких то явных проблем.

Что нужно сделать, что бы привести состояние кластера в рабочее состояние, с OpenSearch до этого не сталкивался?

Вопрос задан более года назад
120 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Аналитик SOC

4 месяца

Далее
Merion Academy

Базы данных с нуля

2 месяца

Далее
OTUS

PHP Developer. Professional

5 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

4 комментария

dmvlch_dev @dmvlch_dev Автор вопроса

on premise
место на диске есть, из логов на дата ноде единственное что было и то не критично возможно:

systemd-entrypoint[145090]: WARNING: Using incubator modules: jdk.incubator.vector
systemd-entrypoint[145090]: WARNING: A terminally deprecated method in java.lang.System has been called
systemd-entrypoint[145090]: WARNING: System::setSecurityManager has been called by org.opensearch.bootstrap.OpenSearch (file:/usr/share/opensearch/lib/opensearch-2.13.0>
systemd-entrypoint[145090]: WARNING: Please consider reporting this to the maintainers of org.opensearch.bootstrap.OpenSearch
systemd-entrypoint[145090]: WARNING: System::setSecurityManager will be removed in a future release
systemd-entrypoint[145090]: Oct 21, 2024 11:03:08 AM sun.util.locale.provider.LocaleProviderAdapter
systemd-entrypoint[145090]: WARNING: COMPAT locale provider will be removed in a future release
systemd-entrypoint[145090]: WARNING: A terminally deprecated method in java.lang.System has been called
systemd-entrypoint[145090]: WARNING: System::setSecurityManager has been called by org.opensearch.bootstrap.Security (file:/usr/share/opensearch/lib/opensearch-2.13.0.j>
systemd-entrypoint[145090]: WARNING: Please consider reporting this to the maintainers of org.opensearch.bootstrap.Security
systemd-entrypoint[145090]: WARNING: System::setSecurityManager will be removed in a future release

Написано более года назад
d'Ivan @2ord

Из логов видно только предупреждения, а не ошибки. Должны быть причины того, что узел перестал быть видным в кластере.
Посмотри что есть в логах мастер узла.

Написано более года назад
dmvlch_dev @dmvlch_dev Автор вопроса

Everything_is_not_so_bad, единственное что нашел на мастере
[2024-10-22T17:14:42,585][WARN ][o.o.s.SecurityAnalyticsPlugin] [opensearch-cluster_manager] Failed to initialize LogType config index and builtin log types

Но я не думаю, что это является причиной статуса red

Написано более года назад
dmvlch_dev @dmvlch_dev Автор вопроса

Показывает состояние шард
[root@uxrudc1s121l ~]# curl -XGET 'localhost:9200/_cat/shards?h=index,shard,prirep,st...'
.plugins-ml-config 0 p UNASSIGNED CLUSTER_RECOVERED
.plugins-ml-config 0 r UNASSIGNED REPLICA_ADDED
.opensearch-observability 0 p UNASSIGNED CLUSTER_RECOVERED
.opensearch-observability 0 r UNASSIGNED REPLICA_ADDED
gl-system-events_deflector 0 p UNASSIGNED CLUSTER_RECOVERED
.opensearch-sap-log-types-config 0 p UNASSIGNED CLUSTER_RECOVERED
.opensearch-sap-log-types-config 0 r UNASSIGNED REPLICA_ADDED
gl-events_0 0 p UNASSIGNED CLUSTER_RECOVERED
graylog_0 0 p UNASSIGNED CLUSTER_RECOVERED

Написано более года назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Elasticsearch

Простой
ElasticSearch, поиск в стиле google?
- 2 подписчика
- 07 нояб.
- 161 просмотр
1

ответ
Laravel

+1 ещё

Средний
Production.ERROR: No alive nodes. All the 1 nodes seem to be down -- laravel?
- 1 подписчик
- 14 окт.
- 123 просмотра
0

ответов
Elasticsearch

Простой
Почему opensearch создает кучу процессов?
- 2 подписчика
- 04 авг.
- 288 просмотров
1

ответ
Elasticsearch

Простой
Как побороть несовместимость версий elasticsearch и его fluent плагина?
- 2 подписчика
- 11 июн.
- 331 просмотр
1

ответ
Elasticsearch

Простой
К какому методу API ElasticSearch необходимо делать запрос для получения количества документов?
- 1 подписчик
- 27 мая
- 45 просмотров
2

ответа
1С-Битрикс

+1 ещё

Простой
Как сделать простой фильтр с фасетом?
- 1 подписчик
- 16 февр.
- 135 просмотров
1

ответ
MySQL

+1 ещё

Простой
Как построить индекс в ElasticSearch с фильтрами по полям содержащим тысячи значений?
- 4 подписчика
- 23 янв.
- 461 просмотр
1

ответ
PHP

+1 ещё

Средний
Как сортировать новости в результатах поиска по дате публикации?
- 5 подписчиков
- 19 дек. 2024
- 1250 просмотров
1

ответ
PHP

+1 ещё

Средний
Как писать логи напрямую в Elastic?
- 1 подписчик
- 17 дек. 2024
- 158 просмотров
3

ответа
Elasticsearch

Средний
Правильный способ реализовать поиск с автодополнением по одному слову?
- 2 подписчика
- более года назад
- 429 просмотров
1

ответ
Показать ещё Загружается…

DevOps-инженер на AWS

DevTeam.Space

от 1 000 до 2 500 $

QA engineer

BSS

До 150 000 ₽

DevOps Junior

Principal Recruitment • Москва

от 200 000 до 250 000 ₽

Answer 1 · 2024-10-20 17:16:11

Упал один из узлов с данными.

"unassigned_shards": 10,

Нужно смотреть на логи самого OS на том узле, что упал, чтобы знать причину сбоя. Возможно, закончилось место на диске.
OpenSearch на AWS или on premise?

Как решить проблему со статусом «red» кластера OpenSearch?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт