@dmvlch_dev

Как решить проблему со статусом «red» кластера OpenSearch?

Всем привет!

Собрал кластер Opensearch состоящий из трех нод, две дата ноды и один кластер менеджер.
ip            heap.percent ram.percent cpu load_1m load_5m load_15m node.role node.roles      cluster_manager name
10.220.101.40           18          93   0    0.03    0.07     0.03 di        data,ingest     -               opensearch-d1
10.220.101.7            58          95   0    0.05    0.07     0.02 m         cluster_manager *               opensearch-cluster_manager
10.220.101.41           30          93   0    0.19    0.29     0.24 di        data,ingest     -               opensearch-d2


При этом статус кластера находится в "red"

{
  "cluster_name": "graylog",
  "status": "red",
  "timed_out": false,
  "number_of_nodes": 3,
  "number_of_data_nodes": 2,
  "discovered_master": true,
  "discovered_cluster_manager": true,
  "active_primary_shards": 0,
  "active_shards": 0,
  "relocating_shards": 0,
  "initializing_shards": 0,
  "unassigned_shards": 10,
  "delayed_unassigned_shards": 0,
  "number_of_pending_tasks": 0,
  "number_of_in_flight_fetch": 0,
  "task_max_waiting_in_queue_millis": 0,
  "active_shards_percent_as_number": 0.0
}


Вот конфиги трех нод

Cluster manager:
cluster.name: graylog
node.name: opensearch-cluster_manager
node.roles: [ cluster_manager ]
path.data: /var/lib/opensearch
path.logs: /var/log/opensearch
network.host: 10.220.101.7            
discovery.seed_hosts: ["10.220.101.40", "10.220.101.7", "10.220.101.41"]
cluster.initial_cluster_manager_nodes: ["opensearch-cluster_manager", "opensearch-d1", "opensearch-d2"]
plugins.security.disabled: true


dn1:
cluster.name: graylog
node.name: opensearch-d1
node.roles: [ data, ingest ]
path.data: /data/opensearch
path.logs: /var/log/opensearch
network.host: 10.220.101.40
discovery.seed_hosts: ["10.220.101.40","10.220.101.7", "10.220.101.41"]
cluster.initial_cluster_manager_nodes: ["opensearch-cluster_manager", "opensearch-d1", "opensearch-d2"]
plugins.security.disabled: true


dn2:
cluster.name: graylog
node.name: opensearch-d2
node.roles: [ data, ingest ]
path.data: /data/opensearch
path.logs: /var/log/opensearch
network.host: 10.220.101.41
discovery.seed_hosts: ["10.220.101.40", "10.220.101.7", "10.220.101.41"]
cluster.initial_cluster_manager_nodes: ["opensearch-cluster_manager", "opensearch-d1", "opensearch-d2"]
plugins.security.disabled: true


В логах не нашел каких то явных проблем.

Что нужно сделать, что бы привести состояние кластера в рабочее состояние, с OpenSearch до этого не сталкивался?
  • Вопрос задан
  • 36 просмотров
Пригласить эксперта
Ответы на вопрос 1
Упал один из узлов с данными.
"unassigned_shards": 10,

Нужно смотреть на логи самого OS на том узле, что упал, чтобы знать причину сбоя. Возможно, закончилось место на диске.
OpenSearch на AWS или on premise?
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы