Евгений Хлебников, и еще, с той же ноды с помощью mongosh попадаю верно на примари Mongo, так же написал скрит на питоне, который подключается к монге и тоже все ок
Евгений Хлебников,
2025-01-21T13:41:43.424+03:00 INFO [cluster] Exception in monitor thread while connecting to server 10.210.133.01:27017
com.mongodb.MongoSocketOpenException: Exception opening socket
at com.mongodb.internal.connection.SocketStream.open(SocketStream.java:73) ~[graylog.jar:?]
at com.mongodb.internal.connection.InternalStreamConnection.open(InternalStreamConnection.java:183) ~[graylog.jar:?]
at com.mongodb.internal.connection.DefaultServerMonitor$ServerMonitorRunnable.lookupServerDescription(DefaultServerMonitor.java:198) [graylog.jar:?]
at com.mongodb.internal.connection.DefaultServerMonitor$ServerMonitorRunnable.run(DefaultServerMonitor.java:158) [graylog.jar:?]
at java.lang.Thread.run(Unknown Source) [?:?]
Caused by: java.net.ConnectException: Connection refused
at sun.nio.ch.Net.pollConnect(Native Method) ~[?:?]
at sun.nio.ch.Net.pollConnectNow(Unknown Source) ~[?:?]
at sun.nio.ch.NioSocketImpl.timedFinishConnect(Unknown Source) ~[?:?]
at sun.nio.ch.NioSocketImpl.connect(Unknown Source) ~[?:?]
at java.net.SocksSocketImpl.connect(Unknown Source) ~[?:?]
at java.net.Socket.connect(Unknown Source) ~[?:?]
at com.mongodb.internal.connection.SocketStreamHelper.initialize(SocketStreamHelper.java:107) ~[graylog.jar:?]
at com.mongodb.internal.connection.SocketStream.initializeSocket(SocketStream.java:82) ~[graylog.jar:?]
at com.mongodb.internal.connection.SocketStream.open(SocketStream.java:68) ~[graylog.jar:?]
... 4 more
еще этот
2025-01-21T13:41:33.423+03:00 INFO [cluster] Exception in monitor thread while connecting to server 10.210.133.01:27017
com.mongodb.MongoNodeIsRecoveringException: Command failed with error 91 (ShutdownInProgress): 'The server is in quiesce mode and will shut down' on server 10.210.133.01:27017. The full response is {"topologyVersion": {"processId": {"$oid": "678e64a441547cd48ee8c1d8"}, "counter": 10}, "ok": 0.0, "errmsg": "The server is in quiesce mode and will shut down", "code": 91, "codeName": "ShutdownInProgress", "remainingQuiesceTimeMillis": 3472, "$clusterTime": {"clusterTime": {"$timestamp": {"t": 1737456089, "i": 6}}, "signature": {"hash": {"$binary": {"base64": "AAAAAAAAAAAAAAAAAAAAAAAAAAA=", "subType": "00"}}, "keyId": 0}}, "operationTime": {"$timestamp": {"t": 1737456081, "i": 24}}}
Евгений Хлебников, в конфиге две дата ноды, пробовал еще прописывать арбитра, но результат не меняется...насчет картинги да, не нашел подходящую схему, поэтому добавил описание
Если вы еще здесь, подскажите. Мы развернули кластер Graylog и на тех же нодах развернули Mongo. При выключении ноды с Graylog+Mongo - Graylog падает при том, что примари Mongo успешно переезжает и по сути БД остается доступной. Что может быть?
Показывает состояние шард
[root@uxrudc1s121l ~]# curl -XGET 'localhost:9200/_cat/shards?h=index,shard,prirep,st...'
.plugins-ml-config 0 p UNASSIGNED CLUSTER_RECOVERED
.plugins-ml-config 0 r UNASSIGNED REPLICA_ADDED
.opensearch-observability 0 p UNASSIGNED CLUSTER_RECOVERED
.opensearch-observability 0 r UNASSIGNED REPLICA_ADDED
gl-system-events_deflector 0 p UNASSIGNED CLUSTER_RECOVERED
.opensearch-sap-log-types-config 0 p UNASSIGNED CLUSTER_RECOVERED
.opensearch-sap-log-types-config 0 r UNASSIGNED REPLICA_ADDED
gl-events_0 0 p UNASSIGNED CLUSTER_RECOVERED
graylog_0 0 p UNASSIGNED CLUSTER_RECOVERED
Everything_is_not_so_bad, единственное что нашел на мастере
[2024-10-22T17:14:42,585][WARN ][o.o.s.SecurityAnalyticsPlugin] [opensearch-cluster_manager] Failed to initialize LogType config index and builtin log types
Но я не думаю, что это является причиной статуса red
on premise
место на диске есть, из логов на дата ноде единственное что было и то не критично возможно:
systemd-entrypoint[145090]: WARNING: Using incubator modules: jdk.incubator.vector
systemd-entrypoint[145090]: WARNING: A terminally deprecated method in java.lang.System has been called
systemd-entrypoint[145090]: WARNING: System::setSecurityManager has been called by org.opensearch.bootstrap.OpenSearch (file:/usr/share/opensearch/lib/opensearch-2.13.0>
systemd-entrypoint[145090]: WARNING: Please consider reporting this to the maintainers of org.opensearch.bootstrap.OpenSearch
systemd-entrypoint[145090]: WARNING: System::setSecurityManager will be removed in a future release
systemd-entrypoint[145090]: Oct 21, 2024 11:03:08 AM sun.util.locale.provider.LocaleProviderAdapter
systemd-entrypoint[145090]: WARNING: COMPAT locale provider will be removed in a future release
systemd-entrypoint[145090]: WARNING: A terminally deprecated method in java.lang.System has been called
systemd-entrypoint[145090]: WARNING: System::setSecurityManager has been called by org.opensearch.bootstrap.Security (file:/usr/share/opensearch/lib/opensearch-2.13.0.j>
systemd-entrypoint[145090]: WARNING: Please consider reporting this to the maintainers of org.opensearch.bootstrap.Security
systemd-entrypoint[145090]: WARNING: System::setSecurityManager will be removed in a future release
Спасибо за ответ!
Я только сейчас начинаю осваивать прометеус, но как я понимаю в node exporter можно писать свои триггеры и алерты и вот они будут как-то перенесены в заббикс? В частности триггеры с соответствующими severity.
Alexey Dmitriev, ну, здесь скорее я спрашиваю имел ли кто реальный опыт мониторинга кубера с помощью Заббикс. А так да спору нет, можно мониторить чем угодно, хоть python скриптами наверное.
as_vasch, т.к. мониторинг идет через агента который установлен локально, поэтому думаю здесь не в брандмауэре дело, логин идет через AD, учетка AD для заббикс агента есть, права дал согласно документации.
не работает, пишет в latest data
Failed to execute handler: failed to execute handler: failed to get conn: failed to create conn: failed to ping: unable to open tcp connection with host 'localhost:1433': dial tcp localhost:1433: connectex: No connection could be made because the target machine actively refused it.
Дмитрий, в ответ на команду выдает это
[root@cdv~]# zabbix_server -R config_cache_reload
zabbix_server: /usr/pgsql-16/lib/libpq.so.5: no version information available (required by zabbix server)
Runtime control command was forwarded successfully
Спасибо большое за ответ!
Если например в качестве хранилища логов используется OpenSearch, то 100'000 строк логов в секунду сначала должны попасть туда и храниться там какое то время. И я могу просто ради интереса посмотреть что происходит с микросервисами, так?
А может ли Graylog отлавливать ошибки на лету, т.е. до попадания в OpenSearch?
И может ли Graylog, пробегаться по данным и автоматически отправлять оповещение?