Percona/Galera — 110 ошибка WSREP — в какую сторону копать?

Кластер на >10 серверов, равномерно распределенных между ДЦ, нагруженная система.

В логах часто видно: WSREP: Failed to report last committed XXXX, -110 (Connection timed out)

Опуская периодические SST/IST (управляемые, при обслуживании) - в какую сторону копать, чтобы придти к улучшению стабильности?

Кластер работает, системы работают - то есть - это именно warnings - на стабильности отражается слабо.

Может ли это быть причиной пучков deadlock в БД, или же есть неявные проблемы на конкретных нодах?

Кроме этого - логи в целом чистые.
  • Вопрос задан
  • 486 просмотров
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы