Здравствуйте. Ситуация такова: есть кластер из 3х машин на Percona XtraDB Cluster 5.6. Изначально он был настроен и проверен, данные синхронизировались нормально, были залиты рабочие базы и выпущен на продакшен. Сначала все нормально было, но к утру на первом узле в processlist висела куча запросов под max connection в статусе wsrep in pre-commit stage during long transaction.
Я выключил все сервера, включил по порядку, вроде все заработало, но потом выяснилось, что 1ый сервер работал в каком-то своем выдуманном мире, а два других в своем. Инфа с 1го сервера:
mysql> show global status like '%wsrep_cluster%';
+--------------------------+--------------------------------------+
| Variable_name | Value |
+--------------------------+--------------------------------------+
| wsrep_cluster_conf_id | 3 |
| wsrep_cluster_size | 3 |
| wsrep_cluster_state_uuid | 2da7c277-596b-11e6-9df7-da34104b031c |
| wsrep_cluster_status | Primary |
+--------------------------+--------------------------------------+
show global status like '%wsrep_ready%';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| wsrep_ready | ON |
+---------------+-------+
Второй:
mysql> show global status like '%wsrep_cluster%';
+--------------------------+--------------------------------------+
| Variable_name | Value |
+--------------------------+--------------------------------------+
| wsrep_cluster_conf_id | 2 |
| wsrep_cluster_size | 2 |
| wsrep_cluster_state_uuid | 2da7c277-596b-11e6-9df7-da34104b031c |
| wsrep_cluster_status | Primary |
+--------------------------+--------------------------------------+
show global status like '%wsrep_ready%';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| wsrep_ready | OFF |
+---------------+-------+
Третий:
show global status like '%wsrep_cluster%';
+--------------------------+--------------------------------------+
| Variable_name | Value |
+--------------------------+--------------------------------------+
| wsrep_cluster_conf_id | 3 |
| wsrep_cluster_size | 3 |
| wsrep_cluster_state_uuid | 2da7c277-596b-11e6-9df7-da34104b031c |
| wsrep_cluster_status | Primary |
+--------------------------+--------------------------------------+
show global status like '%wsrep_ready%';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| wsrep_ready | OFF |
+---------------+-------+
Естественно на втором и третьем при попытке любого sql запроса выдает:
ERROR 1047 (08S01): WSREP has not yet prepared node for application use
Я пробовал выключить все сервера, потом на первом в wsrep_cluster_address указать только gcomm:// и запустить через /etc/init.d/mysql bootstrap-pxc затем включить два остальные сервера, но это не помогло. При этом по логам у них вроде как все в порядке:
paste2.org/Dt31XZ8N
Подскажите пожалуйста, как можно решить эту проблему?