Mariadb Galera Cluster: почему кластер рандомно падает?

Question

vlarkanov @vlarkanov

MySQL

Mariadb Galera Cluster: почему кластер рандомно падает?

Приветствую коллеги.

Есть кластер (2 ноды 2x Intel Xeon E5-2670 2.6Ghz , 192Gb, RAID1 из 2 SSD + 1 арбитратор на виртуалке). Запросы на него идут через maxscale proxy, настроенную таким образом, чтобы все запросы (и чтения и записи) шли на одну ноду, а в случает если нода окажется недоступна - на вторую. Репликация бодренько идет, но через некоторое время может появиться один или два зависших запроса в статусе Query End, при попытке их "убить" статус меняется на Killed - и всё. Кластер при этом работает, всё ок. А потом (с момента запуска проходит от 10 минут до нескольких дней) кластер становится колом - перестает обрабатывать запросы.

В PROCESSLIST при этом висит некоторое количество запросов (8-10) в статусе Query End, при попытке их "убить" статус меняется на Killed.

В syslog\mysql-error.log может не быть ошибок совсем, а может быть что-то вроде

Aug 3 10:43:32 ru-tul-dc01-db-galera-node1 mysqld[1122]: 2017-08-03 10:43:32 139707425306368 [Warning] Aborted connection 2905 to db: 'basename' user: 'username' host: 'ip' (Got an error reading communication packets)
Aug 3 10:43:32 ru-tul-dc01-db-galera-node1 mysqld[1122]: 2017-08-03 10:43:32 139707424700160 [Warning] Aborted connection 2919 to db: 'basename' user: 'username' host' host: 'ip' (Got an error reading communication packets)

и\или множество

Aug 3 14:35:08 ru-tul-dc01-db-galera-node1 mysqld[1115]: 2017-08-03 14:35:08 140310822119168 [Warning] WSREP: certification interval for trx source: dcdccd42-7837-17837-11e7-a045-2a82ddbaac7a version: 3 local: 1 state: CERTIFYING flags: 1 conn_id: 1010 trx_id: 10244940 seqnos (l: 152638, g: 5113465, s: 5088151, d: -1, ts: 3445: 3445393337346) exceeds the limit of 16384)

Единственный способ вернуть кластер к жизни (на время) - перезапустить ноду на которую ведется запись. Переносить mysqld в одну NUMA ноду пробовал - проблема остается. Помогите пожалуйста понять где грабли, уже голову сломал. Конфиг прилагаю.

[client]
port = 3306
socket = /var/run/mysqld/mysqld.sock

# This was formally known as [safe_mysqld]. Both versions are currently parsed.
[mysqld_safe]
socket = /var/run/mysqld/mysqld.sock
nice = 0

[mysqld]
#
# * Basic Settings
#
user = mysql
pid-file = /var/run/mysqld/mysqld.pid
socket = /var/run/mysqld/mysqld.sock
port = 3306
basedir = /usr
datadir = /var/lib/mysql
tmpdir = /tmp
lc_messages_dir = /usr/share/mysql
lc_messages = en_US
skip-external-locking

# MyISAM #
key-buffer-size = 32M
myisam-recover = FORCE,BACKUP

# SAFETY #
max-allowed-packet = 16M
max-connect-errors = 1000000
skip-name-resolve

# DATA STORAGE #
datadir = /var/lib/mysql/

# BINARY LOGGING #
log-bin = /var/lib/mysql/mysql-bin
expire-logs-days = 14
#sync-binlog = 1
sync-binlog = 0

# CACHES AND LIMITS #
tmp-table-size = 32M
max-heap-table-size = 32M
query-cache-type = 0
query-cache-size = 0
max-connections = 500
thread-cache-size = 50
open-files-limit = 65535
table-definition-cache = 4096
table-open-cache = 4096

# INNODB #
innodb-flush-method = O_DIRECT
innodb-log-files-in-group = 2
innodb-log-file-size = 512M
innodb-flush-log-at-trx-commit = 1
innodb-file-per-table = 1
innodb-buffer-pool-size = 160G

# LOGGING #
log-error = /var/lib/mysql/mysql-error.log
log-queries-not-using-indexes = 1
slow-query-log = 1
slow-query-log-file = /var/lib/mysql/mysql-slow.log
!includedir /etc/mysql/conf.d/

#GALERA
binlog_format=ROW
default-storage-engine=innodb
innodb_autoinc_lock_mode=2
bind-address=0.0.0.0
# Galera Provider Configuration
wsrep_on=ON
wsrep_provider=/usr/lib/galera/libgalera_smm.so
# Galera Cluster Configuration
wsrep_cluster_name="galera-cluster"
wsrep_cluster_address="gcomm://ip1,ip1"
# Galera Synchronization Configuration
wsrep_sst_method=rsync
#wsrep_sst_method=xtrabackup
# Galera Node Configuration
wsrep_node_address="ip1"
wsrep_node_name="galera-node1"

wsrep_retry_autocommit = 4
wsrep_slave_threads = 64
wsrep_provider_options="gcache.size=5G; gcs.fc_limit = 320; gcs.fc_factor = 0.8; repl.commit_order=3;"
#wsrep_debug=ON
wsrep_log_conflicts=ON

Вопрос задан более трёх лет назад
1427 просмотров

Комментировать

Подписаться 3 Сложный Комментировать

Помогут разобраться в теме Все курсы

Stepik

PRO C#. Базы данных

2 месяца

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Java-разработчик + ИИ

9 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

4 комментария

vlarkanov @vlarkanov Автор вопроса

Запрос может висеть любой из простеньких SELECT\UPDATE\INSERT
например SELECT * FROM `table_nale` WHERE parameter = ? - которые в нормальных условиях выполняются очень быстро.

Юзать планируем как раз в режиме мастер-слейв, т.е. писать только на одну ноду, а в случае падения переключать запросы на вторую, резервную.

Написано более трёх лет назад
Night @maxtm

Query end может означать что другие ноды (одна или более) не дала апрув на завершение этого реквеста...

Я бы посоветовал отказаться от галеры, либо ее нужно как-то особенно готовить, чтобы она не сбоила, либо жить с ее вечными падениями...

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

Night: а разве нужен апрув на SELECT? Он же не затрагивает другие ноды.

Написано более трёх лет назад
Night @maxtm

vlarkanov: Вы правы - на селект не нужен...

Написано более трёх лет назад

49 комментариев

vlarkanov @vlarkanov Автор вопроса

Нужно включить? Сейчас выключена:
performance_schema | OFF |

Написано более трёх лет назад
shagguboy @shagguboy

vlarkanov: [mysqld]
performance_schema=ON

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy: включил.

MariaDB [(none)]> show variables like 'performance%';
+--------------------------------------------------------+-------+
| Variable_name | Value |
+--------------------------------------------------------+-------+
| performance_schema | ON |
| performance_schema_accounts_size | 100 |
| performance_schema_digests_size | 10000 |
| performance_schema_events_stages_history_long_size | 10000 |
| performance_schema_events_stages_history_size | 10 |
| performance_schema_events_statements_history_long_size | 10000 |
| performance_schema_events_statements_history_size | 10 |
| performance_schema_events_waits_history_long_size | 10000 |
| performance_schema_events_waits_history_size | 10 |
| performance_schema_hosts_size | 100 |
| performance_schema_max_cond_classes | 80 |
| performance_schema_max_cond_instances | 3300 |
| performance_schema_max_digest_length | 1024 |
| performance_schema_max_file_classes | 50 |
| performance_schema_max_file_handles | 32768 |
| performance_schema_max_file_instances | 3077 |
| performance_schema_max_mutex_classes | 200 |
| performance_schema_max_mutex_instances | 10000 |
| performance_schema_max_rwlock_classes | 40 |
| performance_schema_max_rwlock_instances | 5000 |
| performance_schema_max_socket_classes | 10 |
| performance_schema_max_socket_instances | 1020 |
| performance_schema_max_stage_classes | 150 |
| performance_schema_max_statement_classes | 188 |
| performance_schema_max_table_handles | 4000 |
| performance_schema_max_table_instances | 12500 |
| performance_schema_max_thread_classes | 50 |
| performance_schema_max_thread_instances | 1100 |
| performance_schema_session_connect_attrs_size | 512 |
| performance_schema_setup_actors_size | 100 |
| performance_schema_setup_objects_size | 100 |
| performance_schema_users_size | 100 |
+--------------------------------------------------------+-------+
32 rows in set (0.00 sec)

Что именно стоит посмотреть?

Написано более трёх лет назад
shagguboy @shagguboy

https://dev.mysql.com/doc/refman/5.5/en/performanc...

посмотреть что делает зависший процесс
select * from EVENTS_WAITS_CURRENT where THREAD_ID=3

посмотреть что ждали процессы
select THREAD_ID, EVENT_ID, EVENT_NAME, SOURCE, TIMER_WAIT, OBJECT_INSTANCE_BEGIN, OPERATION from EVENTS_WAITS_HISTORY --where THREAD_ID=3
order by THREAD_ID, EVENT_ID;

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy: обе таблицы пустые О_О.

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy: разобрался, были включены не все инструменты. Теперь включил. В SHOW PROCESSLIST Id зависшего запроса (сейчас он один) 3618. Значит ли это что мне нужно select * from EVENTS_WAITS_CURRENT where THREAD_ID=3618 или Id запроса и Id треда разные вещи?

Написано более трёх лет назад
shagguboy @shagguboy

vlarkanov: ну выведи ты всё из таблиц, посмотрим.

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy: сейчас как хотя бы один запрос повиснет, сделаю выгрузку:)

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy: вот что получилось. https://pastebin.com/1jAnnQVD

Написано более трёх лет назад
shagguboy @shagguboy

vlarkanov: wait/io/file/innodb/innodb_data_file

он у тя по I/O загибается

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy: не ожидал, там два неплохих SSD, нагрузка не очень велика. Что можно подкрутить для улучшения ситуации? Сейчас база под примерно четырехкратной нагрузкой относительно той, что ожидается, но хотелось бы иметь "запас прочности".

Написано более трёх лет назад
shagguboy @shagguboy

vlarkanov: iotop для начала глянь.

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

Как-то так (не полностью, только "верх"). Значения скачут, доходят др 3000K/s на запись, особенно на второй ноде.

на первой ноде:

Total DISK READ : 15.02 K/s | Total DISK WRITE : 1141.27 K/s
Actual DISK READ: 15.02 K/s | Actual DISK WRITE: 1704.40 K/s
TID PRIO USER DISK READ DISK WRITE SWAPIN IO> COMMAND
364 be/3 root 0.00 B/s 0.00 B/s 0.00 % 3.84 % [jbd2/md0p1-8]
12365 be/4 mysql 0.00 B/s 56.31 K/s 0.00 % 1.28 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
12677 be/4 mysql 0.00 B/s 18.77 K/s 0.00 % 1.20 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
7667 be/4 mysql 0.00 B/s 60.07 K/s 0.00 % 1.15 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
13137 be/4 mysql 0.00 B/s 30.03 K/s 0.00 % 0.94 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
9410 be/4 mysql 0.00 B/s 41.30 K/s 0.00 % 0.75 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
13094 be/4 mysql 0.00 B/s 22.53 K/s 0.00 % 0.63 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
12002 be/4 mysql 0.00 B/s 30.03 K/s 0.00 % 0.14 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
10536 be/4 mysql 0.00 B/s 18.77 K/s 0.00 % 0.10 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
1569 be/4 mysql 0.00 B/s 510.57 K/s 0.00 % 0.01 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
1234 be/4 mysql 0.00 B/s 37.54 K/s 0.00 % 0.00 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
1568 be/4 mysql 0.00 B/s 315.35 K/s 0.00 % 0.00 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
1588 be/4 mysql 15.02 K/s 0.00 B/s 0.00 % 0.00 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
1 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % init
2 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [kthreadd]
3 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [ksoftirqd/0]
5 be/0 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [kworker/0:0H]
8 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [rcu_sched]
9 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [rcu_bh]
10 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/0]
11 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [watchdog/0]
12 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [watchdog/1]
13 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/1]
14 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [ksoftirqd/1]
16 be/0 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [kworker/1:0H]
17 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [watchdog/2]

на второй ноде:

Total DISK READ : 15.40 K/s | Total DISK WRITE : 1432.39 K/s
Actual DISK READ: 15.40 K/s | Actual DISK WRITE: 2.07 M/s
TID PRIO USER DISK READ DISK WRITE SWAPIN IO> COMMAND
384 be/3 root 0.00 B/s 0.00 B/s 0.00 % 7.40 % [jbd2/md0p1-8]
31984 be/4 mysql 0.00 B/s 7.70 K/s 0.00 % 1.01 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31959 be/4 mysql 0.00 B/s 15.40 K/s 0.00 % 0.77 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31980 be/4 mysql 0.00 B/s 7.70 K/s 0.00 % 0.71 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31942 be/4 mysql 0.00 B/s 7.70 K/s 0.00 % 0.50 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31968 be/4 mysql 0.00 B/s 15.40 K/s 0.00 % 0.50 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31950 be/4 mysql 0.00 B/s 7.70 K/s 0.00 % 0.48 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31976 be/4 mysql 0.00 B/s 7.70 K/s 0.00 % 0.46 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31951 be/4 mysql 0.00 B/s 7.70 K/s 0.00 % 0.28 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31944 be/4 mysql 0.00 B/s 11.55 K/s 0.00 % 0.24 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31960 be/4 mysql 0.00 B/s 7.70 K/s 0.00 % 0.24 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31985 be/4 mysql 0.00 B/s 7.70 K/s 0.00 % 0.24 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31971 be/4 mysql 0.00 B/s 7.70 K/s 0.00 % 0.23 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31962 be/4 mysql 0.00 B/s 7.70 K/s 0.00 % 0.23 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31963 be/4 mysql 0.00 B/s 7.70 K/s 0.00 % 0.23 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31898 be/4 mysql 0.00 B/s 7.70 K/s 0.00 % 0.23 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31940 be/4 mysql 0.00 B/s 7.70 K/s 0.00 % 0.22 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31961 be/4 mysql 0.00 B/s 7.70 K/s 0.00 % 0.19 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31957 be/4 mysql 0.00 B/s 7.70 K/s 0.00 % 0.16 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31973 be/4 mysql 0.00 B/s 7.70 K/s 0.00 % 0.13 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31981 be/4 mysql 0.00 B/s 7.70 K/s 0.00 % 0.12 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8103926
31978 be/4 mysql 0.00 B/s 7.70 K/s 0.00 % 0.11 % mysqld --wsrep_start_position=ac061580-7921-11e7-9ec5-9ad23d7fc3ea:8

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy: и ещё для полноты картины:

SELECT EVENT_NAME, SUM_TIMER_WAIT FROM events_waits_summary_global_by_event_name where event_name like '%innodb%' ORDER BY SUM_TIMER_WAIT DESC LIMIT 20;
+------------------------------------------------+-----------------+
| EVENT_NAME | SUM_TIMER_WAIT |
+------------------------------------------------+-----------------+
| wait/io/file/innodb/innodb_data_file | 577544032532000 |
| wait/io/file/innodb/innodb_log_file | 26469590577500 |
| wait/synch/mutex/innodb/flush_list_mutex | 0 |
| wait/synch/mutex/innodb/fts_bg_threads_mutex | 0 |
| wait/synch/mutex/innodb/fts_delete_mutex | 0 |
| wait/synch/mutex/innodb/fts_optimize_mutex | 0 |
| wait/synch/mutex/innodb/fts_doc_id_mutex | 0 |
| wait/synch/mutex/innodb/log_flush_order_mutex | 0 |
| wait/synch/mutex/innodb/hash_table_mutex | 0 |
| wait/synch/mutex/innodb/ibuf_bitmap_mutex | 0 |
| wait/synch/mutex/innodb/fil_system_mutex | 0 |
| wait/synch/mutex/innodb/file_format_max_mutex | 0 |
| wait/synch/mutex/innodb/innobase_share_mutex | 0 |
| wait/io/file/innodb/innodb_temp_file | 0 |
| wait/synch/mutex/innodb/buf_pool_mutex | 0 |
| wait/synch/mutex/innodb/buf_pool_zip_mutex | 0 |
| wait/synch/mutex/innodb/cache_last_read_mutex | 0 |
| wait/synch/mutex/innodb/dict_foreign_err_mutex | 0 |
| wait/synch/mutex/innodb/dict_sys_mutex | 0 |
| wait/synch/mutex/innodb/recalc_pool_mutex | 0 |
+------------------------------------------------+-----------------+
20 rows in set (0.01 sec)

Написано более трёх лет назад
shagguboy @shagguboy

vlarkanov: ну для начала проверь свободное место на всех разделах

Написано более трёх лет назад
shagguboy @shagguboy

https://github.com/major/MySQLTuner-perl

вот это еще запусти и дай результат.

Написано более трёх лет назад

shagguboy @shagguboy

SELECT EVENT_NAME, 
       COUNT_READ, 
       IFNULL(ROUND(SUM_NUMBER_OF_BYTES_READ/1024/1024/1024, 2), 0.00) AS READ_GB,
       IFNULL(ROUND((SUM_NUMBER_OF_BYTES_READ/COUNT_READ)/1024, 2), 0.00) AS AVG_READ_KB,
       COUNT_WRITE, 
       IFNULL(ROUND(SUM_NUMBER_OF_BYTES_WRITE/1024/1024/1024, 2), 0.00) AS WRITE_GB,
       IFNULL(ROUND((SUM_NUMBER_OF_BYTES_WRITE/COUNT_WRITE)/1024, 2), 0.00) AS AVG_WRITE_KB,
       IFNULL(ROUND((SUM_NUMBER_OF_BYTES_READ + SUM_NUMBER_OF_BYTES_WRITE)/1024/1024/1024, 2), 0.00) AS TOTAL_GB, 
       IFNULL(100-((SUM_NUMBER_OF_BYTES_READ/(SUM_NUMBER_OF_BYTES_READ+SUM_NUMBER_OF_BYTES_WRITE))*100), 0.00) AS WRITE_PCT 
  FROM FILE_SUMMARY_BY_EVENT_NAME

Написано более трёх лет назад

vlarkanov @vlarkanov Автор вопроса

shagguboy:

поменял innodb_flush_log_at_trx_commit с 1 на 0.

Вот вывод запроса:
+--------------------------------------+------------+---------+-------------+-------------+----------+--------------+----------+-----------+
| EVENT_NAME | COUNT_READ | READ_GB | AVG_READ_KB | COUNT_WRITE | WRITE_GB | AVG_WRITE_KB | TOTAL_GB | WRITE_PCT |
+--------------------------------------+------------+---------+-------------+-------------+----------+--------------+----------+-----------+
| wait/io/file/sql/map | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/binlog | 1 | 0.00 | 0.36 | 90199 | 0.10 | 1.19 | 0.10 | 99.9997 |
| wait/io/file/sql/binlog_index | 2 | 0.00 | 0.55 | 1 | 0.00 | 0.56 | 0.00 | 33.9623 |
| wait/io/file/sql/relaylog | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/relaylog_index | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/casetest | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/dbopt | 4 | 0.00 | 0.06 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/des_key_file | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/ERRMSG | 3 | 0.00 | 22.80 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/select_to_file | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/file_parser | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/FRM | 72 | 0.00 | 1.09 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/global_ddl_log | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/load | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/LOAD_FILE | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/log_event_data | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/log_event_info | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/master_info | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/misc | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/partition | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/pid | 0 | 0.00 | 0.00 | 1 | 0.00 | 0.00 | 0.00 | 100.0000 |
| wait/io/file/sql/query_log | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/relay_log_info | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/send_file | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/slow_log | 0 | 0.00 | 0.00 | 4156 | 0.00 | 0.36 | 0.00 | 100.0000 |
| wait/io/file/sql/tclog | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/trigger_name | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/trigger | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/init | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/binlog_state | 1 | 0.00 | 0.01 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/mysys/proc_meminfo | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/mysys/charset | 1 | 0.00 | 22.95 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/mysys/cnf | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/sql/wsrep_gra_log | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/myisam/data_tmp | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/myisam/dfile | 25 | 0.00 | 0.58 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/myisam/kfile | 36 | 0.00 | 0.23 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/myisam/log | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/csv/metadata | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/csv/data | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/csv/update | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/myisammrg/MRG | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/innodb/innodb_data_file | 46734 | 0.72 | 16.20 | 18003 | 0.27 | 16.00 | 1.00 | 27.5642 |
| wait/io/file/innodb/innodb_log_file | 6 | 0.00 | 11.08 | 3103 | 0.09 | 29.03 | 0.09 | 99.9262 |
| wait/io/file/innodb/innodb_temp_file | 0 | 0.00 | 0.00 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/aria/translog | 2 | 0.00 | 4.02 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
| wait/io/file/aria/MAI | 7440 | 0.00 | 0.65 | 177250 | 0.01 | 0.03 | 0.01 | 52.4782 |
| wait/io/file/aria/MAD | 3721 | 0.03 | 8.00 | 0 | 0.00 | 0.00 | 0.03 | 0.0000 |
| wait/io/file/aria/control | 1 | 0.00 | 0.05 | 0 | 0.00 | 0.00 | 0.00 | 0.0000 |
+--------------------------------------+------------+---------+-------------+-------------+----------+--------------+----------+-----------+

вот данные о месте:

df -h
Файловая система Размер Использовано Дост Использовано% Cмонтировано в
/dev/md0p1 176G 95G 72G 57% /
udev 10M 0 10M 0% /dev
tmpfs 38G 9,6M 38G 1% /run
tmpfs 95G 0 95G 0% /dev/shm
tmpfs 5,0M 0 5,0M 0% /run/lock
tmpfs 95G 0 95G 0% /sys/fs/cgroup

А mysqltuner ругается

[!!] Attempted to use login credentials from debian maintenance account, but they failed.

Написано более трёх лет назад
shagguboy @shagguboy

vlarkanov: ну прочти наконец инструкцию как mysqltuner запустить

Написано более трёх лет назад
shagguboy @shagguboy

vlarkanov: у тебя самый нагруженный файл почему то errmsg.sys

запусти ка SELECT * FROM file_summary_by_instance

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy: прочитал, осознал:) вот что говорит тюнер https://pastebin.com/yJXwLrU9

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy: результат SELECT * FROM file_summary_by_instance огромный и при использовании опции INTO FILE нечитаем. Как бы половчее его выгрузить? Под рукой командная строка и phpmyadmin

Написано более трёх лет назад
shagguboy @shagguboy

vlarkanov: открой для себя ORDER BY .... LIMIT 30

Написано более трёх лет назад
shagguboy @shagguboy

vlarkanov: у тебя за 52 минуты
[[0;31m!![0m] Aborted connections: 40.43% (729/1803)

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy: не в том дело - слишком много столбцов. Что нам интересенее всего из | FILE_NAME | EVENT_NAME | OBJECT_INSTANCE_BEGIN | COUNT_STAR | SUM_TIMER_WAIT | MIN_TIMER_WAIT | AVG_TIMER_WAIT | MAX_TIMER_WAIT | COUNT_READ | SUM_TIMER_READ | MIN_TIMER_READ | AVG_TIMER_READ | MAX_TIMER_READ | SUM_NUMBER_OF_BYTES_READ | COUNT_WRITE | SUM_TIMER_WRITE | MIN_TIMER_WRITE | AVG_TIMER_WRITE | MAX_TIMER_WRITE | SUM_NUMBER_OF_BYTES_WRITE | COUNT_MISC | SUM_TIMER_MISC | MIN_TIMER_MISC | AVG_TIMER_MISC | MAX_TIMER_MISC | ?

Написано более трёх лет назад
shagguboy @shagguboy

vlarkanov:

SELECT event_name AS event, avg_timer_wait as avg_latency
FROM performance_schema.events_waits_summary_global_by_event_name
WHERE event_name != 'idle'
AND sum_timer_wait > 0
ORDER BY sum_timer_wait DESC LIMIT 30

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy: +--------------------------------------------------------+----------------+
| event | avg_latency |
+--------------------------------------------------------+----------------+
| wait/synch/cond/threadpool/worker_cond | 35213333053000 |
| wait/synch/cond/mysys/my_thread_var::suspend | 33200345085000 |
| wait/synch/cond/sql/MDL_context::COND_wait_status | 41517817327000 |
| wait/synch/cond/sql/THD::COND_wakeup_ready | 26651976360500 |
| wait/synch/cond/aria/BITMAP::bitmap_cond | 27338162346500 |
| wait/io/table/sql/handler | 761500 |
| wait/synch/cond/aria/SHARE::key_del_cond | 59591554702500 |
| wait/io/socket/sql/client_connection | 10826000 |
| wait/io/file/innodb/innodb_data_file | 482597000 |
| wait/io/file/innodb/innodb_log_file | 1014986500 |
| wait/synch/mutex/sql/THD::LOCK_wsrep_thd | 220000 |
| wait/synch/mutex/sql/THD::LOCK_thd_data | 160500 |
| wait/io/file/sql/binlog | 23197500 |
| wait/io/file/aria/MAI | 3185000 |
| wait/lock/table/sql/handler | 813500 |
| wait/synch/rwlock/sql/MDL_lock::rwlock | 514500 |
| wait/io/file/aria/MAD | 7760500 |
| wait/io/file/sql/slow_log | 10658000 |
| wait/io/file/sql/FRM | 39013000 |
| wait/io/file/myisam/kfile | 30629000 |
| wait/io/file/sql/binlog_index | 138213500 |
| wait/io/file/csv/metadata | 201990000 |
| wait/synch/mutex/aria/SHARE::bitmap::bitmap_lock | 70000 |
| wait/synch/mutex/innodb/autoinc_mutex | 217500 |
| wait/io/file/myisam/dfile | 1502500 |
| wait/synch/mutex/sql/TABLE_SHARE::tdc.LOCK_table_share | 182500 |
| wait/synch/rwlock/innodb/dict_table_stats | 193000 |
| wait/io/file/sql/file_parser | 39333500 |
| wait/io/file/sql/select_to_file | 50773500 |
| wait/io/file/sql/dbopt | 4639500 |
+--------------------------------------------------------+----------------+

Написано более трёх лет назад
shagguboy @shagguboy

vlarkanov:
ну и для верности
select * from waits_global_by_latency;

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy:

select * from waits_global_by_latency;
ERROR 1146 (42S02): Table 'performance_schema.waits_global_by_latency' doesn't exist

Хотя вроде все инструменты performance_schema включены
UPDATE setup_instruments SET ENABLED = 'YES', TIMED = 'YES';
UPDATE setup_consumers SET ENABLED = 'YES';

Написано более трёх лет назад
shagguboy @shagguboy

vlarkanov: в 5.7 только появилась.

Написано более трёх лет назад
shagguboy @shagguboy

vlarkanov: я таки склоняюсь что оно у тя по ИО висит. первые 4 ожиданий это синхронизация потоков, потом чтото, что я не знаю, потом ИО, потом сеть.

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy: понял. Что-то кроме замены железа может помочь? Настройка параметров и т.д.

Написано более трёх лет назад
shagguboy @shagguboy

vlarkanov: ща попробуем выкрутить всё в ноль. и посмотрим.

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy: что именно выкрутить в ноль?

Написано более трёх лет назад
shagguboy @shagguboy

vlarkanov:

thread_cache_size (> 128)
innodb_log_file_size should be (=20G) if possible, so InnoDB total log files size equals to 25% of buffer pool size.
innodb_buffer_pool_instances(=64)
gcs.limit= wsrep_slave_threads * 5
Set wsrep_slave_threads to 1 in case of HA_ERR_FOUND_DUPP_KEY crash on slave
gcs.fc_limit= wsrep_slave_threads * 5
gcs.fc_factor=0.8
set up parameter wsrep_notify_cmd to be notify

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy:

Теперь выглядит так:

thread_cache_size (> 256)
gcs.limit= wsrep_slave_threads * 5 (это ставить не буду, не стартует. и на сайте galera о такой переменной не знают)
Set wsrep_slave_threads to 1 in case of HA_ERR_FOUND_DUPP_KEY crash on slave (нет такой ошибки)
set up parameter wsrep_notify_cmd to be notify (нотифай пока не нужен).

Поглядим что получится)

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy: таки опять упало) При этом в iotop и в atop отчетливо видно что нагрузка на диск пустяковая.

Написано более трёх лет назад
shagguboy @shagguboy

vlarkanov: и ты конечно запустил
select * from EVENTS_WAITS_CURRENT where THREAD_ID= ИД_ЗАВИСШЕГО_ПРОЦЕССА

и покажешь результат

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy:

Запрос

| 16421 | user| 172.20.71.92:42720 | database| Execute | 90 | Unlocking tables | INSERT INTO `cc_card` (`id`, `creationdate`, `firstusedate`, `expirationdate`, `enableexpire`, `expi | 0.000 |

select * from events_waits_current where THREAD_ID=16421;
Empty set (0.00 sec)

Ведь правильно понимаю, что THREAD_ID это ID запроса (в нашем случае 16421 ) ?

Написано более трёх лет назад
shagguboy @shagguboy

vlarkanov: вот ты трудный. просто select * from EVENTS_WAITS_CURRENT
?

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy:

Вот запросы:
| 567 | user | IP:55616 | database | Execute | 7030 | init | UPDATE cc_call SET sessiontime = 33, real_sessiontime = 33 WHERE id = 123750317 | 0.000 |
| 908 | user | IP:55940 | database | Execute | 5842 | NULL | SELECT * FROM `cc_card` WHERE useralias = '11462133'
а вот вывод select * from EVENTS_WAITS_CURRENT

https://pastebin.com/c10pP9ri

Написано более трёх лет назад
shagguboy @shagguboy

сеть. запусти mysqltuner, сколько там aborted connection?

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy: 4

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy: Так. Проблема оформилась в окончательном виде. Если в качестве "мастера" (и чтение и запись) использовать 1ю ноду (а со второй только чтение) - вышеуказанные проблемы. Но если "мастером" поставить 2ю ноду - все хорошо, запросы не виснут. Сервера абсолютно идентичны железно\программно. Для чистоты эксперимента я вчера переставил ос на проблемной первой ноде, скопировал туда (подправив имена-адреса) конфиги мускула и галеры со второй ноды - проблема не пропало. Что-то уже пахнет чертовщиной:)

Написано более трёх лет назад
shagguboy @shagguboy

vlarkanov: есть еще много конфигов.

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy: настраивал-то я только сеть, скуль, галеру (отдельный файл) да груб, на обеих нодах.

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy: еще поменял сетевой кабель и теперь обе ноды в одной циске (раньше были в разных). Запросы один шут виснут, если для записи выбирать первую ноду. Мистика.

Написано более трёх лет назад
shagguboy @shagguboy

ну там промежуточных этапов не так много. тупо перебором найди.

Написано более трёх лет назад
vlarkanov @vlarkanov Автор вопроса

shagguboy: ну что сказать... Перетащил оба сервера на Percona (c галерой ессно) - больше запросы не виснут. С теми же конфигами. Видимо, баг MariaDB.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

MySQL

Простой
Странное поведение COALESCE в SQL запросе?
- 1 подписчик
- 15 мая
- 91 просмотр
1

ответ
MySQL

+2 ещё

Простой
Как исправить ошибку could not load file or assembly «System.Data.SqlClient»?
- 1 подписчик
- 06 мая
- 69 просмотров
1

ответ
MySQL

+1 ещё

Простой
Как поднять контейнер mysql через wsl?
- 1 подписчик
- 21 мар.
- 332 просмотра
2

ответа
MySQL

+1 ещё

Простой
Как удалить число содержащееся в ячейке таблицы бд Mysql среди чисел через запятую, если таких чисел 2 или более удалить только первое найденое?
- 1 подписчик
- 19 февр.
- 227 просмотров
1

ответ
MySQL

Простой
Выдаёт ошибку #1062 — Дублирующаяся запись '??????' по ключу 'PRIMARY', как исправить?
- 1 подписчик
- 16 февр.
- 202 просмотра
2

ответа
MySQL

Простой
Как оптимизировать или создать правильно mysql запрос?
- 1 подписчик
- 11 февр.
- 215 просмотров
2

ответа
PHP

+1 ещё

Простой
Как получить 3 массива из одного запроса?
- 2 подписчика
- 01 февр.
- 299 просмотров
4

ответа
MySQL

+1 ещё

Простой
Почему не работает кастомное поле в CDR?
- 1 подписчик
- 20 янв.
- 155 просмотров
1

ответ
MySQL

+2 ещё

Средний
Как определить, необходимую версию tomcat и mysql?
- 1 подписчик
- 07 янв.
- 195 просмотров
1

ответ
MySQL

Средний
Почему время в mysql опережает на пару секунд?
- 4 подписчика
- 06 янв.
- 437 просмотров
4

ответа
Показать ещё Загружается…

Answer 1 · 2017-08-04 17:25:17

А что за запрос то висит в состоянии query end?

Был печальный опыт с Галерой, расскажу вкратце.

При определенном векторе нагрузки (до сих пор не могли вручную повторить эти действия), одна из нод падала. Падала всегда более нагруженная нода.
При этом, корраптились все данные базы, и при запуске начинала вытаскивать ВСЮ базу с другой ноды.
Т.к. размер базы был >100gb - это занимало порой до одного часа.

Мы исследовали этот вопрос, но однозначно ответить на вопрос - что приводило к падению одной из нод - не нашли.

В логах было очень много инфы о состояние базы до момента падения, кор-дампы и прочее. Но дебажить марию мы не решились :)

Вышли из ситуации убрав мастер-мастер репликацию, и сделали классическую master-slave. Немного допилили софт, и теперь - за несколько последних месяцев - ни одного падения.

Вывод - не использовать галеру, без прямой необходимости.
Осталось впечатление что продукт еще сырой...

Answer 2 · 2017-08-04 18:12:55

shagguboy @shagguboy

performance schema

Ответ написан более трёх лет назад

49 комментариев

Mariadb Galera Cluster: почему кластер рандомно падает?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт