grabbee
@grabbee

Почему Mysql реплика работает очень медленно?

Реплика никак не успевает за мастером, отставание растет каждую секунду, и сейчас дойдет уже до суток. Сокращения отставания нет, только рост. Даже за ночь, когда на мастере минимальная нагрузка, отставание не сократилось. IOWAIT - 100% - как я понял работает в один поток на одно ядро процессора, так его полностью забивает. Реплика успевает судя по статистике сделать всего 30 запросов в секунду к базе. В тоже время на мастере до 1500 запросов в секунду. Слэв явно за ним так не успеет. Как узнать, почему так медленно работает реплика?
master-slave 5.7 ubuntu 16.04

Master_User: slave
                  Master_Port: 3306
                Connect_Retry: 60
              Master_Log_File: db-ssd-bin.000261
          Read_Master_Log_Pos: 428260237
               Relay_Log_File: db-slave2-relay-bin.000007
                Relay_Log_Pos: 87052675
        Relay_Master_Log_File: db-ssd-bin.000258
             Slave_IO_Running: Yes
            Slave_SQL_Running: Yes
              Replicate_Do_DB: 
          Replicate_Ignore_DB: 
           Replicate_Do_Table: 
       Replicate_Ignore_Table: 
      Replicate_Wild_Do_Table: 
  Replicate_Wild_Ignore_Table: 
                   Last_Errno: 0
                   Last_Error: 
                 Skip_Counter: 0
          Exec_Master_Log_Pos: 611339749
              Relay_Log_Space: 2847712884
              Until_Condition: None
               Until_Log_File: 
                Until_Log_Pos: 0
           Master_SSL_Allowed: No
           Master_SSL_CA_File: 
           Master_SSL_CA_Path: 
           Master_SSL_Cert: 
           Master_SSL_Cipher: 
           Master_SSL_Key: 
        Seconds_Behind_Master: 78349


SHOW FULL PROCESSLIST;
|  1 | system user |           | NULL | Connect |  2225 | Waiting for master to send event | NULL                  |
|  2 | system user |           | NULL | Connect | 78999 | System lock                      | NULL                  |


iotop
Total DISK READ :      50.26 K/s | Total DISK WRITE :     299.20 K/s
Actual DISK READ:      50.26 K/s | Actual DISK WRITE:    1116.20 K/s
  TID  PRIO  USER     DISK READ  DISK WRITE  SWAPIN     IO>    COMMAND                                                                                           
  180 be/3 root        0.00 B/s 1634.01 B/s  0.00 % 99.99 % [jbd2/vda1-8]
17723 be/4 mysql      40.69 K/s  144.41 K/s  0.00 %  5.89 % mysqld


atop
PRC | sys    0.30s |  user   0.18s |              |  #proc    125 | #trun      1 | #tslpi   166  | #tslpu     2 | #zombie    0  | clones     0 |               | #exit      0 |
CPU | sys       3% |  user      2% | irq       0% |               | idle    191% | wait    105%  |              | steal     0%  | guest     0% | curf 3.29GHz  | curscal   ?% |
cpu | sys       2% |  user      1% | irq       0% |               | idle     97% | cpu001 w  1%  |              | steal     0%  | guest     0% | curf 3.29GHz  | curscal   ?% |
cpu | sys       1% |  user      1% | irq       0% |               | idle     93% | cpu000 w  5%  |              | steal     0%  | guest     0% | curf 3.29GHz  | curscal   ?% |
cpu | sys       0% |  user      0% | irq       0% |               | idle      1% | cpu002 w 98%  |              | steal     0%  | guest     0% | curf 3.29GHz  | curscal   ?% |
CPL | avg1    2.03 |  avg5    2.32 |              |  avg15   2.30 |              |               | csw    14825 | intr    6458  |              |               | numcpu     3 |
MEM | tot     3.9G |  free  948.3M | cache   1.7G |  dirty   0.4M | buff  135.9M |               | slab   94.4M |               |              |               |              |
SWP | tot     0.0M |  free    0.0M |              |               |              |               |              |               |              | vmcom   3.3G  | vmlim   1.9G |
DSK |          vda |  busy     99% | read      30 |  write   1040 | KiB/r     11 |               | KiB/w     10 | MBr/s   0.03  | MBw/s   1.02 | avq     1.16  | avio 9.25 ms |
NET | transport    |  tcpi     707 | tcpo     707 |  udpi       0 | udpo       0 | tcpao      0  | tcppo      0 | tcprs      0  | tcpie      0 | tcpor      0  | udpip      0 |
NET | network      |  ipi      717 | ipo      707 |  ipfrw      0 | deliv    707 |               |              |               |              | icmpi      0  | icmpo      0 |
NET | ens3    ---- |  pcki     803 | pcko     707 |  si  347 Kbps | so   37 Kbps | coll       0  | mlti       0 | erri       0  | erro       0 | drpi       0  | drpo       0 |

  PID     RUID          EUID          THR       SYSCPU      USRCPU       VGROW      RGROW       RDDSK      WRDSK      ST     EXC      S     CPUNR       CPU     CMD         1/1
17688     mysql         mysql          35        0.27s       0.18s          0K         0K        336K      2880K      --       -      S         0        5%     mysqld
  180     root          root            1        0.02s       0.00s          0K         0K          0K        88K      --       -      D         2        0%     jbd2/vda1-8
  632     root          root            1        0.01s       0.00s          0K         0K          0K         0K      --       -      S         2        0%     kworker/2:1H
23416     root          root            1        0.00s       0.00s          0K         0K          0K         0K      --       -      R         0        0%     atop
  225     root          root            1        0.00s       0.00s          0K         0K          0K         0K      --       -      S         0        0%     systemd-journa
  481     syslog        syslog          4        0.00s       0.00s          0K         0K          0K         8K      --       -      S         2        0%     rsyslogd
  • Вопрос задан
  • 694 просмотра
Решения вопроса 1
MaxDukov
@MaxDukov
впишусь в проект как SRE/DevOps.

180 be/3 root 0.00 B/s 1634.01 B/s 0.00 % 99.99 % [jbd2/vda1-8]

журнал съедает 99,99% IO
кто-то активно пишет на диск. рецептов несколько.
- отключить журналирование (плохой вариант)
- изменить период fsync (тоже не айс, только если сервак надежный и с ИБП)
- еще раз посмотреть на список процессов. Кто-то же гадит. ps axf выложите?
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
@Fixid
покажите atop и iotop
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы