Как заменить реплику на том-же хосте glusterfs?

Question

Михаил Стручалин @mmmex

linux admin

GlusterFS

Как заменить реплику на том-же хосте glusterfs?

Добрый день, коллеги!
Ситуация: 3 ноды в кластере gluster, ОС Centos7:

# gluster --version
glusterfs 9.6
Repository revision: git://git.gluster.org/glusterfs.git
Copyright (c) 2006-2016 Red Hat, Inc. <https://www.gluster.org/>
GlusterFS comes with ABSOLUTELY NO WARRANTY.
It is licensed to you under your choice of the GNU Lesser
General Public License, version 3 or any later version (LGPLv3
or later), or the GNU General Public License, version 2 (GPLv2),
in all cases as published by the Free Software Foundation.
# gluster volume info
Volume Name: gv0
Type: Replicate
Volume ID: 0ce5aeb8-59f0-46a7-8523-7cd2b1cc1d6b
Status: Started
Snapshot Count: 0
Number of Bricks: 1 x 3 = 3
Transport-type: tcp
Bricks:
Brick1: bx-app01:/data/brick1/gv0
Brick2: bx-app02:/data/brick1/gv0
Brick3: bx-app03:/data/brick1/gv0
Options Reconfigured:
cluster.granular-entry-heal: on
storage.fips-mode-rchecksum: on
transport.address-family: inet
nfs.disable: on
performance.client-io-threads: off

В познавательных целях, ноду bx-app03 удаляю и пытаюсь восстановить с такими-же сетевыми параметрами и UUID используя такой алгоритм (статья, см. 10.6.2.):
1. Поднимаю новую (далее по тексту свежая) ноду bx-app03, устанавливаю всё необходимое ПО (glusterfs-server, lvm2), создаю каталог /data/brick1/gv0, если сервис glusterd был запущен останавливаю (systemctl stop glusterd).
2. Получаю UUID вышедшего из строя сервера с другого сервера (bx-app01):

# gluster peer status
Number of Peers: 2

Hostname: bx-app02.org.test
Uuid: 162ebb8c-f055-40df-a4a2-002d6c3baf3b
State: Peer in Cluster (Connected)
Other names:
bx-app02

Hostname: bx-app03
Uuid: 5a9d71f7-d4ab-4945-a1b8-d39c189c3fb2
State: Peer in Cluster (Disconnected)

3. На свежем узле (bx-app03) редактирую файл /var/lib/glusterd/glusterd.info и меняю UUID на старый, полученный на предыдущем шаге (5a9d71f7-d4ab-4945-a1b8-d39c189c3fb2).
4. С оставшихся двух узлов (bx-app01, bx-app02) копирую все файлы из каталога /var/lib/glusterd/peers/ на свежий узел bx-app03 в ту-же папку, за исключением файла с UUID самого узла bx-app03 (5a9d71f7-d4ab-4945-a1b8-d39c189c3fb2), т.е. в папке /var/lib/glusterd/peers/ на bx-app03 должно быть два файла с именами соответствующих UUID узлов bx-app01 и bx-app02.
5. Получаю идентификатор (trusted.glusterfs.volume-id) тома из существующего brick на сервере bx-app01:

# getfattr -d -m. -ehex /data/brick1/gv0
getfattr: Removing leading '/' from absolute path names
# file: data/brick1/gv0
security.selinux=0x756e636f6e66696e65645f753a6f626a6563745f723a676c7573746572645f627269636b5f743a733000
trusted.afr.dirty=0x000000000000000000000000
trusted.afr.gv0-client-2=0x000000000000000200000002
trusted.gfid=0x00000000000000000000000000000001
trusted.glusterfs.mdata=0x0100000000000000000000000064034270000000002d71da40000000006403425900000000033ca8d30000000063ffd45800000000376d7911
trusted.glusterfs.volume-id=0x0ce5aeb859f046a785237cd2b1cc1d6b

6. Устанавливаю этот идентификатор на свежем узле bx-app03:

# setfattr -n trusted.glusterfs.volume-id -v 0x0ce5aeb859f046a785237cd2b1cc1d6b /data/brick1/gv0

7. Монтирую том gluster в /mnt на свежем узле:
# mount -t glusterfs bx-app01:/gv0 /mnt
8. Далее, выполняю операции чтобы изменить расширенные атрибуты автоматической репликации файлов, чтобы процесс восстановления происходил с другого brick (bx-app01:/data/brick1/gv0) на свежий (bx-app03:/data/brick1/gv0). Создаю новую папку, которой не существует:
# mkdir /mnt/test
9. Удаляю папку, и устанавливаю расширенные атрибуты:

# rmdir /mnt/test
# setfattr -n trusted.non-existent-key -v abc /mnt
# setfattr -x trusted.non-existent-key /mnt

10. Убеждаюсь, что расширенный атрибут trusted.afr.gv0-client-0 на других репликах не равен 0 (нулю):

# getfattr -d -m. -e hex /data/brick1/gv0
getfattr: Removing leading '/' from absolute path names
# file: data/brick1/gv0
security.selinux=0x756e636f6e66696e65645f753a6f626a6563745f723a676c7573746572645f627269636b5f743a733000
trusted.afr.dirty=0x000000000000000000000000
trusted.afr.gv0-client-2=0x000000000000000200000002
trusted.gfid=0x00000000000000000000000000000001
trusted.glusterfs.mdata=0x0100000000000000000000000064034270000000002d71da40000000006403425900000000033ca8d30000000063ffd45800000000376d7911
trusted.glusterfs.volume-id=0x0ce5aeb859f046a785237cd2b1cc1d6b

11. Вроде-бы все ок, запускаю сервис на свежем узле:

# systemctl start glusterd
# gluster volume heal gv0
Launching heal operation to perform index self heal on volume gv0 has been unsuccessful:
Self-heal daemon is not running. Check self-heal daemon log file.

Собственно в этом вопрос и состоит. Как это разрешить?

Вопрос задан более двух лет назад
434 просмотра

3 комментария

Подписаться 1 Средний 3 комментария

Михаил Стручалин @mmmex Автор вопроса

Лог:

# cat glfsheal-gv0.log 
[2023-03-04 13:10:26.534541 +0000] I [io-stats.c:3708:ios_sample_buf_size_configure] 0-gv0: Configure ios_sample_buf  size is 1024 because ios_sample_interval is 0
[2023-03-04 13:10:26.538878 +0000] I [MSGID: 104045] [glfs-primary.c:81:notify] 0-gfapi: New graph coming up [{graph-uuid=62782d61-7070-3033-2e6f-72672e746573}, {id=0}] 
[2023-03-04 13:10:26.538997 +0000] I [MSGID: 114020] [client.c:2319:notify] 0-gv0-client-0: parent translators are ready, attempting connect on transport [] 
[2023-03-04 13:10:26.545578 +0000] I [MSGID: 114020] [client.c:2319:notify] 0-gv0-client-1: parent translators are ready, attempting connect on transport [] 
[2023-03-04 13:10:26.547136 +0000] I [rpc-clnt.c:1972:rpc_clnt_reconfig] 0-gv0-client-0: changing port to 49152 (from 0)
[2023-03-04 13:10:26.547209 +0000] I [socket.c:848:__socket_shutdown] 0-gv0-client-0: intentional socket shutdown(9)
[2023-03-04 13:10:26.551421 +0000] I [MSGID: 114020] [client.c:2319:notify] 0-gv0-client-2: parent translators are ready, attempting connect on transport [] 
[2023-03-04 13:10:26.557803 +0000] I [MSGID: 114057] [client-handshake.c:1128:select_server_supported_programs] 0-gv0-client-0: Using Program [{Program-name=GlusterFS 4.x v1}, {Num=1298437}, {Version=400}] 
[2023-03-04 13:10:26.558051 +0000] I [rpc-clnt.c:1972:rpc_clnt_reconfig] 0-gv0-client-1: changing port to 49152 (from 0)
[2023-03-04 13:10:26.558107 +0000] I [socket.c:848:__socket_shutdown] 0-gv0-client-1: intentional socket shutdown(11)
Final graph:
+------------------------------------------------------------------------------+
  1: volume gv0-client-0
  2:     type protocol/client
  3:     option opversion 90000
  4:     option clnt-lk-version 1
  5:     option volfile-checksum 0
  6:     option volfile-key gv0
  7:     option client-version 9.6
  8:     option process-name gfapi.glfsheal
  9:     option process-uuid CTX_ID:73b4cc5e-f3c7-4410-9577-b134bb54133d-GRAPH_ID:0-PID:3776-HOST:bx-app03.org.test-PC_NAME:gv0-client-0-RECON_NO:-0
 10:     option fops-version 1298437
 11:     option ping-timeout 42
 12:     option remote-host bx-app01
 13:     option remote-subvolume /data/brick1/gv0
 14:     option transport-type socket
 15:     option transport.address-family inet
 16:     option username f24811f8-dd3c-49ab-a9f3-0e6cbe5dddbf
 17:     option password ae566c26-30b0-442e-942d-73ad09e7df55
 18:     option transport.socket.ssl-enabled off
 19:     option transport.tcp-user-timeout 0
 20:     option transport.socket.keepalive-time 20
 21:     option transport.socket.keepalive-interval 2
 22:     option transport.socket.keepalive-count 9
 23:     option strict-locks off
 24:     option send-gids true
 25: end-volume
 26:  
 27: volume gv0-client-1
 28:     type protocol/client
 29:     option ping-timeout 42
 30:     option remote-host bx-app02
 31:     option remote-subvolume /data/brick1/gv0
 32:     option transport-type socket
 33:     option transport.address-family inet
 34:     option username f24811f8-dd3c-49ab-a9f3-0e6cbe5dddbf
 35:     option password ae566c26-30b0-442e-942d-73ad09e7df55
 36:     option transport.socket.ssl-enabled off
 37:     option transport.tcp-user-timeout 0
 38:     option transport.socket.keepalive-time 20
 39:     option transport.socket.keepalive-interval 2
 40:     option transport.socket.keepalive-count 9
 41:     option strict-locks off
 42:     option send-gids true
 43: end-volume
 44:  
 45: volume gv0-client-2
 46:     type protocol/client
 47:     option ping-timeout 42
 48:     option remote-host bx-app03
 49:     option remote-subvolume /data/brick1/gv0
 50:     option transport-type socket
 51:     option transport.address-family inet
 52:     option username f24811f8-dd3c-49ab-a9f3-0e6cbe5dddbf
 53:     option password ae566c26-30b0-442e-942d-73ad09e7df55
 54:     option transport.socket.ssl-enabled off
 55:     option transport.tcp-user-timeout 0
 56:     option transport.socket.keepalive-time 20
 57:     option transport.socket.keepalive-interval 2
 58:     option transport.socket.keepalive-count 9
 59:     option strict-locks off
 60:     option send-gids true
 61: end-volume
 62:  
 63: volume gv0-replicate-0
 64:     type cluster/replicate
 65:     option background-self-heal-count 0
 66:     option halo-enabled off
 67:     option afr-pending-xattr gv0-client-0,gv0-client-1,gv0-client-2
 68:     option volume-id 0ce5aeb8-59f0-46a7-8523-7cd2b1cc1d6b
 69:     option granular-entry-heal on
 70:     option use-compound-fops off
 71:     option use-anonymous-inode yes
 72:     subvolumes gv0-client-0 gv0-client-1 gv0-client-2
 73: end-volume
 74:  
 75: volume gv0-dht
 76:     type cluster/distribute
 77:     option lock-migration off
 78:     option force-migration off
 79:     subvolumes gv0-replicate-0
 80: end-volume
 81:  
 82: volume gv0-utime
 83:     type features/utime
 84:     option noatime on
 85:     subvolumes gv0-dht
 86: end-volume
 87:  
 88: volume gv0-write-behind
 89:     type performance/write-behind
 90:     subvolumes gv0-utime
 91: end-volume
 92:  
 93: volume gv0-open-behind
 94:     type performance/open-behind
 95:     subvolumes gv0-write-behind
 96: end-volume
 97:  
 98: volume gv0-quick-read
 99:     type performance/quick-read
100:     subvolumes gv0-open-behind
101: end-volume
102:  
103: volume gv0-md-cache
104:     type performance/md-cache
105:     subvolumes gv0-quick-read
106: end-volume
107:  
108: volume gv0
109:     type debug/io-stats
110:     option log-level INFO
111:     option threads 16
112:     option latency-measurement off
113:     option count-fop-hits off
114:     option global-threading off
115:     subvolumes gv0-md-cache
116: end-volume
117:  
118: volume meta-autoload
119:     type meta
120:     subvolumes gv0
121: end-volume
122:  
+------------------------------------------------------------------------------+
[2023-03-04 13:10:26.569390 +0000] I [MSGID: 114046] [client-handshake.c:857:client_setvolume_cbk] 0-gv0-client-0: Connected, attached to remote volume [{conn-name=gv0-client-0}, {remote_subvol=/data/brick1/gv0}] 
[2023-03-04 13:10:26.569441 +0000] I [MSGID: 108005] [afr-common.c:6065:__afr_handle_child_up_event] 0-gv0-replicate-0: Subvolume 'gv0-client-0' came back up; going online. 
[2023-03-04 13:10:26.570813 +0000] E [MSGID: 114058] [client-handshake.c:1201:client_query_portmap_cbk] 0-gv0-client-2: failed to get the port number for remote subvolume. Please run gluster volume status on server to see if brick process is running [] 
[2023-03-04 13:10:26.570882 +0000] I [socket.c:848:__socket_shutdown] 0-gv0-client-2: intentional socket shutdown(9)
[2023-03-04 13:10:26.570967 +0000] I [MSGID: 114018] [client.c:2229:client_rpc_notify] 0-gv0-client-2: disconnected from client, process will keep trying to connect glusterd until brick's port is available [{conn-name=gv0-client-2}] 
[2023-03-04 13:10:26.573631 +0000] I [MSGID: 114057] [client-handshake.c:1128:select_server_supported_programs] 0-gv0-client-1: Using Program [{Program-name=GlusterFS 4.x v1}, {Num=1298437}, {Version=400}] 
[2023-03-04 13:10:26.575275 +0000] I [MSGID: 114046] [client-handshake.c:857:client_setvolume_cbk] 0-gv0-client-1: Connected, attached to remote volume [{conn-name=gv0-client-1}, {remote_subvol=/data/brick1/gv0}] 
[2023-03-04 13:10:26.575517 +0000] I [MSGID: 108002] [afr-common.c:6435:afr_notify] 0-gv0-replicate-0: Client-quorum is met 
[2023-03-04 13:10:26.581581 +0000] I [MSGID: 104041] [glfs-resolve.c:974:__glfs_active_subvol] 0-gv0: switched to graph [{subvol=62782d61-7070-3033-2e6f-72672e746573}, {id=0}]

Написано более двух лет назад

Михаил Стручалин @mmmex Автор вопроса

# gluster volume status
Status of volume: gv0
Gluster process                             TCP Port  RDMA Port  Online  Pid
------------------------------------------------------------------------------
Brick bx-app01:/data/brick1/gv0             49152     0          Y       20476
Brick bx-app02:/data/brick1/gv0             49152     0          Y       16598
Brick bx-app03:/data/brick1/gv0             N/A       N/A        N       N/A  
Self-heal Daemon on localhost               N/A       N/A        Y       4162 
Self-heal Daemon on bx-app01                N/A       N/A        Y       20493
Self-heal Daemon on bx-app02.org.test       N/A       N/A        Y       16615
 
Task Status of Volume gv0
------------------------------------------------------------------------------
There are no active volume tasks

Написано более двух лет назад

Михаил Стручалин @mmmex Автор вопроса

# systemctl status glusterd
● glusterd.service - GlusterFS, a clustered file-system server
   Loaded: loaded (/usr/lib/systemd/system/glusterd.service; enabled; vendor preset: disabled)
   Active: active (running) since Сб 2023-03-04 16:15:46 UTC; 18min ago
     Docs: man:glusterd(8)
  Process: 4139 ExecStart=/usr/sbin/glusterd -p /var/run/glusterd.pid --log-level $LOG_LEVEL $GLUSTERD_OPTIONS (code=exited, status=0/SUCCESS)
 Main PID: 4140 (glusterd)
   CGroup: /system.slice/glusterd.service
           ├─4140 /usr/sbin/glusterd -p /var/run/glusterd.pid --log-level INFO
           └─4162 /usr/sbin/glusterfs -s localhost --volfile-id shd/gv0 -p /var/run/gluster/shd/gv0/gv0-shd.pid -l /var/log/glusterfs/glustershd.log -S /var/run/gluster/b94a89dee1a6c620.socket --xlator-option *replicate*.node-uuid=5a9d...

мар 04 16:15:46 bx-app03.org.test systemd[1]: Starting GlusterFS, a clustered file-system server...
мар 04 16:15:46 bx-app03.org.test systemd[1]: Started GlusterFS, a clustered file-system server.

Написано более двух лет назад

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

+2 ещё

Средний
Где хранятся DHT хеш каждого файла на Glusterfs?
- 2 подписчика
- более трёх лет назад
- 67 просмотров
1

ответ
Linux

+2 ещё

Средний
Зависает glusterfs кластер при отказе одного нода?
- 2 подписчика
- более трёх лет назад
- 144 просмотра
0

ответов
Linux

+1 ещё

Средний
Linux, Gluster. Ошибка удаления — «каталог не пуст». Как удалить?
- 1 подписчик
- более трёх лет назад
- 393 просмотра
0

ответов
GlusterFS

Простой
Too many GlusterFS failed processes, как решить?
- 1 подписчик
- более трёх лет назад
- 102 просмотра
1

ответ
Файловые системы

+2 ещё

Средний
Нужна помощь с gluster, проблемы с файловой системой XFS, как правильно настроить volume?
- 3 подписчика
- более трёх лет назад
- 519 просмотров
1

ответ
Linux

+2 ещё

Простой
Почему может висеть чтение (cat/less/vi) файла со статусом D?
- 1 подписчик
- более трёх лет назад
- 64 просмотра
1

ответ
Файловые системы

+2 ещё

Простой
Что выбрать для веб-кластера — CephFS vs GlusterFS vs ещё что-то?
- 1 подписчик
- более трёх лет назад
- 131 просмотр
0

ответов
GlusterFS

Сложный
При поиске на томе с glusterfs командой Линукс find грузит обе годы, можно это исправить?
- 1 подписчик
- более трёх лет назад
- 10 просмотров
0

ответов
GlusterFS

Сложный
Как ускорить lstat веб проекта при репликации дисков?
- 1 подписчик
- более трёх лет назад
- 25 просмотров
0

ответов
Показать ещё Загружается…

Deep Learning Engineer (GigaChat Prod)

Сбер • Москва

от 350 000 ₽

Разработчик в S3

Яндекс • Москва

от 300 000 до 490 000 ₽

Разработчик в Единое хранилище данных

Яндекс • Москва

от 300 000 до 490 000 ₽

# gluster volume status Status of volume: gv0 Gluster process TCP Port RDMA Port Online Pid ------------------------------------------------------------------------------ Brick bx-app01:/data/brick1/gv0 49152 0 Y 20476 Brick bx-app02:/data/brick1/gv0 49152 0 Y 16598 Brick bx-app03:/data/brick1/gv0 N/A N/A N N/A Self-heal Daemon on localhost N/A N/A Y 4162 Self-heal Daemon on bx-app01 N/A N/A Y 20493 Self-heal Daemon on bx-app02.org.test N/A N/A Y 16615 Task Status of Volume gv0 ------------------------------------------------------------------------------ There are no active volume tasks
# systemctl status glusterd ● glusterd.service - GlusterFS, a clustered file-system server Loaded: loaded (/usr/lib/systemd/system/glusterd.service; enabled; vendor preset: disabled) Active: active (running) since Сб 2023-03-04 16:15:46 UTC; 18min ago Docs: man:glusterd(8) Process: 4139 ExecStart=/usr/sbin/glusterd -p /var/run/glusterd.pid --log-level $LOG_LEVEL $GLUSTERD_OPTIONS (code=exited, status=0/SUCCESS) Main PID: 4140 (glusterd) CGroup: /system.slice/glusterd.service ├─4140 /usr/sbin/glusterd -p /var/run/glusterd.pid --log-level INFO └─4162 /usr/sbin/glusterfs -s localhost --volfile-id shd/gv0 -p /var/run/gluster/shd/gv0/gv0-shd.pid -l /var/log/glusterfs/glustershd.log -S /var/run/gluster/b94a89dee1a6c620.socket --xlator-option *replicate*.node-uuid=5a9d... мар 04 16:15:46 bx-app03.org.test systemd[1]: Starting GlusterFS, a clustered file-system server... мар 04 16:15:46 bx-app03.org.test systemd[1]: Started GlusterFS, a clustered file-system server.

Answer 1 · 2023-03-05 06:40:18

Единственное решение, которое нашел, заключается в переустановке реплики (удаление неисправного кирпича из тома, удаление из кластера):
1. gluster volume remove-brick gv0 replica 2 bx-app03:/data/brick1/gv0 force
2. gluster peer detach bx-app03

[root@bx-app02 glusterfs]# gluster volume info
 
Volume Name: gv0
Type: Replicate
Volume ID: 0ce5aeb8-59f0-46a7-8523-7cd2b1cc1d6b
Status: Started
Snapshot Count: 0
Number of Bricks: 1 x 3 = 3
Transport-type: tcp
Bricks:
Brick1: bx-app01:/data/brick1/gv0
Brick2: bx-app02:/data/brick1/gv0
Brick3: bx-app03:/data/brick1/gv0
Options Reconfigured:
cluster.granular-entry-heal: on
storage.fips-mode-rchecksum: on
transport.address-family: inet
nfs.disable: on
performance.client-io-threads: off
[root@bx-app02 glusterfs]# gluster volume remove-brick gv0 replica 2 bx-app03:/data/brick1/gv0 force
Remove-brick force will not migrate files from the removed bricks, so they will no longer be available on the volume.
Do you want to continue? (y/n) y
volume remove-brick commit force: success
[root@bx-app02 glusterfs]# gluster volume info gv0
 
Volume Name: gv0
Type: Replicate
Volume ID: 0ce5aeb8-59f0-46a7-8523-7cd2b1cc1d6b
Status: Started
Snapshot Count: 0
Number of Bricks: 1 x 2 = 2
Transport-type: tcp
Bricks:
Brick1: bx-app01:/data/brick1/gv0
Brick2: bx-app02:/data/brick1/gv0
Options Reconfigured:
cluster.granular-entry-heal: on
storage.fips-mode-rchecksum: on
transport.address-family: inet
nfs.disable: on
performance.client-io-threads: off
[root@bx-app02 glusterfs]# gluster peer status
Number of Peers: 2

Hostname: bx-app01
Uuid: bfa41c6c-0357-4846-9b6c-f8704fe61d0a
State: Peer in Cluster (Connected)

Hostname: bx-app03
Uuid: 5a9d71f7-d4ab-4945-a1b8-d39c189c3fb2
State: Peer in Cluster (Connected)
[root@bx-app02 glusterfs]# gluster peer detach bx-app03
All clients mounted through the peer which is getting detached need to be remounted using one of the other active peers in the trusted storage pool to ensure client gets notification on any changes done on the gluster configuration and if the same has been done do you want to proceed? (y/n) y
peer detach: success
[root@bx-app02 glusterd]# gluster peer status
Number of Peers: 1

Hostname: bx-app01
Uuid: bfa41c6c-0357-4846-9b6c-f8704fe61d0a
State: Peer in Cluster (Connected)

Добавляем заново:
1. gluster peer probe bx-app03
2. gluster volume add-brick gv0 replica 3 bx-app03:/data/brick1/gv0

Как заменить реплику на том-же хосте glusterfs?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт