Почему ceph игнорирует команды выполнения внеочередного scrub'а?

Question

MintTea @MintTea

Ceph

Почему ceph игнорирует команды выполнения внеочередного scrub'а?

Неделю назад один из хранящихся в ceph'е объектов сломался, став причиной перехода кластера в статус HEALTH_ERR.
Вывод команды "health detail":

$ ceph health detail
> HEALTH_ERR 1 pgs inconsistent; 1 scrub errors; sortbitwise flag(s) set
> pg 11.1c is active+clean+inconsistent, acting [0,5,3]
> 1 scrub errors
> sortbitwise flag(s) set

Просил ceph починить указанный PG:

$ ceph pg repair 11.1c
> instructing pg 11.1c on osd.0 to repair

Никакого эффекта не дало. Далее по инструкции о ручном исправлении объекта был найден конкретный файл, сверены хэши всех копий, копия со сломанным хэшем была удалена. Теперь нужно, чтобы ceph провел scrub на этой pg. Пробую просить сделать это прямо сейчас, а не по расписанию:

$ ceph pg scrub 11.1c
> instructing pg 11.1c on osd.0 to scrub

Ничего не происходит. Прошу сделать deep scrub:

$ ceph pg deep-scrub 11.1c
> instructing pg 11.1c on osd.0 to deep-scrub

Снова ничего не происходит. Т.е., ceph обещает мне провести scrub, но когда я через несколько часов смотрю статус кластера, там картина не меняется. Статистика по pg тоже не обновляется:

$ ceph pg 11.1c query | grep 'last_scrub_stamp'
> "last_scrub_stamp": "2016-09-22 13:45:04.826451",
> "last_scrub_stamp": "2016-09-22 13:45:04.826451",
> "last_scrub_stamp": "2016-09-22 13:45:04.826451",
> "last_scrub_stamp": "2016-09-22 13:45:04.826451",
> "last_scrub_stamp": "2016-09-22 13:45:04.826451",
> "last_scrub_stamp": "2016-09-22 13:45:04.826451",

Насколько я понимаю, мне нужно ждать, пока ceph соизволит проверить эту pg по расписанию?
Почему он меня игнорирует?

Вопрос задан более трёх лет назад
897 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

1C-разработчик

8 месяцев

Далее
Нетология

Python-разработчик с нуля

6 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

2 комментария

MintTea @MintTea Автор вопроса
Ну так-то уже больше года прошло, вопрос неактуален, т.к. того объекта уже давно нет.

Кластер, врочем еще функционирует, и ему все так же фиолетово, что ему там указывают. Помню, у меня было подозрение, что скрабы не запускаются на OSD, на которых идет ребаланс или бэкфилл, но подтверждения этому я не нашел.

Сейчас так, например:
$ ceph pg scrub 21.9d > instructing pg 21.9d on osd.1 to scrub $ ceph pg 21.9d query | grep 'last_scrub_stamp' # спустя 10 минут > "last_scrub_stamp": "2017-09-20 09:44:22.540804", > "last_scrub_stamp": "2017-09-20 09:44:22.540804", > "last_scrub_stamp": "2017-09-20 09:44:22.540804", > "last_scrub_stamp": "2017-09-20 09:44:22.540804", > "last_scrub_stamp": "2017-09-20 09:44:22.540804", > "last_scrub_stamp": "2017-09-20 09:44:22.540804",
Написано более трёх лет назад
morfair @morfair

MintTea, ceph pg repair 21.9d

Написано более трёх лет назад