Какую вы используете систему мониторинга серверов?

Сегодня умер сервер, умер SSD. Тех. поддержка показала диагностику SSD и счетчик
Появился вопрос - а как можно было предотвратить данную ситуацию? Ну, как минимум можно было себе помочь мониторингом.
SSD умер на параметре Wear Leveling Count, который легко отслеживается из системы, но в Zabbix в "дефолтной поставке" он не отслеживается.
Понятно, что можно написать самому все user params, discovery, templat'ы? Но мне кажется странным, что системы мониторинга по умолчанию не отслеживают health status диска.
Даже сейчас, по zabbix не так то просто чтото нагуглить готовое по smartctl.
Есть ли может уже какие-то более продвинутые системы мониторинга, которые многое умеют делать сами?
  • Вопрос задан
  • 1061 просмотр
Пригласить эксперта
Ответы на вопрос 4
@Oioraen
> Даже сейчас, по zabbix не так то просто чтото нагуглить готовое по smartctl

Поздравляю вас, гражданин соврамши!

habrahabr.ru/post/162627
habrahabr.ru/company/zabbix/blog/196218

Вторая и третья ссылка в гугле по «zabbix smart».
И далее там еще десятки ссылок, все с готовыми решениями. Вот из принципа уже свой пример приводить не буду, блин, вы бы хоть гуглом научились пользоваться.
Ответ написан
Комментировать
@azazelpw
Linux SA
Использую Zabbix.
В дефолте этой настройки нет.
Нужно ручками прописывать, я сделал давно по кривому, диски указывал вручную, лень переписывать. :)
В конфиге агента пишем.
UserParameter=custom.rse.sda,smartctl --all /dev/sda | grep Reallocated_Sector |awk '{print $10}'
UserParameter=custom.ree.sda,smartctl --all /dev/sda | grep Reallocated_Eve |awk '{print $10}'
UserParameter=custom.cpe.sda,smartctl --all /dev/sda | grep Current_Pen |awk '{print $10}'
UserParameter=custom.ue.sda,smartctl --all /dev/sda | grep Uncorrect |awk '{print $10}'
UserParameter=custom.udmae.sda,smartctl --all /dev/sda | grep UDMA |awk '{print $10}'
UserParameter=custom.temphdd.sda,smartctl --all /dev/sda | grep Temp |awk '{print $10}'

На сервере делаем вызов
custom.rse.sda и т.д. и т.п
Ответ написан
laduwka
@laduwka
Unix администратор
Нет идеального мониторинга.
Я тоже задавалась такими вопросами, сейчас просто допиливаю инструменты, которые есть, под свои нужды.
Пишите плагин для заббикса.
Ответ написан
Комментировать
@Saymon21
Linux system administrator
mdadm, smartmontools
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы