Ребят у меня критичная ситуация, смотрите перегрев в северном помещении, как можно вытащить инфу по состоянии температуры сервера, Сервер на CENTOS, я уже поставил утилиту lm-sensors, она выводит вот такие параметры (это в мало охлажденной серверной)
very 2,0s: sensors | grep Core Tue Aug 30 20:19:29 2016
fokin_nikolay1989:
Не забывайте отмечать решением ответы, которые смогли чем-либо помочь. Это основная мотивация участникам отвечать на ваши вопросы =) Систематически не отмечаете - ваши вопросы некоторые могут избегать.
Алексей Харченко: sensors и без грепов хорошо показывает разные датчики, что были обнаружены через sensors-detect. =)
Обычно их не больше 5-10, даже грепать не нужно.
yosemity: Мониторинг-то понятно. Изначальный вопрос ведь о том, что человек ограничивает вывод процессорами сам, но удивляется, почему вывод только про процессоры.
Ну а чем плохо по каждому ядру? Можно как минимум найти среднее.
Да и температура еще не критичная, вот когда к 80 приблизится, тогда да. А так пока все в пределах нормы.
Да, снимать можно например через collectd. Отображать через influxdb + grafana.
Из биоса не вытащить, так как биос отрабатывает только в самом начале. Можно вытащить из BMC (если он у вас установлен!), через IPMI ну или через lm-sensors. Кстати, чем они вас не устраивают? Биос тоже через них работает, они же на самом процессоре стоят, и калибровочные данные в самом чипе прописаны, стандарты известны!
SNMP + Dude старых версий, ставим, выцепляем все нужные параметры, делаем оповещения куда надо. Температуру в том же dude можно нехитрыми манипуляциями посчитать среднюю. На выходе будет оповещение, съем нужной статистики, ведение графиков и вообще все няшно, если раскошелиться немного и докупить что то типа Equicom PING2 или NetPing IO или подобное(выбор действительно большой) обвесив все это датчиками нужными то можно смотреть вообще за всем происходящим в серверной заведя все это в dude. Скажем минимально поставить датчик температуры в помещение, датчик открытия двери серверной и датчик влажности всегда можете точно узнать что в серверной жарко потому что умер кондюк или просто умирает охлаждение цп сервера, кто то туда внезапно зашел или водичка полилась с верхнего этажа.