Задать вопрос
@99insania99

Как собирать достоверные данные о температуре процессоров AMD в Linux?

Есть несколько системников использующихся в качестве серверов. Есть необходимость собирать данные о температуре процессора. Несколько выводов команды sensors ниже:
AMD Ryzen 9 5950X
nouveau-pci-0500
Adapter: PCI adapter
GPU core:    900.00 mV (min =  +0.85 V, max =  +1.00 V)
temp1:        +46.0°C  (high = +95.0°C, hyst =  +3.0°C)
                       (crit = +105.0°C, hyst =  +5.0°C)
                       (emerg = +135.0°C, hyst =  +5.0°C)

gigabyte_wmi-virtual-0
Adapter: Virtual device
temp1:        +35.0°C
temp2:        +55.0°C
temp3:        +71.0°C
temp4:        +24.0°C
temp5:        +87.0°C
temp6:        +47.0°C

acpitz-acpi-0
Adapter: ACPI interface
temp1:        +16.8°C
temp2:        +16.8°C

k10temp-pci-00c3
Adapter: PCI adapter
Tctl:         +71.2°C
Tccd1:        +71.8°C
Tccd2:        +53.0°C

nvme-pci-0100
Adapter: PCI adapter
Composite:    +43.9°C  (low  =  -0.1°C, high = +82.8°C)
                       (crit = +89.8°C)

AMD Ryzen 9 7900X
iwlwifi_1-virtual-0
Adapter: Virtual device
temp1:            N/A

k10temp-pci-00c3
Adapter: PCI adapter
Tctl:         +68.5°C
Tccd1:        +68.9°C
Tccd2:        +36.2°C

nvme-pci-0100
Adapter: PCI adapter
Composite:    +32.9°C  (low  = -273.1°C, high = +82.8°C)
                       (crit = +85.8°C)
Sensor 1:     +32.9°C  (low  = -273.1°C, high = +65261.8°C)
Sensor 2:     +39.9°C  (low  = -273.1°C, high = +65261.8°C)

acpitz-acpi-0
Adapter: ACPI interface
temp1:        +16.8°C

amdgpu-pci-1000
Adapter: PCI adapter
vddgfx:        1.40 V
vddnb:       989.00 mV
edge:         +45.0°C
PPT:          53.16 W

gigabyte_wmi-virtual-0
Adapter: Virtual device
temp1:        +27.0°C
temp2:        +41.0°C
temp3:        +68.0°C
temp4:        +30.0°C
temp5:        +41.0°C
temp6:        +39.0°C

nvme-pci-0f00
Adapter: PCI adapter
Composite:    +30.9°C  (low  = -273.1°C, high = +82.8°C)
                       (crit = +85.8°C)
Sensor 1:     +30.9°C  (low  = -273.1°C, high = +65261.8°C)
Sensor 2:     +40.9°C  (low  = -273.1°C, high = +65261.8°C)

nvme-pci-0c00
Adapter: PCI adapter
Composite:    +29.9°C  (low  = -273.1°C, high = +82.8°C)
                       (crit = +85.8°C)
Sensor 1:     +29.9°C  (low  = -273.1°C, high = +65261.8°C)
Sensor 2:     +39.9°C  (low  = -273.1°C, high = +65261.8°C)

AMD Ryzen 7 5800X
nouveau-pci-0700
Adapter: PCI adapter
GPU core:    900.00 mV (min =  +0.85 V, max =  +1.05 V)
temp1:        +67.0°C  (high = +95.0°C, hyst =  +3.0°C)
                       (crit = +105.0°C, hyst =  +5.0°C)
                       (emerg = +135.0°C, hyst =  +5.0°C)

k10temp-pci-00c3
Adapter: PCI adapter
Tctl:         +90.2°C
Tccd1:        +90.5°C

acpitz-acpi-0
Adapter: ACPI interface
temp1:        +16.8°C
temp2:        +16.8°C

gigabyte_wmi-virtual-0
Adapter: Virtual device
temp1:        +38.0°C
temp2:        +55.0°C
temp3:        +90.0°C
temp4:        +17.0°C
temp5:        +63.0°C
temp6:        +70.0°C

nvme-pci-0100
Adapter: PCI adapter
Composite:    +51.9°C  (low  = -273.1°C, high = +81.8°C)
                       (crit = +84.8°C)
Sensor 1:     +51.9°C  (low  = -273.1°C, high = +65261.8°C)
Sensor 2:     +69.8°C  (low  = -273.1°C, high = +65261.8°C)

В среднем загрузка проца по всем серверам 5-10%, и кажется, что такие температуры - не совсем корректны.
Очень смущает последний проц, при Tjmax = 90, он иногда может показать и 95 градусов. При том что нагрузка на нем в эти моменты 5-10%. Как будто показания не совсем корректные. Еще слышал что на ZEN 1-2 был некоторый offset для каждого процессора, который надо было отнимать от Tctl, чтобы получить истинную температуру. Насколько это актуально для более современных камней?

P.S. Просьба не писать - "купи нормальный серверный сервер")
  • Вопрос задан
  • 88 просмотров
Подписаться 1 Средний 5 комментариев
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы