Для решения задачи с видеокартой
# nvidia-smi -L
GPU 0: Tesla V100-PCIE-32GB
GPU 1: Tesla V100-PCIE-32GB
# cat /proc/driver/nvidia/version
NVRM version: NVIDIA UNIX x86_64 Kernel Module 460.27.04 Fri Dec 11 23:35:05 UTC 2020
GCC version: gcc version 4.8.5 20150623 (Red Hat 4.8.5-39.0.3) (GCC)
потребовалось дополнительно для nvidia через modprobe
# cat /etc/modprobe.d/nvidia.conf
#!/bin/bash
options nvidia \
NVreg_DeviceFileGID=1226 \
NVreg_DeviceFileMode=0660 \
NVreg_DeviceFileUID=0 \
NVreg_ModifyDeviceFiles=1
после загрузки ОС проверяю
modprobe -c | grep nvidia
blacklist nvidiafb
options nvidia NVreg_DeviceFileGID=1226 NVreg_DeviceFileMode=0660 NVreg_DeviceFileUID=0 NVreg_ModifyDeviceFiles=1
softdep nvidia post: nvidia-uvm
alias char_major_195_* nvidia
alias mbp_nvidia_bl apple_bl
alias pci:v000010DEd*sv*sd*bc03sc*i* nvidiafb
alias pci:v000010DEd*sv*sd*bc03sc00i00* nvidia_drm
alias pci:v000010DEd*sv*sd*bc03sc00i00* nvidia
alias pci:v000010DEd*sv*sd*bc03sc02i00* nvidia_drm
alias pci:v000010DEd*sv*sd*bc03sc02i00* nvidia
alias symbol:nvKmsKapiGetFunctionsTable nvidia_modeset
в /var/log/message такое
Dec 05 15:23:46 myhost kernel: nvidia: loading out-of-tree module taints kernel.
Dec 05 15:23:46 myhost kernel: nvidia: module license 'NVIDIA' taints kernel.
Dec 05 15:23:46 myhost kernel: nvidia: module license 'NVIDIA' taints kernel.
Dec 05 15:23:46 myhost kernel: nvidia: module verification failed: signature and/or required key missing - tainting kernel
Dec 05 15:23:46 myhost kernel: nvidia-nvlink: Nvlink Core is being initialized, major device number 238
Dec 05 15:23:47 myhost kernel: nvidia-modeset: Loading NVIDIA Kernel Mode Setting Driver for UNIX platforms 460.27.04 Fri Dec 11 23:24:19 UTC 2020
Dec 05 15:23:47 myhost kernel: [drm] [nvidia-drm] [GPU ID 0x00003300] Loading driver
Dec 05 15:23:47 myhost kernel: [drm] Initialized nvidia-drm 0.0.0 20160202 for 0000:33:00.0 on minor 0
Dec 05 15:23:47 myhost kernel: [drm] [nvidia-drm] [GPU ID 0x0000b200] Loading driver
Dec 05 15:23:47 myhost kernel: [drm] Initialized nvidia-drm 0.0.0 20160202 for 0000:b2:00.0 on minor 1
Можно ли судить о том что модуль nvidia загрузился корректно?
И какие еще существуют методы диагностики?