Смотрите записи Machine check exceptions (MCE). Если в них что-то есть, они вам помогут понять хотя бы подсистему, которая вызывает проблемы.
У меня, например, уже несколько месяцев зависает старый компьютер. Из записей MCE видно, что отваливаются разом все жесткие диски, посему делаю вывод, что проблема либо с питанием, либо с мостом, где находится контроллер дисков.
# ras-mc-ctl --summary
No Memory errors.
No PCIe AER errors.
No ARM processor errors.
No Extlog errors.
No devlink errors.
Disk errors summary:
0:2048 has 51 errors
0:2064 has 46 errors
0:2080 has 433 errors
0:2096 has 78 errors
0:2112 has 39 errors
No MCE errors.
# ras-mc-ctl --errors
Disk errors
636 2022-03-13 20:15:39 +0300 error: dev=0:2080, sector=54431544, nr_sector=256, error='unknown block error', rwbs='RA', cmd='',
637 2022-03-13 20:15:39 +0300 error: dev=0:2080, sector=54431800, nr_sector=256, error='unknown block error', rwbs='RA', cmd='',
638 2022-03-13 20:15:39 +0300 error: dev=0:2080, sector=51680336, nr_sector=8, error='unknown block error', rwbs='RA', cmd='',
639 2022-03-13 20:15:39 +0300 error: dev=0:2080, sector=51189632, nr_sector=32, error='unknown block error', rwbs='RA', cmd='',
640 2022-03-13 20:15:39 +0300 error: dev=0:2080, sector=9515000, nr_sector=8, error='unknown block error', rwbs='RM', cmd='',
641 2022-03-13 20:15:40 +0300 error: dev=0:2096, sector=-1, nr_sector=0, error='I/O error', rwbs='N', cmd='',
642 2022-03-13 20:15:40 +0300 error: dev=0:2096, sector=-1, nr_sector=0, error='I/O error', rwbs='N', cmd='',