Имеется мнение, что проблема всё же железного характера и отсюда вопрос: какие элементы на промежутке слот памяти -> процессор регулируют работу памяти? контакты и на чипсете и в слотах в порядке, почищенны и обезжирены.
А вариант с zabbix'ом не рассматривали? Ведь можно мониторить состояние процессора и памяти, а при перегрузе посылать уведомление администратору. Ну или более радикально - сразу ребут...