uptime большой? Файлы удаляли? Дело в том, что в linux, в отличие от windows, имя файла и его inode - раздельные сущности, и если стереть открытый файл, он вроде как из ФС пропадет, но место не освободится, пока его процесс не закроет.
Вы можете настроить nat таким образом, чтобы он направлял пакеты от клиентов по разным соединениям, загружая таким образом оба канала. Идея изложена здесь, в частности.
Можно поставить туда pxelinux и дописать в загрузчик команды для запуска PXE.
Можно скопировать туда установщик centos и запустить его из загрузчика.
Проблема только в том, как заставить установщик сразу после старта поднять SSH или VNC для управления установкой.
Используем Heartbeat-Pacemaker-OCFS2. Очень приятна возможность делать reflink - снимок.
С момента reflink содержимое файла запоминается, а для сохранения измененных блоков используется copy-on-write. То есть у нас бекап > 20 виртуалок делается за пару секунд.
Работают 4 узла поверх FibreChannel SAN HP-EVA6000.
Про split-brain - как кворум настроите, так и будет приниматься решение об отправке кластера в ребут при падении компонента.
Все компоненты есть в Opensuse 13.2 и настраиваются мастером "из коробки". Без ковыряния в конфигах.