Правила такие
1. RAID5 - последнее дело. Статистика показывает, что вероятность выхода из строя диска во время ребилда - более 70%. Выход из строя второго диска как правило означает, что массив можно выбрасывать.
2. Создание RAID средствами аппаратного контроллера - плохая идея. Вы таким образом создаете единую точку отказа (этот самый контроллер). Если контроллер выйдет из строя, вам придется искать ему замену (такой же точно контроллер с той же прошивкой), иначе данные из массива будет очень сложно выудить.
3. Centos содержит придурочный NetworkManager (и systemd, но последнее еще можно пережить). А вот управление сетью через dbus - пережить сложно. Или выламывайте NetwokManager, или переходите на нормальный дистрибутив - SuSE
4. Классика кластеростроения для виртуалок и миграции, вариант 1.
Два сервера, на серверах массивы RAID10. Диски отдаются в мир через DRBD в режиме active-active.
Поверх дисков работает распределенная кластерная система OCFS2.
Управление кластером осуществляет pacemaker.
RAID10 - это массив, сочетающий относительно высокую надежность (должно выйти из строя не менее половины всех дисков массива) и относительно высокую скорость работы (за счет разбивки файла по дискам)
DRBD - это такой сетевой RAID1. Данные во время работы реплицируются между узлами, так что остановка одного узла из пары не приводит к остановке хранилища.
OCFS2 - это кластерная ФC, которая позволяет куче машин видеть одно блочное устройство как свою локальную ФС. В ней работает отображение файлов в память и глобальные блокировки. И самое полезное для виртуалок - есть возможность создавать reflink. Reflink - это моментально создающаяся копия файла (образа диска виртуалки). Для новой копии, OCFS2 будет только хранить отличия от первоначального файла.
pacemaker - это менеджер кластера+балансировщик нагрузки.
Как это все поднять?
1. Ставите на все машины OpenSuSE 42.1
2. Собираете RAID10 через LVM (для этого есть GUI - Yast называется)
3. В том же YAST поднимаете DRBD
4. Ставите пакет ha-cluster-bootstrap
5. На одном из узлов делаете ha-cluster-init и следуете его инструкциям
6. На остальных узлах делаете ha-cluster-join
Это в общих чертах, задавайте вопросы.