Поднял кластер из 2 нод, они даже как-то собрались в кластер, но в веб интерфейсах сосед всегда красный + нет кворума, приходится делать рестарт так: /etc/init.d/cman restart
и в другой консоли, пока ждем кворума:
pvecm e 1
после этого нода включается в работу, но фактически без кворума. На обоих крутится разный набор машин, поэтому просто зачистить 1 ноду нет возможности. Метод из 2 версии (перенести машины + конфиг файл) не работает, так как /etc/pve это не реальная фс, vzmigrate из консоли не работает (не может записать конфиг - см выше), из веба просто не работает.
До кучи не удается вписать в cluster.conf переход на уникаст, при рестарте кластера сбраcывает конфиг на дефолтный.
Совсем до кучи - corosync жрёт 60-70% памяти из 64 гиг, приходится его прибивать и перезапускать кластер-сервисы.
Кто плотно с 3.х работает, можете что подсказать?
Вы когда редактируете cluster.conf обязательно должны менять версию конфигурации:
Be sure to increase the number "config_version" each time you plan to apply new configurations as this is the internal mechanism used by the cluster configuration tools to detect new changes.
похоже заработало, но один момент сильно смутил
правил в /etc/cluster/cluster.conf
# /etc/init.d/pve-cluster restart
Restarting pve cluster filesystem: pve-cluster[dcdb] crit: local cluster.conf is newer
при этом в /etc/pve/cluster.conf по прежнему 2 версия...
Хочу еще на всякий случай напомнить, что сделанные изменения конфигурации кластера надо в конце подтвердить (Commit) через веб-интерфейс той ноды, на которой производились изменения. Заходите на вкладку "HA" и жмете на кнопку "Commit" (pve.proxmox.com/wiki/Two-Node_High_Availability_Cl...