Итак, был кластер из двух нод VMFarm1 и VMFarm2. В определенный момент пропал quorum между ними. Попытки восстановить все, при помощи кривых рук, привели к тому что ни кластера сейчас нет, ни списка машин в веб интерфейсе. Вторая нода на веб морду вообще не пускает. Но виртуальные машины все еще работают. На машине которая была мастером в /var/lib/pve-cluster/buackup лежит файл config-1375938032.sql.gz, я так понимаю там все настройки предыдущего кластера, но как его восстановить я не знаю, информации никакой не нашел.
Собственно вопросы, можно ли, и каким образом:
1. Вернуть все, как было, т.е. кластер, список всех ВМ.
2. Ели первый вариант реализовать не выйдет, то Разделить кластер, сделать отдельные ноды, вернуть список ВМ.
3. Проделать все это, не останавливая работу самих ВМ.
Была похожая проблема. Машины останавливать нельзя, управления нет ;)
Сначала нарвался на статью https://blog.s-vl.ru/blog/reset-proxmox-cluster.
Она мне вселила уверенность, что не так все плохо и можно починить. Подождал ночи и занялся восстановлением.
Много искал варианты, сравнивал, пробовал, перезапускал сервисы - все тщетно ;(. Уже собрался развалить и перенастроить, но нашел решение вот здесь: https://forum.proxmox.com/threads/no-web-gui-qm-li...
сделал на основной машине:
# mv /etc/pve /etc/pve.old
# mkdir /etc/pve
# systemctl start pve-cluster.service
кластер собрался, появилась вебморда и вернулось управление машинами
сделал контрольный запуск служб на всех нодах:
#systemctl start lxc lxc-net lxc-monitord pvedaemon pve-firewall pvestatd pve-ha-lrm pve-ha-crm spiceproxy pveproxy
#systemctl enable corosync lxc lxc-net lxc-monitord pve-cluster pvedaemon pve-firewall pvestatd pve-ha-lrm pve-ha-crm spiceproxy pveproxy pve-guests
и полностью все восстановилось без перезагрузок хостов и виртуальных машин.
я так понимаю там все настройки предыдущего кластера, но как его восстановить я не знаю, информации никакой не нашел.
А обратиться в форум разработчиков, чтобы получить информацию из первых рук что мешает?