Задать вопрос
mrusklon
@mrusklon
Не получается? Яростно гугли!

Сломались все почти VM на proxmox, как такое произошло?

у меня около 20 VM на сервере, как линукс так и виндовс сервера, в один момент за несколько часов почти все VM поломали свои внутренние файлы, как простые документы так и системные файлы ОС, я досих пор не понимаю как такое может произойти.
файлы хранятся на RAID10 из 8 дисков, с самими дисками все нормально, если бы было какое то серьезное повреждение то умерли бы все VM и повредили файлы.. но несколько VM совсем не пострадали
на умерших VM я загуржался с загрузочной флешки и смотрел файлы , что странно у всех файлов было вермя изминения почти одинаковое, если бы это было просто повреждение, то оно бы не меняло дату на файле
В логах никаких ошибок нет совсем, я с трудом восстановил сервер из резервных копий, но нужно понять в чем дело что бы не повторить ситуацию, кто может что то посоветовать?
  • Вопрос задан
  • 300 просмотров
Подписаться 1 Сложный 11 комментариев
Помогут разобраться в теме Все курсы
  • Нетология
    1C-программист: расширенный курс
    18 месяцев
    Далее
  • Академия Эдюсон
    Python-разработчик
    9 месяцев
    Далее
  • Skillbox
    Профессия 1С-программист
    8 месяцев
    Далее
Решения вопроса 1
mrusklon
@mrusklon Автор вопроса
Не получается? Яростно гугли!
4 дня понадоилось что бы понять в чем было дело... а именно:
формат образов VM qcow2 , во время бекапа был выбран режим "Снимок" то бишь snapshot, файловая система не ZFS , во время создания бекапа поверх образа диска, делается еще один qcow2 образ куда записуются данные во время того пока делается бекап, после завершения бекапа/снапшота образы сливаются в один (вот тут у меня проблема и произошла) , бекап сервер словил оишбку или просто отключился, потянув за собой и основной, а так как на физическом RAID массиве нет инструментов для отлова таких ошибок, он принял данные за тупые единицы и нули и все успешно записал окончательно уничтожив файлы .

Время изминения на файлах было проставлено потому что был настроен shadow copy в windows server, если бы его не было в момент бекапа то файлы я думаю остались бы целы, но уже и не проверить никак.

Поэтому буду переходить на ZFS + raw формат диска , возможно даже уйду от физического RAID в сторону ZFS pool
диски стоят не HDD , а nvme. в производительности я не сильно потеряю , зато спать буду спокойно

спасибо всем за подсказки и попытки помочь, от души
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 2
Rsa97
@Rsa97
Для правильного вопроса надо знать половину ответа
Останавливайте сервер и тестируйте оперативку. Memtest86+ минимум два цикла, больше - лучше.
Ответ написан
opium
@opium
Просто люблю качественно работать
Так логи на хостовой машине посмотрите, ну и там на несколько машин раскидайте виртуалки, не храните в одной корзине все
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы