t_q_l
@t_q_l
Интересная личность

Как организовать резервное копирование виртуальных машин с общими дисками?

Вводные данные:

Есть ESXi сервера, есть VCenter (v5.1), на них крутятся виртуальные машины. К ESXi подключено несколько СХД, на которых нарезаны LUN и отданы виртуальным машинам. Внутри виртуальных машин подключено дисков от разных СХД. В качестве системы резервного копирования используется Acronis Backup & Recovery 11.5, агенты которого установлены внутри всех VM. Время начала резервного копирования виртуальных машин привязано к сервисам, которые на них расположены. Резервное копирование каждой машины выполняется 7 раз в неделю (1 полная копия и 6 дифференциальных). Работа виртуальных машин вне времени резервного копирования оптимальна, и диски не являются узким местом. Выделить каждой VM свой LUN целиком нельзя, т.к. на всех места не хватит.

Проблема:

Резервное копирование более двух VM одновременно с общими дисками чревато провалом производительности обеих машин и сервисов, на них находящихся.

Вот схема для наглядности :

0d40bf701f7944dc9988961471a478c2.png

На схеме изображено 4 VM и 3 LUN, но на деле виртуальных машин около 100, а LUN около 15. LUN разного размера и производительности.

Со стороны гипервизора диски подключены так:
  • VM1 -> DS1, DS2
  • VM2 -> DS1, DS2
  • VM3 -> DS1, DS2, DS3
  • VM4 -> DS2, DS3


Со стороны СХД виртуальные машины подключены так:
  • DS1 -> VM1, VM2, VM3
  • DS2 -> VM1, VM2, VM3
  • DS3 -> VM3, VM4

Чего хочется:

  1. Составить план резервного копирования, который бы учитывал нагрузку на диски, время запуска каждой машины.
  2. Найти инструмент для документирования процедуры резервного копирования. Эдакий timeline, открыв который можно определить в какое время, как долго и какая машина будет бэкапиться, где есть окно, чтобы вставить другое задание.


Поделитесь опытом, кто и как решает подобные задачи? Сейчас это почти хаотичное передвижение планов копирования и гадание на кофейной гуще.

UPD: Уточнил версию Acronis Backup & Recovery (ABR) - используется версия 11.5, а не 10.
  • Вопрос задан
  • 3490 просмотров
Пригласить эксперта
Ответы на вопрос 2
SLIDERWEB
@SLIDERWEB
ИТ-Куроводитель
t_q_l: Простите, не увидел сразу.

ABR не очень хорошо работает с виртуальными машинами. Он работает с ними на уровне файлов, поэтому ему присущи все недостатки такого подхода. Я сам пользовался ABR 10 на Standalone ESXi c внутренним хранилищем - был доволен. Но после перехода на полноценные кластерные решения и общие хранилища - был очень расстроен. В итоге выбрал Veeam, так как он использует другой подход - вытягивание снапшотов на уровне блоков. Плюс такого подхода особенно заметен, когда одновременно резервируются несколько машин. Если данные этих машин расположены рядом, то система просто производит чуть-ли не линейное чтение со стораджа. Плюс ко всему при этом доступна дедубликация на уровне блоков, что еще больше сказывается на занимаемом пространстве, снижая стоимость хранения.
Вообще, если Вы используете общие хранилища, то первым делом должны были задуматься об архитектуре SAN, и как следствие, реализация такого подхода открывает вам дверь в мир продуктов, осуществляющих резервирование на уровне SAN, а это совершенно другой подход, и как следствие, совершенно другие возможности и эффективность.
Я рекомендую попробовать триальную версию Veeam - это решение хорошо умеет работать в гибридных средах, так называемых paraSAN, что позволит вам оценить новые подходы к резервированию и оценить их эффективность именно для Ваших задач. А потом уже выбрать то что подходит больше.

К сожелению я не знаком с Вашей топологией и потребностями, по этой причине не буду ничего советовать, а лишь рекомендую ознакомиться, в качестве отправной точки, с другими методами и технологиями реализации и резервирования виртуальных сред
Ответ написан
t_q_l
@t_q_l Автор вопроса
Интересная личность
По просьбам трудящихся уточняю схему виртуализации и резервного копирования.

Диски виртуальных машин (от 2 и более) расположены на разных LUN'ах разной производительности и размера:

1b3b6c1c6a2045848fa5970a1637df6f.png

Резервное копирование с помощью Acronis Backup & Recovery v.11.5 подразумевает создание снимков всех дисков и копирование их на отдельных NAS.

Проблема: pезервное копирование более двух VM одновременно с общими дисками чревато провалом производительности обеих машин и сервисов, на них находящихся.

Бэкапить машины по одной - не укладываемся в допустимое "окно". Если запускаем резервное копирование нескольких VM одновременно, то сложно угадать, чтобы не было затыка. Пример на картинке - VM1 VM2 вместе нельзя бэкапить, но на картинке всего 4 машины, а на деле 100 VM и 15 LUN'ов.

  1. Как правильно построить схему резервного копирования?
  2. Как / в чём вести документирование, чтобы правильно распределить время старта, окончания и свободные окна для других машин?
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы