Доброго дня!
Товарищи, нужна Ваша помощь в настройке серверного оборудования, а именно подключение системы хранения данных к Blade-серверу. Сразу скажу - за последний месяц прочитано уже бесчисленное множество различных ресурсов, поэтому прошу помощи в "реальном времени".
К сожалению, ранее с подобным я не сталкивался, а задача ввода оборудования в работу поставлена. И возникает ку-у-уча вопросов.
Вводные данные:
На работе приобрели новую железку - систему хранения данных Fujitsu DX100 S4. Включает в себя 2 набора дисков - SSD и SAS, быстрый массив и медленный массив, соответственно. СХД имеет 8 Fiber Channel портов - по 4 на каждом из двух контроллеров (далее CM#X), разделенные на 2 группы (далее CA#X) по 2 порта (далее Port#X).
Приобреталось все это взамен неисправной СХД, которая давным давно выведена из работы по причине умерших дисков.
Работать новая СХД должна была в паре с Blade-сервером HP C3000, с тремя лезвиями на борту. На каждое установлен ESXI и на всем этом поднят кластер VMWare.
В данный сервер установлен SAN-свитч Brocade 8/12c, с четырьмя лицензированными портами Fiber Channel.
Что имеем:1. SAN-свитч: Подключен двумя FC портами к двум контроллерам СХД (CM#0 и CM#1).
Зонирование выполнено следующим образом:
Первому HBA первого лезвия задан в соответствие первый порт СХД.
Первому HBA первого лезвия задан в соответствие второй порт СХД.
Второму HBA первого лезвия задан в соответствие первый порт СХД.
...
Второму HBA третьего лезвия задан в соответствие второй порт СХД.
Итого 12 зон. Соответствие задано по WWN. Всё собрано в единый конфиг на SAN-свитче.
Здесь возникает
первый (1) вопрос - действительно ли стоит делать зонирование по WWN или нужно делать жестко по портам?
2. СХД:
а.) Имеет 2 раздела (SSD-volume и SAS-volume):
SSD собраны в RAID5, имеют размер 6.10 Тб.
SAS собраны в RAID10, имеют размер 8.00 Тб.
б.) Разделы собраны в группу из двух LUN и презентованы серверу следующим образом:
Пояснения по столбцам:
1. Host Group - названия групп портов HBA из столбца Host, соответствующих каждому из лезвий.
2. Host - HBA адаптеры каждого из лезвий.
3. CA Port Group - названия групп портов контроллеров СХД из вкладки CA Port.
4. CA Port - порты СХД, которые подключены к серверу, где CM#X - контроллер, CA#X - группа портов на контроллере, Port#X - порт каждой из групп.
5. LUN Group - группа из LUN, которые необходимо презентовать Blade-серверу.
6. Host Response - режим работы хоста, работающий в режиме Active/Active (настройка проведена руками).
Здесь возникает
второй (2) вопрос - корректно ли выполнять презентацию по отдельным лезвиям? Или можно было собрать всё в одну кучу?
3. VMware.
VMWare видит оба LUN.
Выглядит это следующим образом:
Каждый vmhba видит оба LUN в двойном количестве (...3e:20 и ...3e:30 - WWN адреса портов СХД). Установлен режим путей Round-Robin для каждого из LUN.
Возникает
третий (3) вопрос - а правильно ли выполнена настройка VMWare?
И вот здесь мы приходим к следующему.
Проблема:
Ранее, в VMWare был выбран режим "Fixed". Какие пути были выбраны - данная информация, к сожалению, не сохранилась. Все работало корректно пару дней с парой легких виртуальных машин на борту (1 - Ubuntu, 2 - Windows 7). Вечером третьего дня запустил на СХД миграцию ВМ с Windows Server 2008 R2. Более никаких изменений в конфигурацию не вносилось.
На следующий день посыпались жалобы на то, что всё работающее на СХД тормозит.
При использовании утилиты esxtop с параметром 'd' (подключаясь по SSH на одно из лезвий), появлялись огромные значения DAVG, KAVG, GAVG и QAVG:
Режим был изменен на Round-Robin. Часть путей была отключена. Худо-бедно и в спешке виртуальные машины были размигрированы с СХД.
В данный момент СХД как-то работает, но как - непонятно.
После уже месячных попыток настройки и чтения мануалов уже нет точного представления как всё это должно работать.
Хотелось бы получить советы, каким образом нужно подойти к организации системы хранения данных вместе с Blade-сервером имея только один SAN-свитч.
Признателен любой помощи в выборе правильно подхода! Спасибо!