Нужна помощь. Как правильно настроить СХД на пару с Blade-сервером?

Доброго дня!

Товарищи, нужна Ваша помощь в настройке серверного оборудования, а именно подключение системы хранения данных к Blade-серверу. Сразу скажу - за последний месяц прочитано уже бесчисленное множество различных ресурсов, поэтому прошу помощи в "реальном времени".

К сожалению, ранее с подобным я не сталкивался, а задача ввода оборудования в работу поставлена. И возникает ку-у-уча вопросов.

Вводные данные:

На работе приобрели новую железку - систему хранения данных Fujitsu DX100 S4. Включает в себя 2 набора дисков - SSD и SAS, быстрый массив и медленный массив, соответственно. СХД имеет 8 Fiber Channel портов - по 4 на каждом из двух контроллеров (далее CM#X), разделенные на 2 группы (далее CA#X) по 2 порта (далее Port#X).

Приобреталось все это взамен неисправной СХД, которая давным давно выведена из работы по причине умерших дисков.
Работать новая СХД должна была в паре с Blade-сервером HP C3000, с тремя лезвиями на борту. На каждое установлен ESXI и на всем этом поднят кластер VMWare.

В данный сервер установлен SAN-свитч Brocade 8/12c, с четырьмя лицензированными портами Fiber Channel.

Что имеем:

1. SAN-свитч: Подключен двумя FC портами к двум контроллерам СХД (CM#0 и CM#1).

Зонирование выполнено следующим образом:
Первому HBA первого лезвия задан в соответствие первый порт СХД.
Первому HBA первого лезвия задан в соответствие второй порт СХД.
Второму HBA первого лезвия задан в соответствие первый порт СХД.
...
Второму HBA третьего лезвия задан в соответствие второй порт СХД.

Итого 12 зон. Соответствие задано по WWN. Всё собрано в единый конфиг на SAN-свитче.
157415408112646958.png

Здесь возникает первый (1) вопрос - действительно ли стоит делать зонирование по WWN или нужно делать жестко по портам?

2. СХД:

а.) Имеет 2 раздела (SSD-volume и SAS-volume):
SSD собраны в RAID5, имеют размер 6.10 Тб.
SAS собраны в RAID10, имеют размер 8.00 Тб.
15741521861838805.png

б.) Разделы собраны в группу из двух LUN и презентованы серверу следующим образом:
1574152501169525787.webp

Пояснения по столбцам:
1. Host Group - названия групп портов HBA из столбца Host, соответствующих каждому из лезвий.
2. Host - HBA адаптеры каждого из лезвий.
3. CA Port Group - названия групп портов контроллеров СХД из вкладки CA Port.
4. CA Port - порты СХД, которые подключены к серверу, где CM#X - контроллер, CA#X - группа портов на контроллере, Port#X - порт каждой из групп.
5. LUN Group - группа из LUN, которые необходимо презентовать Blade-серверу.
6. Host Response - режим работы хоста, работающий в режиме Active/Active (настройка проведена руками).

Здесь возникает второй (2) вопрос - корректно ли выполнять презентацию по отдельным лезвиям? Или можно было собрать всё в одну кучу?

3. VMware.
VMWare видит оба LUN.
Выглядит это следующим образом:
1574154559199268664.png

Каждый vmhba видит оба LUN в двойном количестве (...3e:20 и ...3e:30 - WWN адреса портов СХД). Установлен режим путей Round-Robin для каждого из LUN.

Возникает третий (3) вопрос - а правильно ли выполнена настройка VMWare?

И вот здесь мы приходим к следующему.

Проблема:

Ранее, в VMWare был выбран режим "Fixed". Какие пути были выбраны - данная информация, к сожалению, не сохранилась. Все работало корректно пару дней с парой легких виртуальных машин на борту (1 - Ubuntu, 2 - Windows 7). Вечером третьего дня запустил на СХД миграцию ВМ с Windows Server 2008 R2. Более никаких изменений в конфигурацию не вносилось.

На следующий день посыпались жалобы на то, что всё работающее на СХД тормозит.

При использовании утилиты esxtop с параметром 'd' (подключаясь по SSH на одно из лезвий), появлялись огромные значения DAVG, KAVG, GAVG и QAVG:
1574155469111118342.jpg

Режим был изменен на Round-Robin. Часть путей была отключена. Худо-бедно и в спешке виртуальные машины были размигрированы с СХД.

В данный момент СХД как-то работает, но как - непонятно.
После уже месячных попыток настройки и чтения мануалов уже нет точного представления как всё это должно работать.
Хотелось бы получить советы, каким образом нужно подойти к организации системы хранения данных вместе с Blade-сервером имея только один SAN-свитч.
Признателен любой помощи в выборе правильно подхода! Спасибо!
  • Вопрос задан
  • 844 просмотра
Пригласить эксперта
Ответы на вопрос 1
@noute
Ну ты и лермонтов читал не все и не внимательно уж очень много.
1. Если хочешь иметь геморой с портами и постоянно записывать что куда. Можешь занировать по портам (безопасник будет рад - но он идиот потому как для безопастности есть шифрование трафика и GDPR). Так что делай как делал. На практике скажу это намного проще сунул и забыл.
2. Все зависит от целей, самой групировки лезвий и что там крутится. Если это одинаковые системы для одинаковых целей. То все для одного. Если это разнородные блейд сервера (для разных целей) то для каждого отдельно.
3. Скорее всего тормозила не СХД (вывод графика с СХД нужен), а Датастор перегрузили.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы