Загадка тормозного FibreChannel NAS?

Question

Александр Пащенко @point212

сисадмин linux, программист php

Загадка тормозного FibreChannel NAS?

День добрый.

Решили мы в компании перейти на серьёзные рельсы, чтобы всё «как у взрослых». NAS, SAN, FibreChannel и Hyper-V. Закупили оборудование, собрали, поставили и… упёрлись в проблему.

Если кратко, то проблема в производительности дискового хранилища — она плавает и падает до очень низкой.

Если полно, то читайте далее:

Итак дано:

2 шт NAS IBM DS3512 укомплектованные 12ю дисками SAS 15k на 600Гб каждый, маркированными как IBM (в реале вроде бы произведены Seagate и предназначенными именно для этой модели NAS). Так же в каждый NAS установлено по две (2 шт) карты FibreChannel 8Gbit, на 4 порта каждая. В железяке 2 «головы», имеющих независимый доступ к дискам, и соответственно по карте FC на каждую.

2 шт SAN FibreChannel Switched Fabric IBM SAN24B-5 так же с портами на 8Gbit.

3 шт сервера IBM 3550 M4 7414-F2G. В каждый сервер установлено по FibreChannel карте производства Qlogic на 2 порта 8Gbit. Внутри тоже SAS винты.

Всё фирменное, совместимое, собранное по рекомендациям лучших собаководов и вендоров.

На NAS-ах из всех 12-и винтов собран RAID5 и презентован в SAN. На RAIDе создан 4Тб раздел (GPT, NTFS) и пара разделов поменьше.

На серверах сейчас стоит Windows 2012 Server (180-trial). Драйвера ко всем железкам самые свежие, с офф.сайта IBM.

Для простоты картины будем рассматривать один сервер, один switch, и один NAS. Всё остальное в эксперименте не учавствует.

Тест:

Берём объемный файлик, например 4-8Гб, лежащий на винте сервера. Средствами винды копируем его на раздел, который презентован с NAS-а и наблюдаем эффекты.

1) Первые 1-2-4 секунды копирование идёт со скоростью 300-800Мбайт/сек. Потом плавно или резко падает до 30-60Мбайт/сек и плавно снижается далее. Впрочем иногда успевает на полной скорости скопироваться весь файл.

2) До и после копирования возможно замирание, когда окошко копирования висит и не реагирует на мышь длительностью до 1-20 (иногда больше) секунд. Иногда этого замирания нет.

3) Во время копирования NAS интенсивно мигает лампочками винтов. Когда окошко копирования «висит» — индикаторы активности дисков на NAS не мигают и не горят

4) При попытке удалить свежескопированный на NAS файл, окошко удаления замирает на 20-50 секунд, затем только удаляет файл.

5) Пробовали копировать файл лежащий на NAS на него же, но в другую папку — проблемы аналогичные.

Дисклеймер или «мы уже пробовали»:

— Подключать сервер и NAS напрямую, минуя Switch.

— Оставлять подключенным к NASу один единственный сервер по одному единственному линку.

— Делать всё тоже самое с другим NAS-ом, и другим сервером.

— Ставить Windows Server 2008 R2.

— Делать раздел на хранилище меньшего объема — 500Гб (GPT).

Спецэффекты наблюдаются всё те же.

Что это может быть? Куда смотреть, куда копать?

P/S Простите за терминологию. Мог попутать термины для обозначения железяк, но в целом картина верна.

Вопрос задан более трёх лет назад
6975 просмотров

5 комментариев

Подписаться 7 Оценить 5 комментариев

muzzle @muzzle

Hyper-V

Вышеописанное внутри виртуалки происходит?
Multipath как включен?
Кэш на запись точно включен?
Есть какаянибудь утилка от полки, IOPSы и прочее померять?

Написано более трёх лет назад
muzzle @muzzle

Точнее не померять, а помониторить

Написано более трёх лет назад
muzzle @muzzle

Еще на оптическом свиче стоит посмотреть, что в это время происходит.

Написано более трёх лет назад
muzzle @muzzle

Свитч то Brocade или Cisco? (Вроде ИБМ своих не выпускает?)

Написано более трёх лет назад
Александр Пащенко @point212 Автор вопроса

Вышеописанное внутри виртуалки происходит?
нет на сервере с подключенным луном с схд

Multipath как включен?
Вместе с утилитой IBM IBM DS Windows (x64) Storage Manager version 10.84.x5.30 идет SMIA-WinX64-10.84.x5.30 (включает Multipath с необходимыми настройками для DS3512), так что включён.

Кэш на запись точно включен?
Вот такие установки:
Enable Read Caching — Yes
Enable Write Caching — No

Есть какаянибудь утилка от полки, IOPSы и прочее померять?
Есть SANSurfer от Qlogic.

Свитч от Brocade

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 6

9 комментариев

Михаил Конюхов @piromanlynx

Попробуйте очистить кеши, и покидаться файлом размер которого меньше, чем размер кеша. Если тормозов не будет — то это оно и есть

Написано более трёх лет назад
Александр Пащенко @point212 Автор вопроса

Ну во первых разница в железе, софте и протоколе между Linux-ом и железкой — колоссальная. Я тоже подумал сначала что это кэш так работает. Но должно работать даже без кэша очччень быстро.

Чем очистить кэш — непонятно. Разве что выключить и включить железку снова. Но она внутри хитрая. Вполне может хранить список самых часто запрашиваемых блоков и после загрузки снова считать их в память :) Так что это будет не чистый эксперимент.

Если не ошибаюсь кэш у нее — 1Гбайт. Попробуем сейчас мелкие файлы покидать.

Написано более трёх лет назад
Михаил Конюхов @piromanlynx

Когда кеш переполняется нагрузка на диски, посравнению с нагрузкой вообще без кеша в ~2 раза выше — он сохраняет закешированные данные на диск + новые порции данных.
Так же может иметь место проблема RAID5 и записи, мы когда то отошли от RAID5 в сторону RAID10.

Написано более трёх лет назад
Александр Пащенко @point212 Автор вопроса

Неужто настолько плохо все становится? Ведь это 15к SAS диски. Пусть даже RAID5 там вносит свою лепту, но неужто производительность дисков проседает до 30Мбайт/сек?

Написано более трёх лет назад
Александр Пащенко @point212 Автор вопроса

А что за проблема с RAID5 и записью на него?
RAID10 наше хранилище не поддерживает. Только RAID0,1,2,3,5,6

Написано более трёх лет назад
Михаил Конюхов @piromanlynx

30 МБАйт = 240 МбИт — помоему не плохо: www.nix.ru/support/bench/goods_compare.html?test_id=130
или я что то глобально путаю

Написано более трёх лет назад
Михаил Конюхов @piromanlynx

А скорость 800МБ = 6400МбИт — похоже на упор в скорость свича, т.е. явно запись идет в RAM

Написано более трёх лет назад
Михаил Конюхов @piromanlynx

RAID5 — ru.wikipedia.org/wiki/RAID#RAID_5
проблема в том что каждая операция записи 1го сектора — это посчитать XOR и записать на 2 диска по сектору. (если RAID из 3х дисков), соответственно в 1,5 раза больше нагрузка на диски

Написано более трёх лет назад
Михаил Конюхов @piromanlynx

Лучше всего посмотреть нагрузку на железку в момент перекидывания файла. Использование RAM, CPU, количество операация записи и чтения. Из этих данных можно сделать почти однозначные выводы

Написано более трёх лет назад

6 комментариев

Михаил Конюхов @piromanlynx

Если задача стоит о большом количестве паралельных записей (N виртуалок), то тестить перекидыванием большого файла бесполезно.
Мой Вам совет — разбейте рейд на более мелкие рейды (это поможет распаралелить запись), RAID5 в этом случае будет даже плюсом, т.к. с паралельной записью (в рамках одного рейда) у него всё впорядке.
Лучше проведите более реалистичный тест для Вашей ситуации — установить одну виртуалку, склонируйте её сколько нужно раз, запустите их все и понагружайте. Даже такой тест будет более реалистичен (для Вашей ситуации), чем кидание одного большого файла.

Написано более трёх лет назад
Александр Пащенко @point212 Автор вопроса

«Да, но...» (с)
Но ведь 12 очень шустрых винтов в рэйде — это огого сколько. С банальнейшей операцией линейной записи СХД такой конфигурации должен справляться не задумываясь.

А к более сложным экспериментам можно переходить лишь после успешного прохождения более простых.
Мы пробовали создать несколько виртуалок. Там тормоза внутри просто адовые.

И разбивать рэйд на несколько я не вижу смысла. Насколько я понимаю — чем больше винтов в РЭЙД5 — тем больше его надёжность.

Написано более трёх лет назад
Михаил Конюхов @piromanlynx

А можно как то померить нагрузку на СХД? RAM, CPU, количество операация записи и чтения. Без этих данных мы просто тычем пальцем в небо)

Написано более трёх лет назад
Александр Пащенко @point212 Автор вопроса

Да-да. Сейчас как раз мучаем утилиту, которая показывает внутренности NAS-а. Но опыта нет, и понять где у нее что пока не успели.

Написано более трёх лет назад
Михаил Конюхов @piromanlynx

Лучше всего будет смотреть на эти цифры в динамике: до тормозов, в момент начала тормозов, при тормозах

Написано более трёх лет назад
amc @amc

>>. Насколько я понимаю — чем больше винтов в РЭЙД5 — тем больше его надёжность.
Ууу…
Надежность RAID-5 — ровно один диск, как только он сдох, при сдыхании следующего — массив будет потерян.
Не, можно надеяться что второй диск будет далеко от первого и можно будет отресториться, но с тем же успехом можно надеяться на прилёт волшебника на голубом вертолёте.

В ваших условиях — либо RAID-6, либо RAID-10.

Написано более трёх лет назад

2 комментария

6 комментариев

Александр Пащенко @point212 Автор вопроса

Так же не забудьте, что в каждой полке вам нужен, как минимум, один global spare диск, чтобы не потерять массив если замена будет ехать слишком долго.

В DS3512 нет, или я не нашел, что либо свяанное с spare дисками. В нутри хранилища только предлогается создать массив (RAID), можно указать только из скольки дисков будет массив, на оставшишся дисках (не включенные в созданный массив) можно содать либо новый массив либо присоединить к ранее созданному. Ни каких вариаций на тему spare я не обнаружил

Написано более трёх лет назад
muzzle @muzzle

не нашел, что либо свяанное с spare дисками

В Storage Manager
Drive -> Hot Spare Coverage
есть?

Рэйд без Hot Spare = безудержный оптимизм

Написано более трёх лет назад
Александр Пащенко @point212 Автор вопроса

Нашел, спасибо — одного диска хватит? И есть какие либо предпочтения какой диск сделать Hot spare standby.

Написано более трёх лет назад
muzzle @muzzle

одного диска хватит?

Если на полке лежит еще один, на подмену — по идее должно хватить.
Хотя если диски на замену будут ехать полгода — то может и не хватить ;)

SAS диски довольно ходовой товар, их наверное побыстрее привезут чем например FC

Написано более трёх лет назад
amc @amc

одного диска хватит?

Зависит от.
В вашем случае я бы делал RAID-10, из 10 дисков, и 2 пускал бы на HS.

Написано более трёх лет назад
navion @navion

Там в базе идёт гарантия с 4 часовой реакцией, ну и диски на складах есть всегда.

Написано более трёх лет назад

2 комментария

djvnsk @djvnsk

Если не секрет, чем дело кончилось?

Написано более трёх лет назад
Александр Пащенко @point212 Автор вопроса

Ну занимался мой товарищ по ИТ-отделу. И в целом историю можно считать неоконченной. Производительность улучшить удалось, но что конкретно привело к этим действиям достоверно неизвестно. Мы даже обращались за помощью в IBM, но их ответ в итоге можно свести к фразе «платите деньги — мы расскажем чего и как». И это несмотря на купленную поддержку… видать мы купили какую-то поддержку очень начального уровня, а нужна очень продвинутого.

Конкретные вещи, которые помогли:
— установка на хост-машину дров от IBM только для HBA-адаптеров
— оставление драйвера MPIO от Майкрософта. Хотя есть и IBM-овские, но с ним хуже.

А вся прочая чёрная магия, вроде изменения очереди записи/чтения и еще каких-то хитрых настроек — давала лишь кратковременные нестабильные эффекты.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Серверное оборудование

Средний
Стоит ли брать б/у сервер?
- 4 подписчика
- вчера
- 3255 просмотров
9

ответов
Железо

+2 ещё

Простой
1 ПК для работы и сервера или 2 раздельных?
- 1 подписчик
- 02 авг.
- 353 просмотра
4

ответа
Серверное оборудование

+2 ещё

Средний
QNAP вместо сервера. Возможно?
- 1 подписчик
- 30 июл.
- 154 просмотра
4

ответа
Программное обеспечение и интернет-сервисы

+2 ещё

Простой
Проблемы с софтом видеонаблюдения. Постоянная загрузка, как исправить?
- 1 подписчик
- 21 июл.
- 158 просмотров
2

ответа
Linux

+2 ещё

Простой
Как в OpenMediaVault переправить с портов на поддомен?
- 1 подписчик
- 14 июл.
- 170 просмотров
1

ответ
VPN

+3 ещё

Средний
Нет доступа к web интерфейсам по l2tp, что делать?
- 1 подписчик
- 14 июл.
- 193 просмотра
3

ответа
NAS

Простой
Как сменить SSL сертификат Terramaster?
- 1 подписчик
- 25 июн.
- 101 просмотр
1

ответ
Серверное оборудование

Простой
Как включить сервер, используя схему на веб-интерфейсе?
- 2 подписчика
- 24 июн.
- 229 просмотров
1

ответ
NAS

+1 ещё

Простой
Как войти в SMB в VLC плеере?
- 1 подписчик
- 23 июн.
- 128 просмотров
2

ответа
Железо

+1 ещё

Средний
Есть +-40к на сервер для моих пет проектов (на одном есть небольшая нагрузка, +- 50 пользователей в день). Что посоветуете купить?
- 1 подписчик
- 21 июн.
- 433 просмотра
3

ответа
Показать ещё Загружается…

Fullstack разработчик

Wanted

До 250 000 ₽

Специалист по развитию серверной инфраструктуры

Гринатом • Москва

До 180 000 ₽

Product Lead

Wanted • Санкт-Петербург

До 450 000 ₽

Hyper-V

Вышеописанное внутри виртуалки происходит?
Multipath как включен?
Кэш на запись точно включен?
Есть какаянибудь утилка от полки, IOPSы и прочее померять?
Точнее не померять, а помониторить
Еще на оптическом свиче стоит посмотреть, что в это время происходит.
Свитч то Brocade или Cisco? (Вроде ИБМ своих не выпускает?)
Вышеописанное внутри виртуалки происходит?
нет на сервере с подключенным луном с схд

Multipath как включен?
Вместе с утилитой IBM IBM DS Windows (x64) Storage Manager version 10.84.x5.30 идет SMIA-WinX64-10.84.x5.30 (включает Multipath с необходимыми настройками для DS3512), так что включён.

Кэш на запись точно включен?
Вот такие установки:
Enable Read Caching — Yes
Enable Write Caching — No

Есть какаянибудь утилка от полки, IOPSы и прочее померять?
Есть SANSurfer от Qlogic.

Свитч от Brocade

Answer 1 · 2012-12-18 15:11:59

Похоже на то, что собственно момент тормоза — это и есть конец кеша на запись. Буфер запонился — началось прямое писание на диск.
P.S. не знаю как на Вашем железе и софте, у меня была такая проблема с Linux+ext4+iSCSI — именно окончание кеша на запись

Answer 2 · 2012-12-18 15:43:50

Ну как сказать «неплохо». Должно быть офигенно.
Потому что на СХД должны лежать образы дисков виртуальных машин, для обеспечения миграции их между серверами.
Естественно эти образы будут постоянно изменяться, и естественно нужно обеспечить им приемлимую производительность.
Обычный железный винт обеспечивает скорость записи около 100мбайт/сек. В СХД же в рэйде5 суммарная скорость должна быть… не знаю точно… но явно не меньше 100мбайт/сек.

Конечно неправильно измерять все в Мб/сек, но к сожалению в IOPS'ах я плаваю.

Answer 3 · 2012-12-18 16:07:36

С глубиной очереди в винде не игрались?
AFAIR у Qlogic'a она слишком низка по дефолту.
Ну и вообще в сторону *nix не смотрели хотя бы для тестов?

Answer 4 · 2012-12-18 20:33:47

Вариант 1. По моим представлениям кэш на запись обычно бывает не включен (Enable Write Caching — No) в случае, если отсутствует резервирование кэш-памяти. Т.е. если у контроллера нет возможности сохранить содержимое кэша в случае пропадания внешнего электропитания. Насколько мне известно, в ходу сейчас две технологии резервирования кэша: с использованием резервной флеш-памяти (например, HP FBWC) и с использованием резервного источника питания для микросхем кэш-памяти контроллера (т.н. Battery Backup Unit, BBU). Поэтому я думаю, что есть смысл разобраться с вашим контроллером и при необходимости докупить к нему «батарейку» BBU. В любом случае включение кэша на запись станет большим плюсом к производительности.

Вариант 2. Недавно боролся с подобной проблемой. Виноват оказался не кэш, а антивирус, установленный на сервере (Symantec Endpoint Protection 11). Снос антивируса (с последующей заменой на другой) проблему решил полностью.

Answer 5 · 2012-12-19 02:56:21

Первые 1-2-4 секунды копирование идёт со скоростью 300-800Мбайт/сек.

файл тупо в кеш идёт

Потом плавно или резко падает до 30-60Мбайт/сек и плавно снижается далее

кеш кончился, пишем на реальной скорости.

Для проверки:
переведите все адаптеры на 4Гбит, при необходимости до 2Гбит;
тестируйте без MPIO, полку напрямую в HBA;
вырубите кеш на полке;
для проверки создайте рейд-0 на все диски;
проверяйте, в таких условиях вы должны получать достаточную скорость и для потоковой записи, и для случайной.

И ещё, рейд-10 — это два (три, четыре) рейд-1 объединённых в рейд-0. На IBMовских полках он так и создаётся.

Так же не забудьте, что в каждой полке вам нужен, как минимум, один global spare диск, чтобы не потерять массив если замена будет ехать слишком долго.

Answer 6 · 2012-12-22 12:34:48

В общем все это не приблизило нас к ответу. Скорость должна быть хорошая и без всяких там кэшей.
Официальный ответ от IBM — обновляйте прошивки всего, чего только можете. Только вот незадача — мы их и так уже везде обновили.

Загадка тормозного FibreChannel NAS?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт