Доброго времени суток.
Имеется сервер: HP ProLiant LD380 G7(Intel Xeon E5645, 26Gb ОЗУ, 7 HHD HP EG0300FBDBR RAID5). На нем установлена VMWare ESXi.
На нем развернуты - DC, DHCP, WDS, Mail Server(100+ пользователей), FS(300+ пользователей), Факс сервер на Elastix и небольшой внутренний web сервис на debian), Все диски - Thin Provision.
Стали ежедневно появляться предупреждение Device naa.600508b1001c7d66fbd5fdf91dbe37aa performance has deteriorated. I/O latency increased from average value of 1766 microseconds to 35820 microseconds. Да и по ощущениям, все стало медленнее работать, в связи с этим обдумываем замену HDD на SSD. Но из разных обсуждений и статей возникло непонимание:
1 - Нужно все таки для SSD делать рейд или настроить ручное дублирование данных? Везде пишут по разному.
2 - Стоит ли рассматривать NVMe диски? Не уверен нужна ли настолько большая скорость и как я понял их нельзя связать в аппаратный рейд.
3 - Если все таки брать NVMe диски, можно ли их организовать в программный рейд средствами VWWare? И опять же стоит ли это вообще делать?
4 - Может быть вообще нынешняя дисковая подсистема может справляться с развернутыми серверами и порекомендуете провести какие-либо настройки VMWare? Хотя наверное сложно что-то советовать, без больших подробностей...
Нужно все таки для SSD делать рейд или настроить ручное дублирование данных? Везде пишут по разному.
Если вам нужны какие-то преимущества, которые дает рэйд- вполне нужно. Например то же зеркало сделать.
Стоит ли рассматривать NVMe диски? Не уверен нужна ли настолько большая скорость и как я понял их нельзя связать в аппаратный рейд.
Очень желательно рассматривать именно их. Но можно обойтись и другими.
Следует помнить что с SSD много специфики связанной с принципами работы SSD.
Например в вашем случае явно не будет работать TRIM - поэтому нужно будет обязательно оставлять over provisioning. В вашей ситуации просто заменив HDD на SSD можно добиться ухудшения ситуации.
Желательно рассчитывать и прогнозировать нагрузку и брать соответствующие SSD.
Если вам нужны какие-то преимущества, которые дает рэйд- вполне нужно. Например то же зеркало сделать.
Ну для надежности как мне кажется хотя бы R1 то должен быть, а то и может даже R10. Но сталкивался со многими комментариями, что не стоит SSD вообще объединять в рейды...
Очень желательно рассматривать именно их. Но можно обойтись и другими.
Если рассматривать NVMe, то как быть с рейдом?
Не порекомендуете какой нибудь хороший источник, чтобы подробно про нюансы SSD почитать?
Ну для надежности как мне кажется хотя бы R1 то должен быть
R1 это не для надежности, а для бесперебойной работы, чтобы в случае отказа диска у вас сервер продолжил работать.
Если такое требование есть - да нужно, но там надо смотреть чтобы и другие компоненты вроде питания были резервированы. В особо критичных случаях дублируют сервера.
Если рассматривать NVMe, то как быть с рейдом?
Soft RAID, или VROC
Не порекомендуете какой нибудь хороший источник, чтобы подробно про нюансы SSD почитать?
Сложно сказать www.outsidethebox.ms/?s=ssd https://ru.wikipedia.org/wiki/%D0%A4%D0%BB%D0%B5%D...
Вообще принцип простой, особенно в серверах - не надейтесь на TRIM, прогнозируйте объем записи на SSD, и исходя из него оставляйте over provisioning.
Если объединять в рэйд, желательно чтобы прошивка диска была соответствующая - т.е серверные диски нужны.
Если есть деньги смотрите в сторону новых SSD Intel Optane на 3dxpoint - они лишены всех недостатков обычных SSD. Такие вещи как TRIM, over provisioning, и прочее для них не нужны вообще и не имеют смысла. Они не NAND.
В общем я бы на вашем месте начал с анализа текущей нагрузки, определения узких мест дисковой подсистемы - кто какую нагрузку создает, линейное чтение, случайное, какими блоками в основном, какие очереди у логических и физических дисков, сколько пишется данных вообще в сутки, какими порциями.
И исходя из этого уже принимал бы решение.
Ну мы их рассматривали, чтобы уж наверняка с заделом на будущее. Но вполне может быть что они и правда не нужны. Предполагаю просто что тормоза начались после создания файлового сервера к которому соответственно много обращений именно к дисковой системе, плюс учитывая что используется тонкий диск vmware, то я так понимаю у него сильно большая фрагментация данных и соответственно чтение/запись идут не последовательные а случайные.
Предполагаю просто что тормоза начались после создания файлового сервера
Файловый сервер и виртуализация это не совсем то что следует совмещать.
Для файлового сервера чаще всего вполне пойдут и HDD, но они должны быть именно для него.
Сайпутдин Омаров, Тут все не так просто. Фирма довольно крупная и на покупки типа серверов деньги выделяет центральный офис, который в 99% говорит крутитесь как можете. А SSD как расходники купить можно. Проверено уже не раз. Можно конечно попробовать еще раз ткнуться в эту сторону, но хз... Да и по сути остальных то ресурсов сервера хватает.