Если подозрение на то, что проблема вызвана перегревом диска, тогда есть только две возможности ее решить:
1. Улучьшить охлаждение диска, возможно можно приклеить на него радиатор
Sienore, mdadm лучше тем, что если он развалится его легче восстановить. Если же выйдет из строя raid контроллер или выйдет из строя больше двух дисков, будет потеря данных 100% и восстановление будет стоить много денег, вы тут завязаны на надежность raid контроллера и своевременный мониторинг и замену дисков.
Делать под систему аппаратный рейд особенно из таких дисков не знаю зачем.Виделся только зеркало RAID1 из двух дисков. Тратить на систему два диска по 4tb наверное излишне.
Лучше купить еще два диска поменьше под это, можно два ssd 500gb, размер зависит от потребностей.
А под данные отдельный том, аппаратный либо mdadm либо zfs.
Если это просто для бэкапов или файлового хранилища, RAID 5 или 6 будет норм.
Опять же всегда можно пособирать разные варианты и потестировать производительность.
Все зависит от задач.
Зачем нужен вообще iscsi ? Если это для виртуализации, тогда raid 5 не советую.
Но все равно надо тестить.
Тут еще надо смотреть что у вас за диски, скорее всего это 7200 rpm, что опять же подходит только для файловых хранилища и под бэкапы.
3ton Если это не диски, то возможно память или проц.
В dmesg и syslog какие-нибудь ошибки есть?
Какой модели сервер? У него есть ipmi? Там в логах есть ошибки в момент перезагрузки?
sergey_danyuk, Честно говоря не могу найти актуальную информацию, но клонирование и холодная миграция идет через NFS и там максимальная скорость одного потока как раз 1.3 Гбит / с. В vSphere 8 эту часть улучшили значительно. https://vm-guru.com/news/vmware-vsphere-8-vmotion-udt
Так что либо вам нужно обновляться до vsphere 8, либо использовать другие средства для миграции машин, попробуйте Veeam
sergey_danyuk, Скорость должны быть больше. Посмотрите как нагружен диск во время клонирования, какая там latency.Это можно посмотреть в разделе monitoring хоста или командой esxtop ( u, d ) в консоли esxi. Если значение больше 30 мс или сильно скачет, значит диск не справляется.
Сетевых портов на компе сколько? Если больше одного, то проверьте тот ли к вам uplink настроен.На пример на делили экране в разделе Configure Management Network
Павел Беляев, Очень странное поведение. Если вы пишите, что стрекота нет при отсортированном разделе, это значит, это не активность raid’a, а обращения операционной системы или ПО. Какая файловая система на разделе?
Посмотрите командой lsof, что обращается к разделу, когда он подмонтирован.
Вопрос слишком общий.Информации дофига.
Начиная с vmguru.ru и заканчивая базой знаний vmware и whitepaper
По VMware вы на пример VCP training materials читали?
алексей Первый раз встречаю такие рекомендации для VMware. Вообще это не нормально, когда надо timeout увеличивать.Вы сильно грузите дисковую подсистему? Смотрите на ошибки в vmkernel.log.
Ещё раз проверьте прошивку, на сайте производителя сейчас доступна версия 1.69. У вас такая?
У этого диска TBW 80 тб и гарантия производителя 3 года , что уже очень хорошо.
А у вас сейчас TBW 17 тб, ну и износ показывает 10 процентов, что наверное похоже на правду.Думаю, при текущем профиле использования, диск еще поработает.
Тут надо смотреть на 231 SSD_life_left и 196 Reallocated_Event_Count, если последний начнет расти, тогда надо диск менять.
Делайте общие тома для всех хостов.
В кластере это лучшая практика.В таком случае будут доступны DRS и HA.
Привязать машину к хосту можно affinity rules.