Задать вопрос

Почему медленно работает сервер?

Расскажу поэтапно, что бы было более понятно. Просьба написать в комментарии к вопросу если какие то дополнительные данные нужны, выясню.
Сотрудники (~40 человек) работают через RDP на удалённом сервере. Работа элементарная, в офисных программах, 1С. Так сложилось исторически, это меняться не будет, во всяком случае в обозримом будущем. Выглядело это так же просто, на голое железо накатан win server 2019, в 1 рейде было 2 hdd 1tb. Конфигурация сервера следующая:
HP DL360 gen9/2x E5-2680v4/RAM 196Gb/2xSATA 960Gb/HDD 1Tb/
RAID HP P440ar 2Gb

Работало всё не так уж быстро, но стабильно. Помимо слабого железа были и другие проблемы, все сервисы в одном месте. 1С,субд, пользователи с их рдп сессиями, прочие программы.

Далее количество людей возросло, требование к быстродействию так же. Надо было что-то менять и мы решили приобрести сервер. Его изначальная конфигурация:
Dell R660 8SFF / 2х6444Y / 4х64GB DDR5 / H965i /
2хSSD 3,84TB NVMe (intel ssd d7 p5520 series 3.84 tb ssdpf2kx038t1) / 6хHDD 2,4TB SAS / 2х1,4kW /
iDRAC9 Ent

NVMe установлены в саму материнку, а не в рейд контроллер!(из за невозможности установить nvme в этот рейд, о чем поставщик умолчал). По подсчетам такого объема RAM должно было хватить на 1-2 года, а мощности процессора в купе с nvme дисками должны были дать ощутимый прирост к быстродействию системы, файлов не столь ощутимо, т.к. они хранились на сасах, но в целом, всё должно было быть ок. Но если бы это было так, я бы сейчас не задавал этот вопрос, потерянный от непонимания причин.

Проясню, что я совсем не разбираюсь в серверном железе, могу только оценить/сравнить цифры, потоки, ширина шины, объем кэшей и прочее, но про совместимость ноль понимания. То же касается и софтовой части, в общих чертах знаю как работает виртуализация, но не в деталях. Сам я не занимаюсь процессом, но контролирую его.

Это было предисловие, а сейчас к самой проблеме:
Установили proxmox, сделали вм для домена и обменки (WinS2025), вм для 1с, вм для рдп WinS2025.
Был сделан 1 рейд nvme на базе софтового рейда, остальные сасы в 5 рейд на базе 965 рейд контроллера. При тестировании(тест гилёва, обычный файловый серфинг) система показывал себя хуже пентиума. Папки, файлы открывались очень медленно, тест гилёва показывал ~20 баллов. Решили протестировать nvme без рейда, тест гилёва показывал 70+, но скорость работы не сильно увеличилась (тут я могу быть не точным, т.к. это слова админов, замеры скорости никакие не остались) Было проведено в общей сложности около 20и тестов. 1С на nvme. 1С не на нвме но на сасах, 1с без нвме, чистая нвме где только 1С. В том числе был ряд других тестов. С виртуализацией на гипер-ви. и VMware. по результатам показатели были идентичными. Так же был тест установки WinS2025/2019 без вирутализации на голое железо. Везде nvme показывал себя плохо.

Обратившись к поставщикам по гарантии, после их проверки, нам было сказано, что железо работает как и должно, опущу все подробности, но если вкратце, тогда я принял решение поставить вместо nvme еще 2 таких же саса, т.к. они хотя бы показывали нормальные показатели в гилёве.

После переноса всего рабочего процесса людей на новый сервер мы столкнулись с валом проблем, но что касается моего вопроса, это зависания, падение сервера, резкое потребление ram с 30% до 100% с последующим падением сервера, медленная работа файлов(макросов в них, обновление формул), 1С, совсем не лучше предыдущего сервера. Админы говорят, что это из-за памяти, т.к. proxmox забирает 25% от выделенного объема, т.е. 120+- гб на рдп ему не хватает, тоже и с 1с, 100гб ему не хватает - в связи с чем идёт перераспределение памяти текущих сессий и как следствие зависания и тормоза. Загрузка часто доходит до 75%.

В состоянии полной неопределенности и понимания я хочу найти ответы, получается, на 2 основных вопроса:
Почему при изначальной сборке(на nvme) могло работать не так? (пожалуйста от наиболее вероятной причине к наименее)
Почему, после замены nvme, система всё ещё работает медленно, в частности открытие файлов/обработка макросов/формул/1С? Что я могу проверить, что админы настроили корректно, а что нет? Что является правильным/best practice при настройке в таком виде?

Буду благодарен за любую помощь!
  • Вопрос задан
  • 2366 просмотров
Подписаться 6 Средний 14 комментариев
Пригласить эксперта
Ответы на вопрос 4
@KelevraX
"Был сделан 1 рейд nvme на базе софтового рейда" - если средствами мат платы, разберите его и просто пробросьте оба диска в проксмокс, там соберите ZFS raid1 (можно прямо при установке). Правильно выберите параметр ashift для вашего массива.
Как вариант, можно поставить проксмокс на 6хHDD 2,4TB SAS, а zfs raid1 использовать только для вм
При создании вм укажите контроллером диска VirtIO SCSI single, так же отметьте "Использовать QEMU Guest Agent"
После установки вм обязательно установите virtio-win driver с помощью iso-образа https://pve.proxmox.com/wiki/Qemu-guest-agent
Да, вм для 1с или 2019, ну или 2022 если хочется более долгосрочной поддержки
Ответ написан
Комментировать
@Dieman666
модели нвме дисков огласите.
а также нужно провести скоростные тесты через Live cd на этих дисках.
тест чтения виндовой виктории, а также тест последовательной записи aida64
p.s. 2025 винсервер в прод - такое себе решение.
система новая и не ясно, сколько нюансов она может привнести.
2019 винсерв с обновами бест чойс.
по поводу памяти, к 1с как люди подключаются? rdp/remoteapp/публикация базы и подключение через тонкий/веб клиент? настроено ли ограничение памяти в субд?
так ли нужно людям создавать полноценную рдп сессию на сервере для работы?
ибо доки и так можно через шару с огр правами (тем более домен есть) рулить, а подключение извне через впн
Ответ написан
Комментировать
@VoidMarquis
единственное, что я запомнил на всю жизнь, так это то, что никогда нельзя брать диски от Intel. они ведут себя слишком странно. вроде, диск неплохой, ТХ хорошие, но при этом работает отвратительно. если диск, то лучше Kingston или Samsung.

Ещё есть нехилая вероятность, что проблема в кристале процессора. у Intel 2 года назад было загрязнение на производстве кристаллов, с которым они не могут разобраться до сих пор. деградирующий чип, который не может корректно отрабатывать внутренние инструкции = система, которая ведёт себя абсолютно непредсказуемо.

касательно софтин, я бы предложил потестить сначала всё оборудование через аиду, потом делать выводы.

Также попробовать поставить линуксы и посмотреть, как система будет себя вести.

Ещё из причин наиболее очевидных — это скорость интернета на портах самого сервера, коммутаторе, розетках да и в общем на СКС.

Проверить, сколько ОЗУ у рейд контроллера, возможно её не хватает на такое количество дисков (необходимо, как я вижу хотя бы 4 гб для плавной работы) просмотреть какой из вариантов raid массивов используется и есть ли в этом необходимость.

посмотреть банально, что уходит в перегрзуз при стандартной работе, максимальной нагрузке на сервер и простое.

Ну и лучший совет, за который в меня захотят плюнуть — вернуть харды и поставить SSD форм-фактора 2.5. Любая винда любой редакции новее 7-ки не может нормально работать с хардами и постоянно уводит их в перегрузку.

касательно софтовых проблем, что RDP программы могут жрать столько оперативки — тоже верно, но лишь отчасти. зависит от конкретной редакции программы, у многих висит ограничение на количество занимаемой памяти, после которого они начинают кушать файл подкачки.

Кстати про файл подкачки, нужно проверить ещё и его, и убедиться, что его объём составляет МИНИМУМ в 1,7 раз больше, чем количество физической ОЗУ.

Ну и моё любимое: не покупать серверные базы на интеле, когда AMD выпускает дешёвые кластерные процессоры с огромным количеством ядер и нормальной частотой без косяков на производстве:)
Ответ написан
Комментировать
opium
@opium
Просто люблю качественно работать
Думаю вы просто не установили виртио драйвера для винды и виртиоанента а без них просадка из линукса в винде существенная
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы