Какая архитектура и технологии для разделения GPU терминальным пользователям?

Всем привет!

У кого есть опыт, прошу разъяснить детальнее кейс:
Хотим собрать проектировщиков CAD (2-3D модельки и рендеринг всякого) на один физический сервер.
Немного углубившись возникли вопросы:

1) что проссто так виртуальные прослойки не дадут использовать бытовую карточку или карточка должна поддерживать архитектуру GPU Passthrough. И якобы если использовать ProxMox можно нарезать нужное кол-во виртуальных рабочих машинок под Win11 и etc и назначить им проброс этих карточек аля VDI. Но тогда над гибким управлением ресурсов речи не идет. В этом же кейсе, если накатить WinServ и запустить терминальных пользователей такая карточка вовсе будет игнорироваться и терминалы будут использовать встроенный GPU (вот тут до-конца мне не понятно, подскажете?)

2) Если выбрать терминал-вэй, тогда прослойку в видегипервизора будет затруднительно реализовать тут тоже прошу разъяснить:
есть вариант использовать для терминальных пользователей специализированную карту Nvidia a6000 48Gb, есть ли у кого опыт и в какой архитектуре и связке это работает?

Буду рад соображениям и опыту.
Заранее благодарен!
  • Вопрос задан
  • 156 просмотров
Пригласить эксперта
Ответы на вопрос 2
что проссто так виртуальные прослойки не дадут использовать бытовую карточку или карточка должна поддерживать архитектуру GPU Passthrough

Не совсем верно. Бытовые карточки часто можно использовать, если драйвера для операционной системы внутри гостевой ВМ поддерживают это, сейчас нвидия вроде бы без ограничений разрешает проброс карточки в гостевую виртуалку (раньшедрайвера отслеживали это и отказывались запускаться, гуглите знаменитый Code 43). Некоторые бытовые карточки настраивать геморно, нужно пробрасывать ROM видяхи на гипервизоре. Нужно искать информацию по конкретным моделям каротчек. У AMD проблемы с тем, что драйвера в гостевой ОС некорректно обрабатывают перезагрузку ВМ, для этого умные люди даже написали костыль vendor-reset для некоторых моделей карточек.

Но бытовые карточки конечно получится пробросить только целиком. Если вы хотите купить одну карточку и пробрасывать в несколько гостевых ВМ, вам нужна карта с поддержкой спеки SR-IOV, например у AMD эта спека реализована в виде технологии MxGPU. Поддерживается она в некоторых прошных карточках, например в некоторых картах из серии FirePro, стоят они соответствующих денег. У нвидии это вроде называется Multi-instance GPU, подробно не исследовал этот вопрос. Не, у нвидии технология так и называется vGPU, а MIG это один из способ реализации "распила" карточки на несколько виртуальных устройств, наряду с time sliced. Вот кстати инструкция по настройке vGPU на Proxmox VE, протестирована на карточке RTX A5000, близко к вашей. Рекомендую ознакомиться.

Я пользуюсь проброшенной целиком бытовой карточкой от AMD.

P.S. Материнка конечно тоже должна поддерживать SR-IOV, это встречается в серверных и workstation-платах.
Ответ написан
Комментировать
pindschik
@pindschik
ФЫВА ОЛДЖ
А вам точно нужно усложнять задачу и делать виртуализацию терминалки?
- Обычные серверы "в железе" будут дешевле (мнооого дешевле) и их тоже можно масштабировать, просто добавляя новых.
- Отказ одного - не трагедия, переключились на резервный, этот чиним/меняем.

Теперь по существу:
- желательно иметь и встройку и допом дискретную графику, встройка потащит простые задачи (как например просмотр, особо одаренными, ютуба в терминале), дискретка обеспечит ваши основные задачи.
- лучше все же брать Quadro, с ними точно проблем не будет. Ну или RTX Axxx. На вторичке (дадада) Quadro P2000 лишь чуть дороже 3050.
- не читайте про аппаратные рекомендации, тестируйте именно в ваших задачи самостоятельно. Иногда рекомендации бесполезны и даже вредны. А иногда разницы между Quardo и 3050 нет, т.к. обе будут недогружены.
- АМД не советую ни процы ни графику, хотя есть оправданные исключения.
- Сеть 2.5 гигабита или выше. Соответствующий коммутатор и сетевая на файловом сервере. Быстрые и большие SSD.
- Память от 64 на комп (терминал), лучше 128. Даже если она останется наполовину незанята, это все равно очень хорошо помогает (CAD свои временные файлы успевает создавать и обрабатывать в кэше, а в рендерах на 32 Гб вы даже процедурную траву не обработаете).
- Ядер 10 (больших), ну край 8, но ядра нужны. Важна частота, поэтому Xeon не особо хорош, лучше домашние процы с буковкой "К". Хорошее охлаждение процессора и корпуса, разгон по тепловым пакетам.
- Разделяйте станции рендера и рабочие. Пока один рендерит остальным будет некомфортно.
- Обязателен правильный тюнинг терминальной графики (в групповых политиках). Иначе будет не летать, а очень печально тупить.

По опыту на описанном серваке работают нормально 5, комфортно 7 проктировщиков в CAD. С Архитекторами отдельная история. Revit лучше чем Plant3D/CAD вывозит сложные чертежи и облака точек.

Решения с виртуализацией или арендой - входят в несколько раз дороже.
Можно брать на вторичке специализированные брендовые ПК ушедших иностранных компаний. Там еще выйдет экономия в 2 раза, при высоком качестве техники.

З.Ы.
Если же Вы сервис-провайдер, то печальные новости. Свое решение экономного клиента будет иметь окупаемость по сравнению с вашим - не более 8 месяцев. А потом работа в чистый убыток... Вам нужны специфические обстоятельства и настоящие нечестные конкурентные преимущества. :)
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы