Задать вопрос
@r3aly

Как узнать, почему зависает ESXi хост?

История такова, достался в наследство ESXi хост 5.1 на десктопном железе, решили обновить не глядя до версии 6.0. Все прошло успешно, не считая того, что после обновления пропали драйвера на сетевую карту (RTL8169). Нагуглил, что ESXi потихоньку убирает поддержку десктопного железа в пользу серверного, и похоже драйвер слетел. Нашел мануал в инете, как через флешку подгрузить драйвера с 5.1 или с 5.5 Realtek 8169 и др. на 6.0. Все сделал, все заработало. Но происшествию пару-тройки дней, хост начал подвисать наглухо. То есть пока по питанию его не перезагрузишь. До этого (когда он там достался на версии 5.1, аптайм был более полугода) здесь же, после обновления, больше 3 дней пока не видел.

Т.к. являюсь относительно новичком в этом деле, прошу помощи, где и что в логах почитать и найти, из-за чего этот "подвисон" происходит и что делать, но сам хост особо не нагружен гостевыми ОС. И можно ли так "высадить" хост из вне?
  • Вопрос задан
  • 2280 просмотров
Подписаться 2 Оценить Комментировать
Пригласить эксперта
Ответы на вопрос 2
fr0z
@fr0z
IDC ing
"...решили обновить не глядя до версии 6.0..."
вертайте назад на 5.1
Ответ написан
@Yestestvenno
Системный администратор
оставлю это тут так как часто попадается статья при гуглении

Итого симптомы 1 в 1, только версия 6.0

Была найдена статья https://sysadminz.ru/index.php?topic=9765.0
как оказалось проблема может быть даже если не используете рейд
но обновлять драйвер контроллера все же не стали так как проблема была с сервером резервный копий, стремено быть без них.
но вот вбив команду команду "dmesg | grep MSI" из статьи

Обнаружил ошибку
2020-07-13T08:02:22.697Z cpu4:33130)WARNING: VMK_PCI: 698: device 0000:00:14.0 failed to allocate 7 MSIX interrupts
2020-07-13T08:02:22.697Z cpu4:33130)WARNING: LinPCI: LinuxPCI_EnableMSIX:862: 0000:00:14.0: Interrupt allocation failed with Not supported

погуглив нашел
https://kb.vmware.com/s/article/2106740
т.е все дело всетаки в прерываниях и вопрос стоит в том как это поправить

Отключить эту штуку через интерфейс - никак
в биосе отключили IO Virtualization - VT-d (еле нашли где)

Пока полет нормальный, если не поможет будем обновлять контроллер
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы