Почему пропадает соединение у конкретной виртуалки в Proxmox?
В гипервизоре есть виртуалка на убунту (24), примерно раз в час полностью пропадает соединение с ней на минуту. Не достучаться ни по одному порту, послушал TCP трафик, очень редко проскакивает какой-то ответ, но в основном запросы только посылаются. На всех остальных виртуалках всё стабильно, сам Proxmox тоже не ложится, а дефектная виртуалка полностью функционирует во время падений, за исключением проблем с сетью. Пробовал отключать все сервисы, которые я на неё поставил, падает по тем же паттернам. В логах ничего подозрительного нет.
Подскажите, куда двигаться? Даже не знаю, что проверить следующим и куда стучаться, сеть локальная и никаких проблем с маршрутизацией нет.
UPD: пробовал менять сетевую карту (intel E1000, VirtIO), IP статический, драйвера обновлены. Опытным путём выяснил, что запросы (по меньшей мере, ICMP запросы), адресованные именно ЭТОЙ виртуалке, не доходят даже до Proxmox, адресованные другим виртуалкам - проходят.
А удалить и добавить заново сетевую карту пробовали? Драйверы сетевой обновить/откатить? Что-то похожее было в VMware: периодически сеть ломалась и коннект то есть, то его нет - удаление и повторное добавление сетевой карты только и помогало.
IP-адрес на виртуалке статический? Если динамический - посмотрите параметры резервирования адреса (срок действия, посчитайте через какое время начинает посылать запросы на продление) и проверьте на соответствие периодам, с которыми пропадает сеть. Если есть подозрения - смотрите реакцию dhcp-сервера на запросы
Может что-то с маршрутизацией? Получается что другие хосты даже не знают, что нужно к Proxmoxу обращаться, чтоб до неё достучаться. Трассировку пробовали делать с какого-нибудь хоста вне Proxmox до проблемной машины? Пробуйте еще до другой виртуалки и сравнивайте результаты
kira_clover, Вот тоже подумал, но между машинками то всего 1 хоп - они находятся в одной локальной сети, а Proxmox просто поднимает мост, который не участвует в маршрутизации.
Нашёл проблему с arp таблицами, там MAC адрес не тот, но это по идее не корень проблемы, машинки же могут общаться 95% времени
Как оказалось, этот IP был зарезервирован DHCP для другой, редко используемой машины. В итоге в сети внезапно оказывалось два устройства с одинаковым IP, ну и начинался этот хаос
1) отключить энергосбережение везде вообще везде. начиная с BIOS гипервизора, потом все ВМ, потом изнутри ОС. если поможет - сжечь портрет Греты Тунберг в литре 92 бензина.
2) сделать виртуалку на дебиане, на редхатообразных, на арче, на виндовсе. с теми же сервисами.