Попался на глаза пост
про пакет смерти для сетевых Intel, подозреваю примерно аналогичный баг у себя на сервере.
Буквально недавно, 18 января, взял сервер в Hetzner EX4.
С помощью installimage поставил готовую сборку
Debian + Proxmox, ядро 2.6.32-17-pve, pve-manager 2.2-32, сетевая RTL8111/8168B PCI-E (rev 09).
Пустил трафик с боевого приложения около 60-80 Мбит/с, в логах пошла ругань
kernel: TCP: time wait bucket table overflow (CT0)
в sysctl
net.ipv4.tcp_max_tw_buckets=3800000
эффекта не дало
В произвольные, как показалось, моменты времени, через 5-10 минут после подачи трафика, сервер самопроизвольно зависал (по крайней мере сетевой интерфейс) после холодного ресета, в логах — ничего, то есть обычный рабочий лог просто прерывается логом начала загрузки (ресет).
После снятия нагрузки по трафику, с практически нулевым трафиком, сервак продолжил зависать, но раз в несколько дней — симптомы абсолютно теже, хотя ругани в логах нет вообще никакой (
bucket table overflow
тоже пропало)
Кто-нибудь сталкивался с таким поведением? Что это может быть?
PS: в том же хетзнере, на другом сервере
RTL8111/8168B PCI-E (rev 02)
держится под этой нагрузкой наура (собственно с него и думал переносить)