Есть нода с KVM виртуализацией. Связка с SolusVM. Заметил, что при больших количествах VPS серверов на ноде (Больше 50), начинает вся свободная память на ноде уходить в кеш. Также забивается полностью SWAP. Но реально, свободной памяти еще очень много.
В такие моменты начинают падать некоторые серверы с ошибкой от cgroups о нехватке памяти на самом VPS сервере. Будто бы превышен лимит, и VPS отключается. Пробовал обновлять все до последних версий.
Также была такая же проблема на других нодах, но как-то само собой вылечилась после очистки свапа. Очистка свапа через swapoff -a приводит также к падению VPS.
Пробовал отключать cgroups, это приводит к тому, что после перезагрузки VPS выдает ошибку, что не найдена папка cgroups.
серверов на ноде (Больше 50), начинает вся свободная память
Господи, направь этих людей на путь истинный.
Я надеюсь, у вас там raid10 из SSD ?
Если не поняли тонкого намека, то: 50 виртуалок для kvm это много. Слишком. Система не успевает писать данные на диск (просто iops-ов не хватает). Поэтому весь кеш держится в памяти и его не получается смыть на диск.