Есть ряд микросервисов, запущенных на worker node. После перезапуска этой ноды, все упавшие поды начали восстанавливаться, но восстановиться не могут. Часть из них выходит в статус Running, но затем заново падает со статусом CrashLoopBackOff.
Причем в описании состояния висит это:
Last State: Terminated
Reason: Completed
Exit Code: 0
Started: Thu, 09 Jun 2022 12:48:37 +0000
Finished: Thu, 09 Jun 2022 12:49:16 +0000
Вроде оперативки и проца на worker node хватает. Проверял htop'ом - нагрузки нет. Из-за чего же тогда они постоянно запускаются и падают?
Если смотреть логи самих подов, то по логам можно понять, что приложение запускается.... а затем падает... Скорее всего из-за того, что сам k8s их стопает.
{"level":"info","msg":"Starting grpc server","time":"2022-06-09T12:16:16Z"}
{"level":"info","msg":"Shutting down server...","time":"2022-06-09T12:16:51Z"}
{"level":"info","msg":"Server exiting","time":"2022-06-09T12:16:52Z"}