Всем привет, есть кластер: 3 мастера, 4 воркера
SUSE CaasP V3
Kubernetes v1.10.11
на нём в общей сложности слегка пыхтят порядка 50и (включая системные) подов,
без нагрузки
пару реквестов в секунду.
На неделе подключил/запустил реплику для одно из подов (replicas: 2), под запустился, но не имеет связи с базой данных (Postgres, тоже на кластере) - я не долго думая убил реплику - автоматом перезапустилась - всё нормально и я не придал этому значения.
Сегодня я добавил 6 новых (новый deployment) подов, два из-них (разные deployments) такая же проблема.
Т.е. связи с базой нет. Убил один (перезагрузился) - та же проблема. Ещё раз убил - работает.
Второй под держу, дабы найти проблему!
Думал проблема в ноде - нет (как я думаю). На этом воркере работают другие поды, без проблем.
Основная проблема - нет связи внутри кластера, к базе.. Но до самого пода из другого (рабочего) я достучатся могу. Т.е. речь идёт именно о исходящей коммуникации.
К примеру apt-get install nano также не работает:
Err:1 archive.ubuntu.com/ubuntu bionic/main amd64 nano amd64 2.9.3-2
Temporary failure resolving 'archive.ubuntu.com'
E: Failed to fetch archive.ubuntu.com/ubuntu/pool/main/n/nano/nano_2.... Temporary failure resolving 'archive.ubuntu.com'
E: Unable to fetch some archives, maybe run apt-get update or try with --fix-missing?
Проблема возникает именно в самом поде, образы контейнера каждый раз, без проблем скачиваются с репозитория.
Есть идея, где искать проблему?
Спасибо!