Можно посмотреть на
https://my-netdata.io/
Но вообще, мониторинг из коробки - ИМХО нереально. Максимум будет видно, что хосты живы и сервисы запущены, но это ведь ни о чём не говорит.
Сервис может работать, но вывалиться из кластера. А может быть наоборот так задумано, чтобы именно сейчас этот инстанс был не синхронизирован.
Код может отдавать 500 при некорректных запросах и это можно игнорировать. Или наоборот, если по некоторым путям выдаются 500, то вы теряете деньги и надо срочно всех уведомить.
Задержка ответа до 10 секунд может быть вам некритична. А может быть критично, если 95 процентиль вышел за поол-секунды.
Про базу данных вообще молчу, куча параметров, которые могут быть для вас важны или не очень.