Ответы пользователя по тегу Мониторинг
  • Какие метрики Сadvisor служат для мониторинга состояния контейнеров?

    @zohan1993
    devops
    вроде не по нулям
    отображает количество процессов в контейнере и их статус
    метрики контейнера cadvisor
    container_tasks_state{container_label_com_docker_compose_config_hash="9fa29f6a4f0109ddd64ab672bc9bd54b1165b7f97d0200426d5056d7b4872616",container_label_com_docker_compose_container_number="1",container_label_com_docker_compose_oneoff="False",container_label_com_docker_compose_project="cadvisor",container_label_com_docker_compose_project_config_files="docker-compose.yml",container_label_com_docker_compose_project_working_dir="/root/cadvisor",container_label_com_docker_compose_service="cadvisor",container_label_com_docker_compose_version="1.28.4",container_label_maintainer="",id="/docker/7308f65599d3ed688cc065d3006dae239e43021fe1f6e791212334b44daa4442",image="gcr.io/cadvisor/cadvisor:v0.37.5",name="cadvisor",state="running"} 1 1627564837916
    
    container_tasks_state{container_label_com_docker_compose_config_hash="9fa29f6a4f0109ddd64ab672bc9bd54b1165b7f97d0200426d5056d7b4872616",container_label_com_docker_compose_container_number="1",container_label_com_docker_compose_oneoff="False",container_label_com_docker_compose_project="cadvisor",container_label_com_docker_compose_project_config_files="docker-compose.yml",container_label_com_docker_compose_project_working_dir="/root/cadvisor",container_label_com_docker_compose_service="cadvisor",container_label_com_docker_compose_version="1.28.4",container_label_maintainer="",id="/docker/7308f65599d3ed688cc065d3006dae239e43021fe1f6e791212334b44daa4442",image="gcr.io/cadvisor/cadvisor:v0.37.5",name="cadvisor",state="sleeping"} 12 1627564837916
    Ответ написан
    Комментировать
  • Как лучше вести статистику по работе сервиса?

    @zohan1993
    devops
    все зависит от того, как планируете собирать, хранить, обрабатывать метрики
    например, если нужно просто считать количество выполненных заданий по каждому экземпляру сервиса
    и уже есть мониторинг на основе Prometheus
    удобно будет использовать клиентскую библиотеку Prometheus для Python
    https://github.com/prometheus/client_python
    потом можно с легкостью эти данные собирать в Prometheus, ну и соответственно дальше их обрабатывать
    Ответ написан
    Комментировать
  • Есть ли толковая замена monit?

    @zohan1993
    devops
    была подобная задача
    нужно было делать определенные действия на хостинге и на хостах
    так как весь мониторинг был построен вокруг Prometheus + Grafana + Alertmanager + куча експортеров, было желание прикрутить все в эту схему
    решение которое покрыло все задачи
    https://github.com/adnanh/webhook/

    если коротко, есть alert rule c определенным label, когда правило сработало, alert manager через routes отправляет сообщение (POST) на receiver - webhook endpoint, чем и запускает execute-command которая настроена для этого webhook endpoint, а дальше как фантазия и возможности позволяют, у меня была работа по API c хостингом, запуск джобов через API на Ansible Tower, просто запуск команд через SSH
    Ответ написан
    Комментировать
  • Какой коллектор системных метрик можете посоветовать для Grafana?

    @zohan1993
    devops
    1. Zabbix windows / linux agent --> Zabbix server --> Grafana

    2. Prometheus node / wmi exporter --> Prometheus --> Grafana

    3. Collectd --> Graphite --> Grafana
    Ответ написан
    Комментировать