Задать вопрос
Ответы пользователя по тегу Open Source
  • Free open-source система менеджемнта инцидентов?

    @yellowmew
    Cloud infrastructure, monitoring engineer. SRE
    я работал с opsgenie, pagerduty и xmatters.
    это комбайны, сфокусированные скорее на oncall и надежной доставке алертов, и фича "инцидент менеджмент" в них реализован совершенно по разному и, как правило, не является главной (и если мне не изменяет память то в PagerDuty любой алерт считается инцидентом, в то время как в Opsgenie "инцидент" можно автоматически создать по критериям из алертов)
    Для начала надо сформировать требования к решению "инцидент менеджмента": вполне может оказаться что вам необходим скорее alert и oncall менеджер (убирая за скобки надежность доставки сообщений - здесь вы в любом случае будете сами бороться, если устанавливаете opensource), а "инцидент менеджмент" может быть и не нужно чтобы этот конкретный софт реализовал. В общем случае ИМ - процесс, а не фича какого-то софта. Процесс можно организовать и в банальной вики, основываясь на данных alert manager (хотя конечно красивые картинки эскалации инцидента в opsgenie мне понравились)
    По Alert менеджменту: я в свое время пробовал мойру https://moira.readthedocs.io/ но в прод не пошло
    Incident Management есть в Gitlab который в том числе может быть и селфхостед. Однако находится в неразвивающемся состоянии на данный момент
    Ответ написан