Добрый день.
Возникла необходимость оповещать пользователей, о проблемах и сбоях систем. Например возникли проблемы с почтовым сервером. Нажал пару кнопок и на ПК пользователей всплыло оповещение: "Проблемы в работе почты, ожидаемый срок устранения 20 минут". После устранения аналогично: "Проблема устранена, все работает".
Парк ПК достаточно обширный порядка 10000 шт. Географически распределенный по всей России. Поэтому желательна возможность выделения категорий и групп пользователей.
Гугл по запросам выдает что-то на тему SIEM или ГО ЧС.
Подскажите, есть ли какие-то готовые решения в этом направлении? Куда копать?
P.S. Так же рассматривал написание агента и сервера на основе чего-то вроде Kafka или RabbitMQ
Пишу веб-страницу с текущими статусами необходимых служб.
Меняю их значения автоматом или ручками в зависимости от типа службы.
У клиентов качаем мини утилиту, слушающую эту веб страницу, каждые N минут.
В утилите можно добавить категории служб для уведомлений.
Когда служба упала или поднялась уведомляем в трее или выводим попап.
Готовых решений не знаю, но разработать можно максимум за неделю такое с нуля.
Этот вопрос, по сути последняя попытка найти готовое решение, перед тем как начать писать самому.
Проблема в том, что я не уверен в своей способности написать сервер, который обработает хотя бы 1-2 тыс. обращений в пике. Идея переложить обязанности обслуживания запросов на web-сервер весьма интересная.
Я пока смотрю в сторону MQTT и ему подобных. Тэги сообщений позволят сделать разделение на группы, а существующие реализации брокеров - возьмут на себя вопросы коммуникации. Останется написать интерфейс и клиентов.
Рассылкой писем. Там тебе и группы пользователей, и решение готовое и проверенное, и все желающие смогут настроить перенаправление этих писем сразу в мусорку.
ThunderCat, ты хочешь сказать, что почта может сломаться, а какая-нибудь другая альтернатива -- нет?
А если нужна система оповещения о проблемах именно с почтой, то надо всё бросать и настраивать резервирование почты, а не дурью маяться.
Сейчас все реализовано как раз через почту, и как это не печально "никто не читает почту". В случае проблем, все просто начинают плодить заявки "у меня не работает...", "срочно почините..." и т.д.
По итогу после инцидента остается гора заявок, по которым нужно выяснить решилась она или нет.
Поэтому основные критерии:
1) Оповещение должно появляться перед пользователем, без активных действий с его стороны.
2) Оно не должно требовать операций по его отключению (вроде кнопки ОК или Закрыть)
3) В идеале иметь возможность обратной связи (Проверить наличие проблемы Актуальна\решена)
Сергей, ну, да, это решение рассчитано на пользователей, рабочие процессы которых уже крутятся вокруг почты. Но в общем это проблема культуры а не технологии, вам точно так же прийдётся приучать пользователей смотреть в свои оповещения, как бы вы их ни организовали. Потому что
1) Оповещение должно появляться перед пользователем, без активных действий с его стороны.
2) Оно не должно требовать операций по его отключению (вроде кнопки ОК или Закрыть)
подразумевает, что оповещение не отрывает пользователя от его основной работы, а значит может остаться незамеченным.
Пэйджер банальный.
Насколько я понял вам нужна система оповещений о сбоях в сети, независимая от сбоев в этой сети, поэтому должен использоваться независимый транспорт сообщений.