Я начинающий тех. специалист, поэтому опишу свой вопрос поподробнее, чтобы меня поняли.
В графане есть график, на котором отображены ошибки вызовов одного метода, и на нем ежеминутно есть около 500 ошибок.
Подскажите, можно ли настроить алерты на тот случай, если условно за 10 минут количество ошибок резко вырастет допустим на 30%?
Среднестатистическое количество ошибок может планомерно изменятся как в большую, так и в меньшую сторону. Поэтому устанавливать абсолютные величины в качестве порога для срабатывания (в данном примере было бы 650 ошибок) не хотелось бы.
Как можно при сбое поймать аномальный всплеск ошибок на графике за небольшой промежуток времени относительного имеющегося количества ошибок в обычное время?
Т.е. надо, чтобы каждые n-минут проверялось кол-во ошибок за предыдущие n-минут, и, если их на момент очередной проверки стало больше на n-процентов относительно среднего кол-ва за предыдущие те же n-минут, то триггериться.
По возможности пошагово (куда нажать, что выбрать / написать), т.к. я новичок. Заранее большое спасибо!
Grafana рисует графики. Анализ и алерты должны делаться на основе тех же данных, которые вы в ней отображаете, выбор утилит зависит от конкретного источника.
ashishkin21, Да понятно, что не вывод libastral.so. Я поэтому и написал ответ таким обтекаемым, чтобы при вашем желании можно было постоять за NDA, вот только здесь "логи" не канают.
Для анализа логов есть другие системы, как правило прибитые к конкретному варианту БД.
Скорее всего у него источник elasticsearch. Конечно мониторить через логи может не совсем правильное решение. Но с другой стороны метрики на вызов методов, да ещё с их анализом по респонсу только по логам можно мониторить.
ashishkin21, В Open Distro for Elasticsearch есть бесплатный мониторинг + триггеры. Не пользовался, но если их можно крутить аналогично бордам кибаны - ваша задачка решается через превышение скользящего среднего.