Добрый день!
Есть у меня пара десятков микросервисов, которые периодически получают в себя ошибочные данные и начинают кидаться ошибками. К ним для сбора метрик прикручен Prometheus.
Отсюда появилась простая идея, а почему бы не отправлять ошибки на Prometheus (тем более что потом сообщения о ошибках хорошобы отправить через alert по почте). Но читая Prometheus я все больше и больше вижу что он для сбора метрик, а не логов (а сообщение о ошибке лучше чем лог тут не воспринять).
Можно ли его вообще использовать для сбора ошибок? В идеале не просто сообщений вида "100 ошибок в секунду" а конкретных сообщений с данными из серии "Вася Пупкин ввел код 111 и все упало". Или только посредством 100 костылей, и так делать не стоит.