Задать вопрос

Philipp

⋆⋆⋆⋆⋆

673

вклад
34

вопроса
936

ответов
30%

решений

Ответы пользователя по тегу Мониторинг

Как правильно экспортировать метрики приложения в Prometheus на Python?

Philipp @zoonman
⋆⋆⋆⋆⋆

https://github.com/prometheus/client_python

Ответ написан более трёх лет назад

Комментировать

Комментировать
Мониторинг веб-сервисов?

Philipp @zoonman
⋆⋆⋆⋆⋆

Есть такая классная штука, как Sentry. Она позволяет отслеживать практически любые ошибки, как на backend, так и на frontend.
А еще она умеет задать пользовательский контекст, т.е. можно отследить, у каких пользователей проявилась ошибка. Это чрезвычайно удобно.
Обычно, когда падает backend, на frontend тоже что-нибудь отваливается.
А еще sentry умеет breadcrumbs, т.е. вы можете самостоятельно отследить цепочку действий пользователя до возникновения ошибки. Конечно, это требует модификации кода, но результат просто замечательный.

Извините, что я начал с инструмента, но выяснение любых проблем начинается с анализа симптомов/ошибок. Если у вас недостаточно данных об ошибках или сами ошибки не отслеживаются, то будут проблемы.
Если у вас проблемы с временем ответа серверов, то нужно мониторить и профилировать запросы.
Например у вас внезапно растет уровень отказов на какой-то странице. Для этого можно настроить алерт в Google Analytics по резкому увеличению отказов. Далее вы смотрите на мониторинг ответов сервера использующихся на этой странице. Затем получаете, что идет один из вызовов API выполняется дольше обычного. Профилируете его. Смотрите, что идет долгое обращение к БД. Смотрите мониторинг долгих запросов к базе и кореллируете с запросами используемыми в этом API. Находите запрос, делаете EXPLAIN, достраиваете индексы или рефакторите API. Большая часть всех этих процедур требует наличие интеллекта и опыта. А помочь пройти все это сразу может нечто вроде NewRelic.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как замерить RTT до клиентов вебсервера?

Philipp @zoonman
⋆⋆⋆⋆⋆

150 ms адекватное время, особенно, если его поделить на 2. Лично, я еще не одной сети не видел, чтобы так работала. У меня 2-8 ms пинг до wi-fi роутера. Т.е. 1 хоп. Так что добро пожаловать в реальный мир, где RTT может быть и секунды, т.к. все зависит от среды передачи данных. Например, если вы передаете данные через низкоскоростное соединение, то оно может довольно сильно "лагать". Отличный тому пример GPRS в условиях неустойчивого приема.

Ответ написан более трёх лет назад

3 комментария

3 комментария
Как поддерживать сайт с помощью status.io?

Philipp @zoonman
⋆⋆⋆⋆⋆

Там очень даже вменяемая документация, просто вы не имеете представления, как работать с подобными сервисами и не знаете английского. Наймите кого-нибудь и не валяйте дурака.

Ответ написан более трёх лет назад

4 комментария

4 комментария

Самые активные сегодня

Мизам
- 1 ответ
- 1 вопрос
Mdm3
- 1 ответ
- 0 вопросов
Portnova1975
- 1 ответ
- 0 вопросов
I.CaR Soft
- 0 ответов
- 1 вопрос
Денис Давыденко
- 0 ответов
- 1 вопрос
Daemon23RUS
- 1 ответ
- 0 вопросов

Как правильно экспортировать метрики приложения в Prometheus на Python?

Мониторинг веб-сервисов?

Как замерить RTT до клиентов вебсервера?

Как поддерживать сайт с помощью status.io?

Войдите на сайт