Ответы пользователя по тегу Мониторинг
  • Как оценить критическую нагрузку на дисковую подсистему?

    ptchol
    @ptchol
    Linux system administrator
    С iowait не все так просто вот здесь неплохое объяснение как оно работает.
    Если у Вас есть мониторинг, я бы ориентировался на значения await/svctm из iostat. Посмотреть какое время random read заявляют производители дисков (обычно это 3-5мс) и считать эти показатели допустимыми.
    Касательно объема читаемых данных вцелом нельзя сказать какое кол-во является нормальным, особенно имея смешанную нагрузку. Тут наверно стоит обращать внимание на utilization но также стоит соблюдать осторожность
    Ответ написан
    3 комментария
  • Какой выбрать инструмент для мониторинга?

    ptchol
    @ptchol
    Linux system administrator
    На самом деле, сейчас сталкиваюсь с тем что у людей какое-то очень странное понимание того, что такое мониторинг. Многие под ним подразумевают красивые графички в графане и забывают про алертинг.

    1. Zabbix - конечно хорош, но вот удобство его несколько преувеличено. Autodiscovery тоже не самый удобный вариант, все равно приходится генерить кучу разных шаблонов, триггеров и т д, формат JSON'а жестко формализован. Еще из недостатков: нельзя все итемы из одного discovery автоматически поместить на один график, накидав график в latest data нельзя сохранить его как постоянный и поместить на скрин. автоматической генерации скринов из discovery тоже нет. Графики опять же очень удручают тем что они до сих пор рендерятся на сервере, и не оч удобно смотреть значения метрик на графиках состоящих из нескольких датасорсов. Но все же к заббиксу есть https://github.com/alexanderzobnin/grafana-zabbix.
    2. graphite + grafana, здесь нет алертинга, придется ставить сторонний (типа graphite-beacon). Но также данные еще чем то нада собирать (collectd/diamond). Также 0.9.10 мертво, пул реквестов в репе куча, никто не занимается проектом, было решение что 0.9.13 будет крайней версией а потом 1.0 но как то все оно еле движется.
    3. Shinken - субъективно, помоему он умирает.
    4. Если уже есть опыт с Nagios, то посмотрите на Icinga 2. После того как они переписали ядро, и обновили web интерфейс, этим стало можно хоть как то пользоваться.
    Ответ написан
    1 комментарий
  • Как настроить Zabbix триггер со своим текстом?

    ptchol
    @ptchol
    Linux system administrator
    Я так понимаю у Вас тип данных у итема string/log/text ?
    Следовательно Вы можете брать последнее значение функцией last(), его проверять на наличие подстроки функцией regexp()/iregexp(), а чтобы опускать триггер использовать либо diff(), либо nodata() в зависимости от того, как часто Вы получаете эти данные.
    Ответ написан
    Комментировать
  • Zabbix, autodiscovery и пользовательские макросы, как подружить?

    ptchol
    @ptchol Автор вопроса
    Linux system administrator
    Кстати, все решилось созданием отдельного item (обычный, не prototype), который создает файл со списком exclude'ов, а уже этот список тащит в себя скрипт агрегации.
    Неудобно, негибко. Пока работает.
    Ответ написан
    Комментировать
  • Варианты сервиса/системы для мониторинга работы приложения с внешними API?

    ptchol
    @ptchol
    Linux system administrator
    Может при помощи www.fluentd.org собирать из приложеньки.
    Метрики слать в любимый мониторинг, что то типа zabbix / graphite.
    А "документы", в зависимости от количество засылать либо в монгу (capped collection ?), либо в elasticsearch ? И там уже анализировать их.
    Ну и какого нибудь брокера поставить промежуточного между приложенькой и ES\mongo чтобы в случае отказа принимающей стороны данные не потерять.
    Ответ написан
    Комментировать
  • Как осуществлять мониторинг изменений в папке linux (solaris)?

    ptchol
    @ptchol
    Linux system administrator
    В solaris 11+ есть file event notification. Возможно есть на его базе аналоги утилит inotifywatch \ inotifywait.
    Впрочем если вы дружны с кодом, то можно и самому в пару сотен строк их реализовать (https://blogs.oracle.com/praks/entry/file_events_n...
    Либо опять же очень тупой но в принципе рабочий вариант, stat'ом в цикле проверять изменения файлов :)
    Ответ написан
  • Как организовать мониторинг нескольких vps?

    ptchol
    @ptchol
    Linux system administrator
    Используем zabbix, крутится на виртуалке DO за 20 баксов.
    Вот некоторая статистика по использованию.

    Number of hosts (monitored/not monitored/templates) 110 47 / 1 / 62
    Number of items (monitored/disabled/not supported)  2361    2254 / 40 / 67
    Number of triggers (enabled/disabled) [problem/ok]  1104    1058 / 46 [2 / 1056]
    Number of users (online)    7   2
    Required server performance, new values per second  38.88    -
    
    load average: 0.38, 0.61, 0.72
    
    %Cpu(s):  9.9 us,  3.0 sy,  0.6 ni, 85.7 id,  0.4 wa,  0.0 hi,  0.3 si,  0.1 st
    Ответ написан
    Комментировать
  • Какое есть приложение под Linux для мониторинга сервера?

    ptchol
    @ptchol
    Linux system administrator
    newrelic, только с фришном аккаунте data retention - 24 часа всего.
    Ответ написан