Как интерпретировать load average?

Question

DVoropaev @DVoropaev

Ставлю + к карме на хабре за ответы на вопросы

Как интерпретировать load average?

8 процессоров по 4 ядра в каждом

uptime выдает 4.42, 4.80, 4.71
zabbix выдает 0.68, 0.68, 0,67

как эти данные интерпретировать, и какой диапазон считать нормой?

Вопрос задан более трёх лет назад
1048 просмотров

3 комментария

Подписаться 5 Простой 3 комментария

Помогут разобраться в теме Все курсы

Нетология

Системный администратор

11 месяцев

Далее
Академия Эдюсон

DevOps-инженер + ИИ

7 месяцев

Далее
Skillbox

Системный администратор с нуля

6 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 3

Комментировать

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Компьютерные сети

+3 ещё

Средний
Почему с домашнего интернета не проходит исходящий UDP до моего VPS?
- 1 подписчик
- 19 июл.
- 239 просмотров
4

ответа
Windows

+1 ещё

Простой
Как в windows повесить две службы на один порт? Или как заменить порт в зависимости от источника?
- 3 подписчика
- 08 июл.
- 661 просмотр
4

ответа
Windows

+2 ещё

Простой
Почему отваливается принтер по USB?
- 3 подписчика
- 10 июн.
- 740 просмотров
3

ответа
Мониторинг

+1 ещё

Средний
Какие датчики трека позиционирования можно применить в эксперименте с применением масштабной модели шахты?
- 2 подписчика
- 29 мая
- 137 просмотров
2

ответа
Системное администрирование

Средний
Прыгает пинг в играх при идеальных показателях до DNS Google (0% потерь, джиттер 2мс) Что делать?
- 1 подписчик
- 22 мая
- 361 просмотр
3

ответа
Системное администрирование

+1 ещё

Простой
Как запретить внешние HDD в каспере?
- 5 подписчиков
- 15 мая
- 801 просмотр
1

ответ
Windows

+2 ещё

Средний
Как восстановить настройки по умолчанию брэндмауэра Windows 7?
- 1 подписчик
- 13 мая
- 332 просмотра
1

ответ
Системное администрирование

+1 ещё

Средний
Youtube через smart TV в 2026году?
- 1 подписчик
- 10 мая
- 600 просмотров
3

ответа
Системное администрирование

+1 ещё

Простой
Что может значит «Количество SIP линий» в облачной АТС в настройках SIP-аккаунта (фото прилагается)?
- 2 подписчика
- 29 апр.
- 281 просмотр
2

ответа
Системное администрирование

+2 ещё

Средний
Как дать дефолтному пользователю 1С 8.3 право на загрузку XML?
- 3 подписчика
- 27 апр.
- 339 просмотров
1

ответ
Показать ещё Загружается…

Ещё очень хорошо вот здесь, с объяснением исторических причин
dableproger дорогой пользователь, настоятельно рекомендуем еще раз обратить самое пристальное внимание на п. 3.1 регламента работы сервиса (и, в особенности, на его последний абзац). В противном случае, ваши вопросы будут удаляться по причине тег-спама, а систематические нарушения приведут к блокировке учетной записи.

Answer 1 · 2018-08-25 06:27:03

Сложное объяснение, но видимо методически правильное есть в статье https://habr.com/company/mailru/blog/335326/
Как показывает практика - LA связан не только с вычислительной нагрузкой на CPU, но зависит и от ввода вывода и других факторов состояния системы.
При определенных обстоятельствах вполне можно наблюдать LA в несколько тысяч, при фактически не загруженных процессорах и обычном количестве и состоянии процессов.

Я для себя LA интерпретирую как комплексный показатель нагрузки на систему.
Упрощенно можно воспринимать как некий эфемерный показатель длины очереди процессов на исполнение - это условное заведомо неверное толкование, но вполне применимое в реальной работе.
Интерпретация значений LA:
Где значения от 0 до 1 указывают на не нагруженную систему близкую к простою.
Значения от 1 до 10 - как умеренно нагруженную систему. Все нормально.
Значения от 10 до 30 - как высоконагруженную систему. Не следует добавлять нагрузку. Можно подумать о поиске оптимизации нагрузки. Оптимизация рекомендуется.
Значения от 30 до 100 - как чрезмерно нагруженную систему, например, причиной может быть большая доля iowait из-за перегрузки - большое количество потоков ввода вывода на одно блочное устройство, аномально медленная работа блочного устройства из-за неисправности, другие подобные причины, связанные с возникновением "бутылочного горлышка" в системе, которое надо расшивать - при таких значениях LA - производительность неэффективная. Оптимизация необходима.
Значения выше 100 - следует воспринимать как аварийное состоянии системы с точки зрения производительности. Нужно принимать меры безотлагательно.
Значения выше 1000 - и дальнейший рост LA ведут к падению ядра, как правило, падение системы происходит в течении ближайших нескольких часов. Требуется экстренная реакция для избежания отказа систем и потери данных.
Границы указаны примерные на основе своего опыта.

Answer 2 · 2018-08-24 17:54:09

и какой диапазон считать нормой?

Смотрите на график. Если не выделяется на общем фоне и система работает нормально - значит это и есть норма для вашей системы.
Абстрактного значения нормы LA нет.

https://www.zabbix.com/forum/zabbix-troubleshootin...

Template OS Linux uses normalized CPU load (percpu), while top shows total load. Normalized load = total load divided by online CPU count.

У вас действительно 8-сокетная железка? 32 ядра в сумме? Вычисление немного не сходится просто.

Answer 3 · 2018-08-24 20:48:19

uptime выдает цифры для среднего в 1мин, 5мин и 15мин. число означает кол-во "съеденых" ядер в единницу веремни.
т.е. если у вас 8 рабочих ядер, и значение = 8, то процессор работает в 100% (т.е. процессора как раз хватает для задач, но нет запаса), если значение 4, то 50% нагрузки, если значение 16, то процессор работает в 100% и ещё столько же (ещё 100%) задач простаивает, ждет процессора, т.е. процессор не справляется в 2 раза и при большем кол-ве ядер задачи отрабатывали бы быстрее.

Как интерпретировать load average?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт