Как оценить критическую нагрузку на дисковую подсистему?

Question

Аннет @laduwka

Unix администратор

Как оценить критическую нагрузку на дисковую подсистему?

Работаю с сервисом, который постоянно пишет-читает диск. Это система построенная на базе Elasticsearch, работает в тестовом режиме, пока нагрузок близких к боевым не было.
Встал вопрос мониторинга нагрузки на дисковую подсистему.
Снять нагрузку несложно, сложно интерпретировать результаты. Я мало сталкивалась с дисками, raid и схд, поэтому немного не понимаю, в какую сторону двигаться.
Собран RAID 10, контроллер PERC 6/i Integrated, диски SEAGATE, Centos7, xfs

=== START OF INFORMATION SECTION ===
Vendor: SEAGATE
Product: ST3600057SS
Revision: ES66
User Capacity: 600,127,266,816 bytes [600 GB]
Logical block size: 512 bytes
Rotation Rate: 15000 rpm
Form Factor: 3.5 inches
Logical Unit id: 0x5000c5007ece257f
Serial number: 6SL9L37D
Device type: disk
Transport protocol: SAS
Local Time is: Thu Sep 3 15:39:39 2015 EDT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Temperature Warning: Disabled or Not Supported
Среднее время доступа одного диска 3.4 мс при чтении, 3.9 мс при записи
Среднее время ожидания 2 мс

Возьмем данные за последние 10 минут, например.
summary: 19 io/s, read 640 sectors (0kB/s), write 284120 sectors (236kB/s) in 600 seconds
Performance Data: tps=19io/s; read=546b/s; write=242449b/s;
Информация берется отсюда: /sys/block//stat

Выходит, что так как у меня raid, то один iops на чтение является реальным одним iops. На запись же выходит, что один iops на запись превращается в 2 iops по факту.

Когда начинать паниковать, что нагрузка на диск растет? По факту, если смотреть на графики, больше 40 iops вообще еще не бывало. Сколько секторов в секунду нормально, а сколько - уже плохо?
Не хотелось бы спохватиться по факту, когда диски заткнулись и все висит и ждет завершения ввода-вывода.
Какие значения iowait должны пугать?
Я проверяю диски на наличие ошибок в смарт, этого достаточно для понимания, когда диск начинает выходить из строя и его пора менять?
Хотелось бы разобраться с мониторингом и тюнингом дисковой подсистемы, буду благодарна любым ссылкам, объяснениям и литературе.

Вопрос задан более трёх лет назад
4968 просмотров

Комментировать

Подписаться 17 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Linux для робототехников

3 месяца

Далее
Учебный центр IBS

AL-1802 Администрирование Astra Linux Special Edition 1.8

2 недели

Далее
Слёрм

Linux для разработчиков

2 недели

Далее

Решения вопроса 1

3 комментария

Аннет @laduwka Автор вопроса

Подскажите, пожалуйста, для дисков в raid изменяется ли значение random read?

Написано более трёх лет назад
Аннет @laduwka Автор вопроса

И количество записанных секторов как-то же должно коррелировать с iops, по идее-то, только где закономерность пока не пойму

Написано более трёх лет назад
Дэн Иванов @ptchol

Закономерности нет, есть как бы взаимосвязь, но прямой зависимости нет, потому что все зависит от того куда на диске пишутся данные.
Чуть ниже ответ amarao и его пояснения на мои вопросы, это тоже неплохой объективный способ оценки общей загрузки диска.

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 4

6 комментариев

Дэн Иванов @ptchol

Поясните пожалуйста.
К примеру у нас диск имеет random read 3ms. Мы снимаем значение flight_time и в определенный момент времени наблюдаем это значение высоким, поскольку данный параметры описывает фактически кол-во незавершенных операций. В свою очередь, эти операции могут укладывать во временные рамки 3ms и завершаться пропадая из очереди, а их появление вызвано "микросатурейшеном"
Тоесть мы можем наблюдать ситуацию когда у нас и await и svctm не превышает 3ms но в свою очередь значение flight_time высокое ?

Написано более трёх лет назад
amarao @amarao

Дэн Иванов: latency дисковых операций к этому не имеет отношения. flight time показывает, сколько времени (а после перенормирования дельты к секунде - какую часть времени) диск был занят. То есть если утрировать, то это показать "busy". Если диск всё время выполняет какие-то операции, то он занят и дополнительные операции выполнять не сможет или будет выполнять их с большим latency из-за очереди. Так что в atop'е принцип простой - близко к 90+%, диск не справляется с нагрузкой. Ниже 30-40% - ок, меньше 10% - диск простаивает.

Смотреть величину лучше не на секундном интервале, а на интервале в секунд 10-20-30.

Всякие пики по латенси и прочие "мгновенные странности" так не увидеть, но принцип такой: если диск уже занят и приходит ещё одна операция, то она уходит в очередь (что плохо). Чем больше таких ситуаций в течение интервала времени (чем ближе к 100%), тем более занят диск.

Написано более трёх лет назад
Дэн Иванов @ptchol

Спасибо. Тоесть если я правильно понял это по факту saturation диска, без разбивки шина\io.

Написано более трёх лет назад
amarao @amarao

Не существует метода (я не знаю такого) различить bus saturation (PCI, SCSI) и тормоза дисков. Точнее, различить их можно, если дисков много и есть простаивающие. Если тупят нагруженные диски, а простаивающие выдают нормальную производительность - это диски, если производительность распределяется между всеми одинаково и проседает - это шина. Различить PCI и SCSI вообще никак нельзя (ИМХО).

Написано более трёх лет назад
Дэн Иванов @ptchol

Спасибо ! Попробую добавить в мониторинг, и посмотреть во время перегрузок на корреляции этого параметра и графичков latency/util

Написано более трёх лет назад
amarao @amarao

Если вас интересует совсем низкий уровень (то есть отладка конкретных затыков, вместо "общее состояние сервера"), то надо смотреть в сторону blktrace. Там можно видеть каждый запрос IO со всеми деталями (кто послал, сколько времени запрос обрабатывался и кем). Очевидно, что и latency там тоже видно будет. Но он не бесплатный в смысле производительности (по процессору и latency для операций), то есть держать на продакшене включенным я бы не стал.

duch.mimuw.edu.pl/~lichota/09-10/Optymalizacja-ope...

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Железо

Простой
Не работает 1 из 3 корпусных кулеров в системном блоке?
- 2 подписчика
- 7 часов назад
- 80 просмотров
0

ответов
Linux

+1 ещё

Простой
Не работает apt update && apt upgrade в Kali Linux. Что делать?
- 2 подписчика
- вчера
- 259 просмотров
2

ответа
Linux

+1 ещё

Простой
На чем практиковаться начинающему админу?
- 3 подписчика
- 30 нояб.
- 796 просмотров
3

ответа
RAID

+1 ещё

Простой
Как обойти ограничение с отсутствием суперконденсатора?
- 1 подписчик
- 29 нояб.
- 108 просмотров
0

ответов
Железо

+1 ещё

Простой
Подойдет ли блок питания MSI MAG A850GL PCIE5 [306-7ZP8A24-CE0] под мою систему?
- 1 подписчик
- 29 нояб.
- 180 просмотров
1

ответ
Linux

+2 ещё

Простой
В shinobi отображаются видео только за 24 часа, как увидеть все?
- 3 подписчика
- 27 нояб.
- 208 просмотров
0

ответов
Жёсткие диски

+1 ещё

Простой
Не работает сата пачкорд. Почему не видит диски?
- 1 подписчик
- 24 нояб.
- 169 просмотров
2

ответа
Linux

+1 ещё

Средний
Почему не монтируются сетевые шары при VPN?
- 3 подписчика
- 23 нояб.
- 784 просмотра
1

ответ
Linux

+2 ещё

Средний
StrongSwan IKEv2/IPSec и fail2ban, как правильно настроить?
- 2 подписчика
- 22 нояб.
- 480 просмотров
0

ответов
Android

+2 ещё

Средний
Возможно ли перенести внутренние компоненты xiaomi redmi note 7 в другой корпус этой же модели с сохранением данных?
- 2 подписчика
- 22 нояб.
- 299 просмотров
2

ответа
Показать ещё Загружается…

DevOps

IT ATLAS • Москва

от 200 000 до 250 000 ₽

Сетевой инженер, OpenWrt, Linux

Ростовский завод электроники • Санкт-Петербург

от 20 000 до 60 000 ₽

Специалист первой линии технической поддержки

Петрович-Тех

До 52 882 ₽

Answer 1 · 2015-09-03 23:48:17

С iowait не все так просто вот здесь неплохое объяснение как оно работает.
Если у Вас есть мониторинг, я бы ориентировался на значения await/svctm из iostat. Посмотреть какое время random read заявляют производители дисков (обычно это 3-5мс) и считать эти показатели допустимыми.
Касательно объема читаемых данных вцелом нельзя сказать какое кол-во является нормальным, особенно имея смешанную нагрузку. Тут наверно стоит обращать внимание на utilization но также стоит соблюдать осторожность

Answer 2 · 2015-09-04 15:20:30

В линуксе самым очевидным индикатором утилизации дисков является flight_time. Если делать замеры каждую секунду, то разница между начальным и конечным значением покажет, сколько секунд в течение секунды диск был занят (значение обычно от нуля до 1).

Находится оно в /sys/block/sdX/device/stat (значение всех этих цифр - в Documentation исходников ядра).

На бытовом уровне - если блочных устройств мало, то просто atop (и дать секунд 11-12 отстояться) - и там будет показана утилизация диска.

Если блочных устройств много и они не влазят в вывод атопа, то я написал отдельно для себя простенький top по блочным устройствам https://github.com/amarao/blktop

Если нужно собирать эти метрики в автоматическом режиме, то обычно у соответствующих приложений (например, munin или ganglia) есть модули, которые эту информацию собирают.

Answer 3 · 2015-09-04 00:47:43

ShamblerR @ShamblerR

iotop -oka

Ответ написан более трёх лет назад

Комментировать

Answer 4 · 2015-09-04 01:06:08

Лучшее объяснение которое видел по данной теме - Как правильно мерять производительность диска, написанная Amarao. Пригласите его, он сможет ответить на Ваши вопросы, если захочет :)

Answer 5 · 2015-09-04 13:47:07

Аннет @laduwka Автор вопроса

Unix администратор

amarao буду благодарна, если поможете!

Ответ написан более трёх лет назад

Комментировать

Как оценить критическую нагрузку на дисковую подсистему?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт