После обновления lvm возросла запись / чтение на дисках при использовании кеширования, что это может быть?

Question

Yoh @Yoh

Linux
LVM

После обновления lvm возросла запись / чтение на дисках при использовании кеширования, что это может быть?

Здравствуйте.

Есть 4 сервера с операционной системой CentOS 7, на всех серверах стоит по 2 HDD диска и по 2 SSD накопителя. Создано 2 программных RAID-1 массива (один на HDD, другой на SSD).

Из указанных дисков HDD создано хранилище на базе LVM с кешированием на SSD дисках в режиме writeback.

После обновления пакетов lvm до версии 2.02.171-8 (последняя доступная версия в официальном репозитории), чтение с SSD дисков возросло в 2-3 раза и одновременно с этим возросла запись на HDD диски (пропорционально чтению с SSD дисков).

Хранилище используется под виртуальные машины на базе QEMU-KVM, нагрузка с их стороны не менялась. Одновременно с обновлением пакетов lvm производилось обновление всей системы (то есть ядро, qemu также были обновлены).

Ради эксперимента, на одном из серверов с низкой нагрузкой я переключил режим кеширования с writeback на writethrough, чтение с SSD и запись на HDD сразу снизились.

По ссылке https://yadi.sk/d/0a7fULcv3SrmrM можете посмотреть графики записи и чтения с дисков. На сервере 1 виден скачок чтения и записи после обновления и перезагрузки системы, на сервере 2 видно резкое снижение чтения и записи после переключения кеширования в режим writethrough.

Я пробовал искать подобные проблемы в сети, но ничего найти не смог. Также изучал https://bugzilla.redhat.com/buglist.cgi?quicksearc... и https://bugs.debian.org/cgi-bin/pkgreport.cgi?pkg=... , ничего похожего не нашел.

Что это может быть? Ошибка статистики или же система действительно по каким-то причинам пишет больше, чем должна? Куда копать в данном случае?

Заранее благодарен за ответы.

Вопрос задан более трёх лет назад
291 просмотр

Комментировать

Подписаться 5 Сложный Комментировать

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

4 комментария

Yoh @Yoh Автор вопроса

Ceph хорош, ничего не скажешь, но его нужно уметь готовить и поддерживать. Вторая причина - это стоимость сетевых карт на 10G...

Написано более трёх лет назад
Алексей Черемисин @leahch Куратор тега Linux

Затраты на 10G не особенно большие, карточки по 10-15К рублей, плюс коммутатор за 40К.
Готовить его особенно сильно не нужно, у нас живет уже около 5 лет. Зато плюсов просто не счесть.

Вместо дорогих карточек можно сделать бондинг на гигабитных (2-4 канальных), или поискать юзаный инфинибанд :-)

В любом случае, установив 10G карточки, получите существенный профит!

Написано более трёх лет назад
NiKO2On @NiKO2On

Алексей Черемисин, Подскажите, пож-та, какой коммутатор можно взять за 40К? Как лучше формировать соотношение дисков (объема) ssd и hdd если нужен кэш на ссд?

Написано более трёх лет назад
Алексей Черемисин @leahch Куратор тега Linux

NiKO2On, возьмите например этот https://www.xcom-shop.ru/d-link_dxs-1100-10tsa1a_5...
Еще можно посмотреть дешевые netgear. И да, "за время пути, собака могла подрости", цены немного вверх улетели - теперь 50к.
По поводу дисков, все зависит от ваших задач, но ceph тем хорош, что можно добавлять диски/серверы по мере надобности. Я бы сделал на сервер 3 hdd + 1 ssd, но все сильно зависит от бюджета, нужд и возможностей. У нас например вообще ssd нет.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

+2 ещё

Простой
Что надо установить, чтобы помимо текста ошибки выводились советы в терминале?
- 2 подписчика
- 3 часа назад
- 94 просмотра
1

ответ
Linux

+1 ещё

Простой
Как и какой софтиной сделать простенький SIP-автоответчик с меню, на Linux VPS-сервере?
- 1 подписчик
- 23 часа назад
- 99 просмотров
2

ответа
Linux

+2 ещё

Простой
Как восстановить SD-карту из Raw в Fat32 используя терминал на Debian?
- 1 подписчик
- вчера
- 101 просмотр
3

ответа
Linux

+3 ещё

Простой
Как установить драйвера Realtek на Linux Mint на WI-Fi адаптер?
- 1 подписчик
- вчера
- 108 просмотров
2

ответа
Linux

+2 ещё

Средний
Как развернуть сервер Matrix в локальной сети?
- 2 подписчика
- 13 авг.
- 3205 просмотров
5

ответов
Linux

+1 ещё

Простой
Какую операционную систему можно поставить на старый нетбук?
- 2 подписчика
- 13 авг.
- 3673 просмотра
13

ответов
Linux

+2 ещё

Простой
Как установить Kali nethunter на oneplus 9 pro?
- 1 подписчик
- 12 авг.
- 177 просмотров
1

ответ
Linux

+3 ещё

Простой
Подключене к D-Link DIR-320 по UART. Почему при подключении конвектора роуер перезагружается и не инициализируется?
- нет подписчиков
- 09 авг.
- 204 просмотра
1

ответ
Linux

+1 ещё

Средний
Как автоматически менять права файлов и каталогов внутри конкретного каталога в Linux?
- 2 подписчика
- 05 авг.
- 1032 просмотра
4

ответа
Linux

+1 ещё

Средний
Не могу установить OC AlmaLinux 10 на VirtualBox?
- 1 подписчик
- 02 авг.
- 213 просмотров
2

ответа
Показать ещё Загружается…

Разработчик C/C++ Linux

Wanted • Москва

До 350 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 350 000 ₽

Answer 1 · 2018-03-11 03:03:47

Откатился с ядра 3.10.0-693.21.1.el7.x86_64 обратно на 3.10.0-514.26.2.el7.x86_64, проблема осталась. Пробовал поставить 4.4.120-1.el7.elrepo.x86_64, проблема также сохраняется.

Откатил LVM вместе с зависимостями от 2.02.171-8 к 2.02.166-1, проблема также сохранилась.

Мягко говоря, я в замешательстве.

Обновление от 13 марта: проблему для себя решил.

Я произвел чистую установку CentOS 7.4 со всеми актуальными пакетами, на ней проблему не удалось воспроизвести. Сравнил конфигурацию хранилища LVM из каталога /etc/lvm/backup, откуда выяснил, что на всех серверах metadata_format стоит в 1, а на свежей установке у хранилища стоит 2.

Что удалось выяснить - если система была обновлена с первых версий 7 ветки (точно не помню, возможно 7.1 или 7.2 изначально была установлена), то при подключении кеширования с помощью команды lvcreate без явного указания cachemetadataformat (по умолчанию стоит auto), почему-то ставилась 1 версия. А в новой установке при тех же условиях ставилась 2 версия.

Сама проблема воспроизводилась следующим образом - режим кешировния writeback, cachemetadataformat в 1. При записи на такое хранилище, процесс вел себя достаточно странно: помимо записываемых данных (которые по логике должны попадать в кеш и на диск), система производила чтение каких-то данных с HDD (в значительно больших объемах, чем велась запись), эти данные писались в кеш на SSD, а после завершения записи этот объем данных записывался обратно на HDD. Это очень хорошо видно в связке использования fio + iostat, виртуальные машины здесь не причем, проблема воспроизводится и без них.

Решение простое: отключаем кеширование и явно указываем версию мета-данных. Ниже пример команд, может кому-то пригодятся (переменные замените под себя):

lvconvert --uncache ${VG_NAME}/${LV_NAME}
lvcreate --type cache --cachemetadataformat 2 --cachemode writeback -L${SIZE}G -n ${LV_NAME}_cache ${VG_NAME}/${LV_NAME} /dev/${SSD}

Answer 2 · 2018-03-01 23:03:57

Очень похоже, что поменялся алгоритм кеширования. Но у меня встречный вопрос, а почему бы не использовать ceph?! Ваша конфигурация как раз очень хорошо под это дело подходит, KVM/QEMU отлично работает с ceph напрямую. При этом вы получите практически моментальную миграцию виртуалок, очень гибкую работу с распределеенм хранилищем, снапшоты, бекапы, восстановление, клонирование, миграцию, забудете про lvm и raid, получите или быстрый кеш на ssd, или быстрый пул. В дополнение, практически неограниченно растущее хранилище данных и облачное хранилище, вылет одно любого сервера не скажется никак на доступности данных для виртуалок.

Из минусов - память на каждый терабайт дисков нужно гигабайт памяти, и нужна сеть 10гб между серверами.

Настройка не займет больше 30 минут и часа чтения документации. Диски не нужно делать в raid! На каждом из серверов достаточно отвести по 8-100 гигов для рутового раздела и загрузки, все остальное нужно просто отдать в ceph.

После обновления lvm возросла запись / чтение на дисках при использовании кеширования, что это может быть?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт