Аномальная активность jbd2 при исчерпании места на разделе с ext4?

Question

igortiunov @igortiunov

Linux

Аномальная активность jbd2 при исчерпании места на разделе с ext4?

Друзья, добрый день.

Суть проблемы:
При работе на RHEL 6 процесса генерирующего множество небольших записей в текстовые файлы (лог файлы) на разделе заканчивается место. В этот момент на машине выстреливают иопсы на диск, на котором закончилось место, в iotop в топе процесс jbd2.

Описание проблемы:

На множестве виртуальных машин (VMWare ESXi) работает apache-tomcat используемый для разработки. В какой-то момент разработчики включают debug-логи на этом апаче для поиска своих багов и, либо с грустью и безысходностью, либо на радостях от найденной причны бага они такой сервер оставляют жить своей жизнью.

В какой-то момент на разделе виртуальной машины отформатированном ext4 заканчивается место (забивается текстовыми логами apache). Всё бы хорошо, но в этот самый момент счётчик Write Rate (KBps) на виртуальном диске машины выстреливает в полку (~20 MBps, при нормальной работе ~640 KBps). В гостевой ОС iotop в топе показывает процесс jbd2 и значением счётчика IO - 100%.

Вопрос:

Я хочу понять механизм такого повдения. Что происходит с журналом в таком сценариии - почему на диск, на котором место закнчилось, нагрузка не снижается, а увеличивается в десятки раз ?

Гостевая ОС RHEL 6.x (3 <= x <=6)

Вопрос задан более трёх лет назад
1574 просмотра

Комментировать

Подписаться 7 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Linux для робототехников

3 месяца

Далее
Stepik

Основы Linux

2 недели

Далее
Учебный центр IBS

AL-1801 ОС Astra Linux Special Edition 1.8 для пользователей

1 неделя

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

+2 ещё

Простой
Настройка трёх сетевых карт Debian systemd-networkd?
- 1 подписчик
- 11 дек.
- 204 просмотра
1

ответ
Linux

+1 ещё

Простой
Не работает apt update && apt upgrade в Kali Linux. Что делать?
- 2 подписчика
- 04 дек.
- 471 просмотр
2

ответа
Linux

+1 ещё

Простой
На чем практиковаться начинающему админу?
- 3 подписчика
- 30 нояб.
- 1082 просмотра
3

ответа
Linux

+2 ещё

Простой
В shinobi отображаются видео только за 24 часа, как увидеть все?
- 3 подписчика
- 27 нояб.
- 238 просмотров
0

ответов
Linux

+1 ещё

Средний
Почему не монтируются сетевые шары при VPN?
- 3 подписчика
- 23 нояб.
- 839 просмотров
1

ответ
Linux

+2 ещё

Средний
StrongSwan IKEv2/IPSec и fail2ban, как правильно настроить?
- 2 подписчика
- 22 нояб.
- 513 просмотров
0

ответов
Linux

+2 ещё

Простой
Какие подходящие характеристики для VPN?
- 1 подписчик
- 19 нояб.
- 1169 просмотров
3

ответа
Linux

Сложный
Как вылечить инфокиоск?
- 2 подписчика
- 19 нояб.
- 524 просмотра
1

ответ
Linux

+1 ещё

Простой
Какие есть простенькие скрипты «HTTP over Email», чтоб поставить у себя на серваке?
- 1 подписчик
- 14 нояб.
- 497 просмотров
1

ответ
Linux

+3 ещё

Простой
Fedora 6 как починить загрузчик grub?
- 2 подписчика
- 13 нояб.
- 267 просмотров
1

ответ
Показать ещё Загружается…

Веб-разработчик (PHP) в продукт из сферы FinTech

ITWORK AGENCY • Москва

До 500 000 ₽

Специалист первой линии технической поддержки

Петрович-Тех

До 52 882 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

Answer 1 · 2016-01-31 19:49:09

В процессе изучения документации выяснилось, что при достижении состояния ENOSPC(No space left on device) драйвер файловой системы ext4 изменяет своё поведение следующим образом:
1. Отключает отложенное выделение блоков (www.pointsoftware.ch/en/4-ext4-vs-ext3-filesystem-...
Это скорее всего является причиной возрастания активности на запись (в текущщем паттерне работы - множество мелких записей)
2. Форсирует коммит журнала в файловую систему с надеждой, что какие-то блоки освободятся.
Это скорее всего является причиной активности jbd2 в iotop.

Answer 2 · 2016-01-28 18:21:53

Петля (dieadlock) скорее всего: критичный процесс, который нельзя остановить, пытается сохраниться, но места нет и входит в цикл - возможно еще чего порождает, например flush. Надо в коде ext4 ковыряться для точного ответа. Можно попытаться найти виновника
mount -t debugfs none /sys/kernel/debug
echo 1 >/sys/kernel/debug/tracing/events/ext4/ext4_journal_start/enable
echo 1 >/sys/kernel/debug/tracing/events/jbd2/jbd2_run_stats/enable
cat /sys/kernel/debug/tracing/trace_pipe

Аномальная активность jbd2 при исчерпании места на разделе с ext4?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт