Как написать bash мониторинг файловой системы EXT4?

Question

fokin_nikolay1989 @fokin_nikolay1989

Linux
bash

Как написать bash мониторинг файловой системы EXT4?

Доброго времени суток!
подскажите, как написать мониторинг файловой системы ext4 в части достижения лимита в 16Tb одного/нескольких файлов?
Подумал использовать find… но так как это будет регулярный поиск, то считаю не практично. Может можете подсказать как в bash можно написать?

Вопрос задан более двух лет назад
273 просмотра

Комментировать

Подписаться 2 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

Инженер по тестированию

8 месяцев

Далее
Яндекс Практикум

DevOps для эксплуатации и разработки

6 месяцев

Далее
Яндекс Практикум

Go-разработчик с нуля

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 7

8 комментариев

fokin_nikolay1989 @fokin_nikolay1989 Автор вопроса

Не подходит, данное по не предустановлено в ОС

Написано более двух лет назад
rPman @rPman

Тогда пиши на c/c++, одноименные методы доступны штатно на метро ч знаю это вызов ядра

Тебе не кажется что ты ставишь слишком странное ограничение? В чем проблема установить по, особенно если оно идёт в официальных репах?

Написано более двух лет назад
fokin_nikolay1989 @fokin_nikolay1989 Автор вопроса

rPman, к сожалению что является странностью, есть реальность.
Ввиду огроменного количества серверов, это не возможно сделать((

Написано более двух лет назад
d'Ivan @2ord

fokin_nikolay1989,

Не подходит, данное по не предустановлено в ОС
Разве это непреодолимое препятствие?

Написано более двух лет назад
d'Ivan @2ord

Ввиду огроменного количества серверов
Слышал ли об Ansible?

Написано более двух лет назад
fokin_nikolay1989 @fokin_nikolay1989 Автор вопроса

Иерокопус Таманский, к сожалению нет ((

Написано более двух лет назад
fokin_nikolay1989 @fokin_nikolay1989 Автор вопроса

Иерокопус Таманский, ага, только вот к сожалению нельзя использовать

Написано более двух лет назад
Сергей @sabramovskikh

fokin_nikolay1989,
Ввиду огроменного количества серверов, это не возможно сделать((

А написать свой ПО и установить его на все эти же сервера разве легче?

Написано более двух лет назад

Комментировать

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

+2 ещё

Средний
Wireguard, туннель — всё?
- 1 подписчик
- вчера
- 1047 просмотров
2

ответа
Linux

+4 ещё

Простой
Возможно ли получить интернет с openwrt в proxmox?
- 1 подписчик
- 17 окт.
- 257 просмотров
4

ответа
Linux

+2 ещё

Простой
Как настроить Matrix Synapse сервер, чтобы работал клиент Element X (Element подключается)?
- 1 подписчик
- 17 окт.
- 94 просмотра
1

ответ
Linux

Средний
Какой Linux поставить в виртуалку, чтобы поднять на нём OpenVPN клиент и 3proxy сервер для локального использования?
- 4 подписчика
- 15 окт.
- 446 просмотров
4

ответа
Linux

Простой
Как запустить две копии программы в Linux?
- 2 подписчика
- 14 окт.
- 464 просмотра
4

ответа
Linux

+1 ещё

Простой
Какой самый стабильный и лучший вариант собрать QUIC для curl [cross-compilation]?
- 1 подписчик
- 14 окт.
- 114 просмотров
0

ответов
Linux

+2 ещё

Средний
Существует ли готовое решение или проект для организации Linux-шлюза с маршрутизацией, VPN и DPI-обходом?
- 5 подписчиков
- 13 окт.
- 1251 просмотр
2

ответа
Linux

+1 ещё

Средний
Не вижу трафика клиентов и их онлайн в панели 3x-ui, что можно сделать?
- 2 подписчика
- 13 окт.
- 759 просмотров
2

ответа
Linux

+1 ещё

Простой
Как запретить удаление папки в Linux?
- 1 подписчик
- 13 окт.
- 329 просмотров
3

ответа
Linux

+3 ещё

Средний
FireWall (Linux) для VLESS (Nekoray) и с разными профилями VPN (IP, Port). Как настроить Kill Switch?
- 1 подписчик
- 11 окт.
- 378 просмотров
3

ответа
Показать ещё Загружается…

Ведущий инженер-проектировщик линий электропередачи (ЛЭП)

ЭЛСИ Энергопроект • Новосибирск

от 121 000 ₽

Системный администратор Linux

Abc staff • Москва

До 250 000 ₽

Специалист первой линии технической поддержки

Петрович-Тех

До 52 882 ₽

Answer 1 · 2023-10-04 09:36:28

rPman @rPman

утилита inotify, первый же запрос в гугл выдал

Ответ написан более двух лет назад

8 комментариев

Answer 2 · 2023-10-04 09:35:24

Alex G. @Alex_Geer

System Engineer

Можно использовать более подходящую команду du
https://losst.pro/komanda-du-v-linux

Ответ написан более двух лет назад

Комментировать

Answer 3 · 2023-10-04 10:24:38

если нужны быстро параметры файловой системы то
df --output=used /dev/sda3
если необходимо вручную почистить место в директории, то
ncdu -x /home

Answer 4 · 2023-10-04 10:38:44

Кот Абсолютный @CityCat4

Жил да был черный кот за углом...

Если втупую - парсинг вывода ls :), потом sleep и так до бесконечности. Когда триггер сработал - там оповещение, буде надо.

Ответ написан более двух лет назад

1 комментарий

Answer 5 · 2023-10-05 01:58:15

16 tb это довольно большой размер. Не так часто файлы его достигают.
Я бы разбил мониторинг на две части.

Первая часть - find всех файлов которые больше 10 tb, например, и занесение их в базу. Раз в сутки, например.
Вторая - stat по файлам из базы, выбрать частоту, которая устраивает.

Базой может быть банально текстовый csv файл с timestamp, absolute path, size с каким-то разделителем.
Или, например, influxdb с графаной.. на выбор

Короче главная идея - разделить поиск в принципе больших файлов и более детальный и частый мониторинг когда они пересекут нужный размер.

Answer 6 · 2023-10-05 12:32:46

Подобоный bash мониторинг может создавать ненужную нагрузку (например если ты ишешь через find)
а файлов очень много. Они мелкие и т.п. Вобщем если искать часто (каждые 5 минут - то это будет ненужная
нагрузка). А если искать редко - то какая польза в таком мониторинге?

Вобщем верную мысль подсказали выше - слушать события inotify. Правда там будет много флуда. Надо
еще поработать над фильтрацией нужных событий. Но это - рациональный инженерный подход. Не стоит
его отбрасывать.

Есть у меня мысль - поднять информацию не из файлового API (find/du/ncdu) а из таблиц inode.
Там как раз есть информация о размере. Оптимистично - это более быстрый метод. По крайней
мере факт превышения квоты будет виден. А вот кем - надо искать.

Еще есть мысль что контроль квот - это технология уходящего века. В мире современных файловых
систем никто давно уже не учитывает файлы. Создается толстое хранилище на базе zfs например.
Оно нарезается пользователям на кусочки по 16/32/64 Gb и отдаются в пользование. По ним-же
идет тарификация. Если пользователь захочет больше - на ходу ему растягивается кусочек до нужного
ему размера. Тариф соотв другой.

Answer 7 · 2023-10-08 04:04:03

Тут уже много интересного написали. Штука только в том, что в вопросе недостаточно информации, что не позволяет эту задачу решить эффективно. Есть вопросы, на которые надо ответить, прежде чем приступать:

1. Где хранятся эти файлы, которые могут потенциально вырасти до таких размеров и сколько их?
Если они хранятся в одной директории, тогда смысла делать поиск по всей системе нет. На моем десктопе с 500К файлов поиск занимает примерно 9.5 секунд с полным сканированием дерева файловой системы. Если файлов потенциально пара сотен, и они все в одной директории или в поддереве директорий, время поиска можно сильно сократить. Я подозреваю, что find читает информацию о размере из inode'ов, поэтому количество файлов играет значительную роль.

2. Что это за файлы, надо ли их на самом деле мониторить?
Если это логи, к примеру, есть много способов этого не делать (ротация логов, централизованное хранение), если это образы дисков для виртуальных машин (LVM, или еще что), то find может быть не совсем верное решение, могут быть другие инструменты (получение данных из гипервизора, и так далее)

3. Можно ли сделать линки на директории, в которых хранятся файлы, в одну директорию и сканировать её вместо всей файловой системы?
Логично, что, если файлы хранятся где попало и их надо искать по всей системе, поиск будет занимать больше времени.

Про inotify там выше уже дали ссылку на мою статью 2016 года. Это на самом деле самый лучший вариант, если надо сразу знать об изменениях файлов, и самый удобный. Вот только он может вполне быть "из пушки по воробьям", если вам не надо прямо сразу узнавать о событиях файловой системы и обрабатывать их, а достаточно периодических проверок (с учетом вопросов выше).

Проблема на самом деле не в том, как это сделать, а в том, что вы не даете в вопросе достаточно информации, и не понятно, какую именно проблему надо решить, слишком общее описание, для которого можно придумать только общее решение, а общие решения обычно не эффективны на специфических задачах.

Учитывая, что вы хотите это сделать через bash, я бы сначала посчитал, сколько подобных событий (увеличение размера файлов до 16+Тб) происходит и попробовал оптимизировать поиск таких файлов за счет отсекания ненужного поиска (специфическая директория, фильтрация по типу файлов, имени и прочее).

Если файлы имеют какую-то одинаковую часть имени, можно использовать locate (вместо find) для получения списка файлов, и потом передавайте его в скрипт, который тупо проверит размер каждого (через stat, например). В этом случае надо при появлении новых файлов не забывать вызвать updatedb, если это не происходит автоматически по какой-то причине.

Как-то так. Посмотрел другие ваши вопросы. Некоторым из них чуть больше контекста тоже не помешало бы.

P.S. updatedb делает то же самое примерно, что и find, поэтому не надо его вызывать каждый раз перед использованием locate

Как написать bash мониторинг файловой системы EXT4?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт