Чем объединить разнобойные диски с репликацией данных?

Question

Дмитрий Логвиненко @dmlogv

Универсальный человек

Чем объединить разнобойные диски с репликацией данных?

Привет, коллективный разум!

Подскажите неразумному и забаненному.

Допустим, у меня есть некоторое количество commodity-дисков разной степени поношенности и надежности, которые я насобирал за свою долгую жизнь (тут трэвелстар на 500, там грин на терабайт), но выбрасывать мне их, конечно же, жалко и я всё пущу в дело и воткну в домашнюю файлопомойку.

Подключить всё и объединить в массив с помощью LVM несложно, но, кажется, не очень надежно (бэкапы само собой, но я ведь хочу, чтобы всё было еще и «быстро»!).

Если ли вариант их кооперации с чем-то вроде K-safety? Т. е. указываю фактор репликации, скажем, троечку и каждый блок непременно присутствует минимум на трех физических дисках, а при выходе одного из строя, мы оперативно и автоматически делаем ребаланс.

(Нет, Vertica и HDFS не наталкивали меня на эту мысль.)

Ну и гвоздь в крышку: а если реплицировать не блоки, а файлы целиком? Чтобы даже если сдохло совсем почти всё, то на оставшихся в живых оставались бы полноценные данные, а не отдельные кластеры.

Вопрос задан более трёх лет назад
154 просмотра

3 комментария

Подписаться 1 Средний 3 комментария

Помогут разобраться в теме Все курсы

Skillbox

Linux для робототехников

3 месяца

Далее
Stepik

Основы Linux

2 недели

Далее
Учебный центр IBS

AL-1801 ОС Astra Linux Special Edition 1.8 для пользователей

1 неделя

Далее

Пригласить эксперта

Ответы на вопрос 2

2 комментария

Дмитрий Логвиненко @dmlogv Автор вопроса

А можно поподробнее насчет вашего массива на mdadm и дележкой дисков по терабайту?
Зеркала объединяете в JBOD или используете несколько файловые систем?

Написано более трёх лет назад
rPman @rPman

разные файловые системы, буквально три точки монтирования, разделив на три массива я имею больше контроля момента ребилда в случае смены диска, так как я могу его пересобирать по частям (вместо одного длинного я могу запустить три коротких в удобное для меня время каждый), и главное смены типа хранилища (у меня был btrfs потом сделал mdadm, смену формата одной точки я затягивал на пол года) перенося данные между этими рейдами (пока хранилище не полностью заполнено). Такая гибкость очень экономит время.

mdadm raid5 один из самых эффективных по размеру, при наличии возможности настоятельно рекомендуется raid6, так как именно в момент ребилда, повышенная интенсивность работы диска с большими шансами активирует скрытые болячки, унося с собою данные (или деньги на их восстановление)

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

+3 ещё

Простой
Настройка трёх сетевых карт Debian systemd-networkd?
- 1 подписчик
- 11 часов назад
- 118 просмотров
1

ответ
Серверное оборудование

+4 ещё

Средний
Как сделать сервер для видеонаблюдения?
- 5 подписчиков
- 13 часов назад
- 170 просмотров
3

ответа
Windows

+1 ещё

Простой
Как защитить программный Raid-1 от перестроения?
- 2 подписчика
- 06 дек.
- 254 просмотра
2

ответа
Linux

+1 ещё

Простой
Не работает apt update && apt upgrade в Kali Linux. Что делать?
- 2 подписчика
- 04 дек.
- 432 просмотра
2

ответа
Linux

+1 ещё

Простой
На чем практиковаться начинающему админу?
- 3 подписчика
- 30 нояб.
- 1020 просмотров
3

ответа
RAID

+1 ещё

Простой
Как обойти ограничение с отсутствием суперконденсатора?
- 1 подписчик
- 29 нояб.
- 131 просмотр
1

ответ
Linux

+2 ещё

Простой
В shinobi отображаются видео только за 24 часа, как увидеть все?
- 3 подписчика
- 27 нояб.
- 230 просмотров
0

ответов
Юриспруденция в IT

+1 ещё

Простой
Агрегаторы мессенджеров (WhatsApp/Telegram/Instagram) в РФ: технически кто отвечает за данные?
- 1 подписчик
- 26 нояб.
- 235 просмотров
1

ответ
Linux

+1 ещё

Средний
Почему не монтируются сетевые шары при VPN?
- 3 подписчика
- 23 нояб.
- 832 просмотра
1

ответ
Linux

+2 ещё

Средний
StrongSwan IKEv2/IPSec и fail2ban, как правильно настроить?
- 2 подписчика
- 22 нояб.
- 502 просмотра
0

ответов
Показать ещё Загружается…

Специалист первой линии технической поддержки

Петрович-Тех

До 52 882 ₽

Веб-разработчик (PHP) в продукт из сферы FinTech

ITWORK AGENCY • Москва

До 500 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

ну LVM вроде позволяет степень репликации выбрать...
ZFS опять же...
> ZFS опять же...
Не-не, у нас же эконом-вариант — никаких ECC

> ну LVM вроде позволяет степень репликации выбрать
А можете поточнее ткнуть в параметр или на страницу мана? А то я, кажется, уже всё перебрал, но нужного не нашел
Дмитрий Логвиненко, Например тут

Answer 1 · 2022-04-15 08:21:36

Самый удобный инструмент для решения этой задачи - btrfs, в нем есть нативная поддержка raid, нет дополнительного оверхеда инициализации и позволяет проводить операции с файловой системой на лету

Из недостатков, официально статус raid56 - есть проблемы, с другой стороны если я верно понимаю, большая их часть решена и это чаще не проблемы с потерей данных, а потерей свободного места, у меня достаточно долго на пяток терабайт было хранилище raid5, и даже когда прервался процесс удаления диска из массива (место кончилось) данные я спокойно скопировал и пересоздал массив на основе уже mdadm.

зеркало же на btrfs создавать относительно надежно.

По теме вопроса, в похожей ситуации, я предварительно вручную составил план размещения данных на дисках (у меня были очень разные размеры от 350гб до 1тб, примерно 6 дисков), затем большего размера диски разбил на разделы, некоторые из которых были точно под размер маленьких дисков, и объединяя где диск целиком, где раздел, собрал все в несколько отдельных файловых систем. Очень важно сохранить карту дисков (удобно разрисуй в документе с картинками), какая файловая система какой диск и пометить физически жесткие диски символами, чтоб замена вышедших из строя была по проще.

Сейчас у меня такого зоопарка нет, массив собираю на основе 3тб дисков, но все равно добавляю их не целиком, а поделив их емкость на 3 части и сделав несколько файловых систем (по 1тб так чтобы можно было добавить к примеру 1тб диск или наоборот, добавить к массиву 4тб диск не пересобирая весь массив), так же я отказался от raid5 btrfs, использую mdadm, но это больше ради перестраховки

Answer 2 · 2022-04-15 00:28:59

CEPH на одной ноде (хихикает)

а если реплицировать не блоки, а файлы целиком? Чтобы даже если сдохло совсем почти всё, то на оставшихся в живых оставались бы полноценные данные, а не отдельные кластеры.

Могу вас поздравить с изобретением старых добрых бекапов.

Итого, если отбросить иронию, вам поможет объединение вашего хлама в линейные массивы примерно равного размера с последующим регулярным rsync между ними.

Чем объединить разнобойные диски с репликацией данных?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт