Как обеспечить избыточную целостность?

Question

EverOne @EverOne

R&D Management since 2011

Как обеспечить избыточную целостность?

Пытаемся с коллегами найти решение логической задачи, уже, если честно, нет уверенности что оно есть.
Итак задача:

Есть 1000 заключенных, и есть числа от 1 до 1000, которым присвоено собственное значение. Например:

1 = 0f88Hs
2 = UdD16j
3 = NkP4V4
4 = bRKitt
5 = 3rLqBA
6 = 5gH6LE
7 = 0wrICY
8 = 58CEoM
9 = 1oCn43
...
1000 = Id2401

Каждый заключенный знает свою пару [ число = значение ] и пару предыдущего, как минимум. Но еще он может запомнить N-ное количество случайных пар (или не случайных, по договоренности).
Утром придут надзиратели и уведут заключенных - случайное количество (до 75%, то есть может остаться 250 человек, а может и 500) случайных заключенных. Например, на расстрел. Количество и порядок неизвестен.
Итак, вопрос: каково минимальное количество пар и по какому алгоритму должен запомнить каждый заключенный для гарантированного восстановления последовательности значений? Как изменится этот алгоритм если уведут 90% заключенных или только 25%? Как равномерно перераспределить нагрузку если к имеющейся 1000 добавят еще 1000, а чисел останется столько же, просто два заключенных будут помнить одно и то же число?

Вопрос задан более трёх лет назад
404 просмотра

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Математика для Data Science

4 месяца

Далее
ProductStar

Математика и статистика для аналитика на Python

1 месяц

Далее
Яндекс Практикум

Математика для анализа данных

6 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 4

Комментировать

3 комментария

EverOne @EverOne Автор вопроса

Не то, не подходит, нужна проверка каждого элемента, а не всей строки.
По задаче искажения возможны из-за невозможности восстановить данные кого-то из заключенных, а не потому, что он содержимое строки перепутал. С памятью у них все отлично. : )

Уточню: можно каждого заключенного заставить выучить всю 1000 пар, но это не рентабельно, поэтому и нужно минимальное значение и алгоритм. В теории, конечно, можно заставить заключенного запомнить еще и некий алгоритм и/или контрольную сумму, если так будет легче.

Написано более трёх лет назад
Deerenaros @Deerenaros

Так лол. Ок гугл, исправление стираний. Не вижу проблем. Тут скорее творческая задача на оптимальную организацию, но не более того. Вывести теоретический предел помогут теоремы Шеннона.

Написано более трёх лет назад
EverOne @EverOne Автор вопроса

Deerenaros, Ну так да, творческая задача на оптимальную организацию. Примерчик реализации бы. В любом случае спасибо за наводку.

Написано более трёх лет назад

4 комментария

EverOne @EverOne Автор вопроса

последовательность их более никак не играет

Последовательность критически важна по условиям.
В этой ситуации гарантировано сохранение данных только при удалении 1 единственного контейнера.

При удалении каждого второго контейнера цепь будет легко восстановить.
Т.к. вторым непременно выберем тот, что хранит избыточно данные первого.

Для этого разрешено запоминать еще N пар. Если каждый контейнер будет хранить 2 базовых значения (свое и предыдущего) и еще 2 следующих, то удали вы даже 4 контейнера подряд - целостность не нарушится.
И есть возможность сохранять контейнеры в случайном порядке или следуя алгоритму.

Весь смысл в том, чтоб не заставлять каждого помнить всю цепочку, но при потерях иметь возможность ее воссоздать.

Задача решается легко если даже каждый будет помнить 50%+1 запись цепи, Но нужно уменьшить этот объем до разумных пределов.

Написано более трёх лет назад
Сергей Соколов @sergiks

EverOne, 10 элементов, каждый хранит 50% + 1 = 6 значений. Удалили 7 первых элементов. Кто помнит 7-й? Никто.

Ещё раз акцентирую: мы специально выбираем для удаления так, чтобы нанести невосстановимый урон.

Написано более трёх лет назад
longclaps @longclaps

Всё правильно, не хватает лишь рассуждения о достаточности результата N+1. Оно вполне тривиально, выбираем конкретный паттерн хранения, напр. каждый помнит себя и N следующих (в кольцевом буфере).
Ситуация симметрична относительно поворота на любой угол, уверждение, верное для одного, верно и для остальных. Один неуязвим (в смысле потери его инфы) -> любой неуязвим -> вся конструкция неубиваема.

Написано более трёх лет назад
EverOne @EverOne Автор вопроса

Сергей Соколов, так каково решение в конечном итоге? Запоминать всю последовательность каждому? Или же есть решение при котором каждый может помнить только себя и нескольких из 1000?
И про N+1 на примере пожалуйста.

Написано более трёх лет назад

5 комментариев

EverOne @EverOne Автор вопроса

Уже думал над этим, мне нужен такой запас прочности, чтоб при потере случайных 75% из 1000 цепь не порвалась, это же получается 751 значение на каждого. Все равно что всю 1000 на каждом хранить.

Энтропия не пойдет - общих частей в ключах минимальное количество.

Написано более трёх лет назад
xmoonlight @xmoonlight

EverOne, creambee.ru/blog/post/qr-specification

чтоб при потере случайных 75% из 1000 цепь не порвалась

Т.е., минимум, нужно всю информацию (всю цепь) кодировать как 3 QR-блока с уровнем коррекции Q(~25% потерь) или H (~30% потерь) и распределять на этих 1000 так, чтобы ЛЮБЫЕ взятые 250 человек (из 1000) - хранили ~3/4 части (это будет ~25% потерь как раз) одного QR-блока.

Т.е. нужно превратить 3 одинаковых QR-блока в одну непрерывную цепочку и затем равно распределить среди всех 1000 человек.

Надо уже детально посчитать по избытку. Но, задача - явно решаема.

Написано более трёх лет назад
EverOne @EverOne Автор вопроса

xmoonlight, пример реализации бы. Или вектор для размышлений хотя бы.

Написано более трёх лет назад
xmoonlight @xmoonlight

вектор для размышлений: QR-код

Написано более трёх лет назад
chupasaurus @chupasaurus

xmoonlight, Некромантия: ваш ответ повторяет мой.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Математика

Простой
Необходимость сохранения инвариантов при мат. индукции?
- 2 подписчика
- 18 дек.
- 97 просмотров
1

ответ
Математика

Простой
Правильное ли док-во существования функции?
- 1 подписчик
- 10 нояб.
- 182 просмотра
1

ответ
Математика

Простой
Почему не используется простая таблица истинности?
- 1 подписчик
- 07 нояб.
- 152 просмотра
1

ответ
Математика

Простой
Как решается такое задание?
- 1 подписчик
- 02 нояб.
- 213 просмотров
2

ответа
Математика

Простой
Нужно ли это доказывать в обратную сторону?
- 1 подписчик
- 17 окт.
- 179 просмотров
1

ответ
Математика

+1 ещё

Простой
Хороший учебник/статья/книга по производным и началам матанализа?
- 2 подписчика
- 08 окт.
- 335 просмотров
3

ответа
Математика

Средний
Какая функция y=f(x) может описывать подобный график с ассиметричным распределением?
- 1 подписчик
- 01 сент.
- 494 просмотра
2

ответа
Математика

+3 ещё

Средний
Как выбрать размеры интервалов для неравно интервального вариационного ряда?
- 1 подписчик
- 24 июн.
- 185 просмотров
2

ответа
Математика

+1 ещё

Средний
Как найти площадь большого сегмента?
- 1 подписчик
- 12 июн.
- 234 просмотра
1

ответ
Математика

Средний
Как правильно заниматься перебором: a³ + b³ + c³ = d³?
- 1 подписчик
- 22 мая
- 522 просмотра
1

ответ
Показать ещё Загружается…

Стажер Аналитик

ПСБ цифровая лаборатория • Москва

от 30 000 до 60 000 ₽

Frontend / Product Engineer (Tauri + Vue) — Solo Role

Poker Training

от 250 000 до 300 000 ₽

Deep Learning Engineer (GigaChat Prod)

Сбер • Москва

от 350 000 ₽

Answer 1 · 2017-09-11 03:00:10

Дополню Deerenaros : Оптимальное решение - Folded Reed—Solomon Code, который к тому же подозрительно похож на условие задачи. С использованием этого алгоритма каждому заключённому необходимо запомнить помимо своего O(1/ε) частей кода, где ε - отношение остающихся заключенных к общему, 1/ε округляем вверх для необходимой избыточности.
Как оно работает - из исходных пар составляется код Рида-Соломона размером 1000*(1+O(1/ε)) букв (размер буквы в битах исходя из размера данных, присваемых числах, в задаче это 6 бит), каждый заключенный помимо исходной пары со своим номером запоминает части кода на местах 1000εn ... 1000ε(n+1)-1, n - свой номер. Минимальная выборка в виде заключенных с номерами 1..1000ε даст 1000ε своих пар, 1000 кусков кода и пару 1000-го, что больше минимально необходимых 1000ε+1.
В изначальном варианте: ε=¼, О(1/ε)=4, код размером 1000*(1+4)=5000 букв, устойчивость FRS-кода - до n*(1-ε)-1=3999 потерь, тогда как мы теряем только 3749. Для ε=⅒ им придётся запоминать 10 кусков кода, для ε=¾ - один (как и для ∀ε>½). Если количество заключенных увеличить, то пусть заключенные с одинаковыми номерами будут запоминать разные части кода: например один как уже определили, второй со сдвигом на 10 от своего номера; в таком случае код можно поровну распределить на всех и число частей для запоминания уменьшится нацело вдвое.

Answer 2 · 2017-09-10 19:18:42

Deerenaros @Deerenaros

Программист, математик, задрот и даже чуть инженер

Эм, так вам избыточные коды. Рида-Соломона, например. Или каскадные, они более гибкие.

Ответ написан более трёх лет назад

3 комментария

Answer 3 · 2017-09-10 21:16:18

Вместо «заключённых» мне проще представлять жесткие диски, флешки или абстрактные контейнеры с данными.

Для проверки на устойчивость будем рассматривать наихудшую ситуацию намеренного удаления злыми «наздирателями» комбинации контейнеров, приносящей гарантированный урон целостности.

В каждом хранится «своё» значение + 1 значение из «предыдущего». На деле, неважно, какого именно, т.к. последовательность их более никак не играет. В этой ситуации гарантировано сохранение данных только при удалении 1 единственного контейнера. Т.к. вторым непременно выберем тот, что хранит избыточно данные первого.

Удаляем N контейнеров. Цель – начисто удалить данные хотя бы одного. Т.е. выбираем все те, кто хранит избыточно данные этого «избранного».

Единственный вариант защититься – хранить избыточно в N+1 контейнерах. Вернее, число копий каждой единицы данных должно быть на 1 больше потенциально удаляемых. По алгоритму не усложняя можно хрниать в N следующих.

Answer 4 · 2017-09-11 02:15:03

Располагаем всю последовательность (1-1000) в кольцо.
Допустим, хотим запас прочности: 2.
Затем, делим это кольцо пополам и каждый X запоминает диаметральное значение:
1 => 1, 500
2 => 2, 501
и т.д.

Запас прочности 3:
1 => 1, 333, 666
2 => 2, 334, 667
и т.д.

Чтобы уменьшить объём хранимой информации, можно прибегнуть к энтропийному кодированию.

Как обеспечить избыточную целостность?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт