Функцию, похожую на хэш, с коротким непоследовательным дайджестом и без коллизий?

Question

Сергей Соколов @sergiks

♬♬

Функцию, похожую на хэш, с коротким непоследовательным дайджестом и без коллизий?

Для целых в диапазоне 0..M надо получать n-символьные соответствия, не выглядящие последовательными:

0 JZQ736
1 KVYZ97
2 PW7NB3

Подскажите ф-ю f(i) = s, чтобы в заданном диапазоне получать такие микро-хэши без коллизий. А совсем круто было бы и обратную ф-ю f1(s) = i чтобы из кода получать целое, или узнать, что код левак.

Криптостойкость не требуется, это для маркетинговой красоты билетов.

Вопрос задан более трёх лет назад
7545 просмотров

1 комментарий

Подписаться 10 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 8

Комментировать

1 комментарий

Комментировать

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Программирование

+4 ещё

Простой
На сколько плох мой GitHub?
- 1 подписчик
- 03 июл.
- 551 просмотр
2

ответа
Программирование

+2 ещё

Средний
Поможете собрать компьютер для запуска виртуальных машин и коддинга?
- 1 подписчик
- 02 июл.
- 471 просмотр
5

ответов
Программирование

+4 ещё

Сложный
Что делать, на QEMU всё летает, а реальный Celeron D умирает?
- 2 подписчика
- 01 июл.
- 527 просмотров
1

ответ
Программирование

+4 ещё

Простой
Выбор между изучением c++ и Golang, что изучать?
- 3 подписчика
- 09 июн.
- 1300 просмотров
10

ответов
Программирование

Простой
Как создать и использовать свою кодировку знаков?
- 1 подписчик
- 02 июн.
- 724 просмотра
4

ответа
Алгоритмы

Простой
Стоит ли читать книгу «Грокаем алгоритмы»?
- 1 подписчик
- 27 мая
- 301 просмотр
0

ответов
Active Directory

+3 ещё

Сложный
Шифрование флешек в домене AD. Как и чем?
- 6 подписчиков
- 06 мая
- 932 просмотра
2

ответа
Программирование

+1 ещё

Простой
Проект для программирования?
- 2 подписчика
- 27 апр.
- 875 просмотров
9

ответов
Программирование

Простой
Олимпиадное программирование — с чего начать?
- 1 подписчик
- 18 апр.
- 598 просмотров
2

ответа
Программирование

Простой
Как управлять/хранить изображения для UI?
- 1 подписчик
- 10 апр.
- 314 просмотров
1

ответ
Показать ещё Загружается…

А проблема точно именно так ставится? Те нужно O(1) время поиска по коду билета?
Те судя по колличеству символов — тираж билетов не большой.
А стойкость сгенерированного набора случайны последовательность + контрольная сумма + соль +… — выше. Да и реализация не сложней. :))

Answer 1 · 2012-07-29 10:53:16

Можно так. Работает для всех m от 1 до MOD-1. Если не хватает, то можно либо увеличить константы (тогда может вырасти длина), либо чуток адаптировать алгоритм. Я подогнал, чтобы было как в примере 6 знаков в коде. На самом деле можно все делать в 64-битных переменных, просто так на Java удобнее.

    private static final BigInteger MULTIPLIER = BigInteger.valueOf(13L);
    private static final BigInteger MOD = BigInteger.valueOf(99990001L);
    private static final BigInteger ADDEND = BigInteger.valueOf(699930007L);

    public static String encode(long m) {
        if (m <= 0 || m >= MOD.longValue()) {
            throw new IllegalArgumentException("Argument is out of range.");
        }
        return BigInteger.valueOf(m).modInverse(MOD).multiply(MULTIPLIER)
                .add(ADDEND).toString(36).toUpperCase();
    }

    public static long decode(String encoded) {
        return new BigInteger(encoded.toLowerCase(), 36).subtract(ADDEND).divide(MULTIPLIER)
                .modInverse(MOD).longValue();
    }

Вот примеры того, что получается (для разных m):

1 BKPXGK
2 MBOAIK
3 PWNQV8
4 RP5H1K
5 SRUICK
10000 X2JV9T
10001 PWMTFN
10002 U025II
10003 TRK6AU
10004 JRJEMK
10005 UARMRU
10006 S2NCNJ
10007 R1E1UK
10008 HRCMBX
10009 WU4GN7
99989996 FVI2O7
99989997 GY73Z7
99989998 IQOU5J
99989999 MBOAI7
99990000 X2MNK7

Answer 2 · 2012-07-29 11:10:05

Вам не нужна хэш функция, т.к. обратно не сможете конвертировать, да и коллизии возможны в любом случае. Лучшее решение для вас — перевести из десятеричнойной системы счисления в N-ричную, где N — количество символов, которые вы хотите использовать (26 букв латинского алфавита + 10 цифр?). Как это сделать написано на вики. Чтоб числа не выглядели последовательно, можно обернуть биты исходного числа в обратном порядке.

Answer 3 · 2012-07-29 14:17:02

> Подскажите аналог хэш-функций, но короче, и без коллизий?

в такой постановке вам может помочь единорог.

Answer 4 · 2014-01-13 13:47:05

Vitaly Sivkov @Sivkoff

Web Developer

Всем доброго времени суток.
Если кому-то нужно, реализовал алгоритм @MikeMirzayanov на php.

Ответ написан более трёх лет назад

Комментировать

Answer 5 · 2012-07-29 08:56:56

Математический подход: возьмите два простых числа, a и m, причём M < a < m, m — наибольшее простое, меньшее чем {мощность алфавита}^{количество символов в коде}. f(i) = i * a (mod m), f(s) = i * a^-1 (mod m), где a^-1 — обратное к a по модулю m.

Программистский подход: f(i) = биты числа i в обратном порядке. Тогда у последовательных билетов коды не будут казаться последовательными. После преобразования в строку можно добавить случайных символов в фиксированные места.

Answer 6 · 2012-07-29 10:44:10

ekim @ekim

оно?
www.manhunter.ru/webmaster/421_kak_sdelat_svoy_servis_korotkih_ssilok.html

Ответ написан более трёх лет назад

1 комментарий

Answer 7 · 2012-07-29 13:57:49

Попробуйте использовать какой-либо ГПСЧ (генератор псевдослучайных чисел), в качестве зерна берите ваш индекс. Поскольку числа псевдослучайные, каждому зерну будет однозначно соответствовать известный результат, что удовлетворяет условию задачи. Например, линейный конгруэнтный метод может подойти: он отображает зерно в единственный результат; позволяет выполнить обратное преобразование; прост в реализации.

Answer 8 · 2012-07-29 09:32:26

Lico @Lico

CRC-24?

Ответ написан более трёх лет назад

Комментировать

Answer 9 · 2012-07-29 23:28:51

В случае не очень больших M можно нагенерить M рандомных n-символьных комбинаций(проверяя на уникальность пиханием в какой-нибудь словарь/дерево/..), сопоставить каждому числу комбинацию по порядку и просто их запомнить.

Функцию, похожую на хэш, с коротким непоследовательным дайджестом и без коллизий?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт