Спиральное хеширование?

Question

extratag @extratag

Спиральное хеширование?

Прошу помочь мне разобраться с алгоритмом работы спирального хеширования. К сожалению, сколько не гуглил понятной информации по этой теме найти не смог. На русском языке вообще не удалось ничего найти. Есть документ на английском, но с помощью переводчика смысл его мне не удалось уловить. Прошу помочь мне разобраться или привести алгоритм на русском языке.

Так же ищу реализацию этого алгоритма на C/C++.

Вопрос задан более трёх лет назад
3209 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Go-разработчик с нуля + нейросети

9 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

3 комментария

extratag @extratag Автор вопроса

Спасибо большое!
Я так понял log_g(i+1)-log_gi это одна из функций спирального хешировния?

Написано более трёх лет назад
B@rmaley.e><e @barmaley_exe

Нет, это оценка для неё.
В книге «Foundations of multidimensional and metric data structures», отрывок из которой Вы привели советуется использовать 2 функции: h(K), распределяющую значения для ключа K равномерно в [0, 1) и x(h), такой, что y(h(K)) = g^[x(h(K))]
x(h) предлагается взять таким:
x(h(K)) = [log_g(k+1) — h(K)] + h(K) (тут используется округление вверх до ближайшего целого)

Вам остаётся выбрать функцию h(K).

Написано более трёх лет назад
extratag @extratag Автор вопроса

Огромное спасибо!

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Алгоритмы

Простой
Стоит ли читать книгу «Грокаем алгоритмы»?
- 1 подписчик
- 27 мая
- 314 просмотров
0

ответов
Алгоритмы

Простой
Как реализовать поиск слов в файлах?
- 2 подписчика
- 06 апр.
- 383 просмотра
3

ответа
Алгоритмы

Простой
Как распознавать полосу для робота на шахматной доске?
- 1 подписчик
- 19 мар.
- 217 просмотров
1

ответ
Хеширование

Простой
Какие есть совместимые алгоритмы хеширования между C# и Java?
- 1 подписчик
- 11 мар.
- 160 просмотров
3

ответа
Алгоритмы

Простой
Какие данные берет функция для генерации случайного числа?
- 1 подписчик
- 18 февр.
- 275 просмотров
4

ответа
C++

+1 ещё

Простой
Почему не решает задачу?
- 1 подписчик
- 05 февр.
- 425 просмотров
1

ответ
Алгоритмы

Средний
Как создать алгоритм для ракеты в игре?
- 2 подписчика
- 30 окт. 2025
- 401 просмотр
1

ответ
Алгоритмы

Простой
Как решать алгоритмические хакатоны и учится?
- 1 подписчик
- 27 окт. 2025
- 293 просмотра
2

ответа
Базы данных

+1 ещё

Простой
Как правильно реализовать обновление порядка (поле order) в бд?
- 1 подписчик
- 19 окт. 2025
- 250 просмотров
2

ответа
Алгоритмы

Простой
Как открыть файл сжатый с помощью алгоритма Brotli на пк?
- 1 подписчик
- 19 окт. 2025
- 234 просмотра
0

ответов
Показать ещё Загружается…

Answer 1 · 2011-12-20 18:10:07

В статье An analysis of Spiral Hashing по ссылке выше приводится следующее описание:

Спиральное хеширование — вид хеширования, предложенный Мартином (Martin, G. N. N., Spiral storage: Incrementally Augmentable Hash Addressed Storage). В этой технике элементы распределяются по корзинам неравномерно, так, что элементы преимущественно располагаются в одном из концов «корзинного» пространства. Когда коэффициент загруженности (отношение количества числа элементов к числу корзин) превысит пороговое значение, первая корзина, вероятно, наиболее плотная, разбивается на g корзин, где g — коэффициент роста.

Изначально существует g-1 корзин, пронумерованных от 1 до g-1. Отметим, что адресное пространство корзин выглядит так: {1, 2, …, g — 1} = {g⁰, …, g¹ — 1}. При превышении порогового значения первая корзина разбивается на g новых корзин, становящихся корзинами от g до 2g-1. Элементы первой корзины распределяются по новым корзинам с использованием новой хеш-функции (хеш-функция параметризована). Первой корзины теперь не существует, существуют только {2, 3, … 2g-1} = {g^c, …, g^c+1-1}, где c=log_g2.
В общем случае на k-ой стадии (т.е. после k-1 разбиения) выбирается корзина k и разбивается на g новых корзин, получающих номера kg … g(k+1)-1. Её элементы распределяются между новыми корзинами с помощью новой хеш-функции. После k разбиений первых k корзин получим {g^c, …, g^c+1-1}, где c=log_g(k+1) и число корзин всегда делится на g-1.

Опишем теперь хеш-функцию H(K, k), обеспечивающую неравномерное распределение. Заметьте, что хеш-функция зависит не только от ключа K, но ещё и параметризована количеством проведённых разбиений k. Вспомним, что после k разбиений наше адресное пространство имеет вид {g^c, …, g^c+1-1}, где c=log_g(k+1). У нас имеется g^c(g-1) корзин от g^c до g^c+1-1. Получив ключ K мы для начала сопоставим ему x из [0, 1). Это можно сделать, используя, например, функцию распределения пар ключ-значение (G. D. Knott — Hashing functions, The Computer Journal Volume 18 Number 3). Затем мы сопоставляем x число x' из [c, c+1), распределённое равномерно. Один из вариантов такого сопоставления был предложен Мартином. Значение H(K, k) определяется как [g^x'] (округление с отбрасыванием дробной части). Такая хеш функция обладает тем свойством, что H(K, k+1) = H(K, k) для всех корзин g^c, g^c + 1, …, g^c+1, существующих на стадии k, кроме корзины g^c = k+1, которой больше нет на стадии k+1. Заметьте, что P(H(K, k) = i) — логарифмически убывающая функция log_g(i+1)-log_gi для g^c ≤ i ≤ g^c+1, откуда и берётся название спиральное хеширование.

Если использовать открытую адресацию, некоторые элементы будут храниться в чужих корзинах. Поэтому при разбиении корзины нам нужно будет просмотреть и другие, чтобы найти элементы этой корзины. Но нам не хотелось бы затрагивать слишком много корзин при разбиении, поэтому лучше не использовать метод открытой адресации для борьбы с коллизиями. Мы предпочитаем метод цепочек.

Дальше идёт анализ быстродействия и оценки.
А в заключительной части говорится. что метод непрактичен, т.к. работает медленно. В том числе из-за дорогостоящих вызовов функций логарифмирования и экспоненцирования.

Answer 2 · 2011-12-20 17:45:53

Ну если перевести вводный абзац отсюда это хеширование, где значения распределяются по «корзинам» (buckets) не равномерно, как это обычно делается при хешировании, а чаще с одной стороны, чем с другой. Когда количество элементов по отношению к числу корзин достигает некоторого порога, число корзин, как и в других алгоритмах, увеличивается, но разбивается только одна корзина — первая с той стороны, где гуще. Предполагается, что это самая полная корзина.

Спиральное хеширование?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт