Как хешировать в хеш таблице узлы дерева?

Question

Даниил @daniil14056

Как хешировать в хеш таблице узлы дерева?

Или какой другой способ или подход пока не думал. Каждый узел имеет вычисленное значение хешкода.
Как сделать быстрый поиск ключа по значению, как переопределить Equals? Без рекурсии?

// код тут написал примерный
  class A{
  A nodeChild1; 
  A  nodeChild2;
  int data; //  только на самом вверху дерева , 2^(n-1)-1 узлов 
 // int casheHashCode; 

 private bool _equalrecursion(A? x, A? y)
   {
 if(x.GetHashCode()==y.GetHashCode(){
        if(x.Child1.GetHashCode()==y.Child1.GetHashCode())
             if(x.Child2.GetHashCode()==y.Child2.GetHashCode()){
                  if(_equalrecursion(x.Child1,y.Child1)
                             if(x.Child1!=null...)
                           return  _equalrecursion(x.Child2,y.Child2)
                             else return x.Value==y.value;
}
}
return false;
} public bool Equals(А? x, А? y)=>_equalrecursion(A,Б);
}

В таком решении для того что бы проверить 2 равных узла будет 2^n сравнений выдающих true
Как можно сократить число вычислений допутсим до 3, можно составить такую хеш функцию, что бы гарантировано(или с какой-то высокой вероятностью), не было коллизий между узлами на соседней высоте. Типа что бы хеш дочерних узлов влиял на хеш узла?
Что бы допустим для узла с хешом S на высоте- 10 если бы нашелся бы узел с хешом S, то он мог быть либо искомым значением, либо узлом на какой-то другой высоте, допустим 20, и легко не выдерживал проверку lдочерних узлов.
Типа что бы максимум проверить сам узел, и 2 его потомков? А п коллизии хешей могут быть только у узлов на 2 порядка выше меньше.
Может как-то можно хеш-функцию составить хитро, сдвинуть байты( Какие есть статьи по написанию хеш функций, как там подбираются параметры типа обычно что-то такое. a*434334^b*1122121... как эти числа подбираются)

Из задачи, Ключ в Dictionary сравнивается по значению, полей. Так как каждый раз перед поиском создается объект из комбинации узлов. Задача проверить, если такая комбинация узлов в хештаблице? Избежав коллизий.
Поиск должен быть быстрым, а все остальное неважно. Пока у мен решение(не решение), рекурсивное сравнение всех узлов. Но хотелось бы ограничиться так что бы проверки детей было достаточно.( Из условия видно, что число вариантов узлов на каждой высоте дерева известен 2^n, вот можно составить так функцию что бы все комбинации давали достоверно разный результат, допустим на высоте дерева 10, может быть 1024 вариантов узлов, и 1024^2 их вариантов. (тут возможно я сам ответил на вопрос, для 2^16 комбинаций, которые укладываются в 32 бита) Может там как-то индексировать, и хранить индексы.
Да и дерево только растет, все значения уникальны, а каждый верхний узел на высоте N может иметь только узлы высотой N-1
И вопрос, к примеру для каждой высоты дерева придумать уникальную хеш функцию. вычисления ее родителя, таким образом надо 32 функции придумать,
К примеру для дерева высотой 4
Для 2 высоты (2^2) узла будет искаться f1(x1,x2)
Для 3 высоты (2^3) узла будет искаться f2(x1',x2')=f2( f1(x11,x21),f1(x21,x22);
И так далее.
И можно ли подобрать так, что бы гарантировать что какая-нибудь f4(x1,x2) != f7(x1,x2)?

Вопрос задан более двух лет назад
173 просмотра

Комментировать

Подписаться 2 Сложный Комментировать

Помогут разобраться в теме Все курсы

Нетология

Разработчик игр на Unity

13 месяцев

Далее
Академия Эдюсон

Разработчик игр на Unity + ИИ

6 месяцев

Далее
Stepik

PRO C#. Профессия "Backend разработчик"

4 месяца

Далее

Пригласить эксперта

Ответы на вопрос 2

2 комментария

Даниил @daniil14056 Автор вопроса

Забыл добавить.
Каждый корневой узел состоит из уникального числа потомков. Если создается узел, всего с одним на самом вверху изменённым узлом, то он новый.
Еще такие уловия, Из хеш-таблицы удалений не бывает, она только растет , то есть можно как-то запечатать.
Каждый Хеш код Корневого узла создается на основе ?_функции от 2 его потомков.
Задача, как можно гарантировано, знать, что этот хеш код не может совпадать, с одноуровневыми соседями. Что бы сделать только 3 проверки максимум.
К примеру 2 16bit значений можно гарантированно уместить на 32bit. nodeA<<16 | nodeB; Вот короче как-то отсюда надо думать)
А с 2мя -20bit уже так не получится, будут колизии, но возможно, для таких значений, мне нужно проверить на один уровень ниже просто. (Что особо не замедлит, так как на высоте 20 будет меньше в 16 раз меньше вызываться функция ContainsKey )

Написано более двух лет назад
Wataru @wataru Куратор тега Алгоритмы

Даниил, Можно задачу формализировать? Что дано, что надо делать? Пример данных дайте, хотя бы.

Каждый корневой узел состоит из уникального числа потомков.
Ну тогда у вас уже готовая идеальная хеш-функция - количество потомков у корня.

Написано более двух лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C#

+4 ещё

Сложный
Как сделать правильную перемотку видео в Flyleaf (wpf)?
- 3 подписчика
- 15 июн.
- 212 просмотров
1

ответ
Алгоритмы

Простой
Стоит ли читать книгу «Грокаем алгоритмы»?
- 1 подписчик
- 27 мая
- 328 просмотров
0

ответов
C#

+1 ещё

Средний
Как передать изображение на принтер TSC?
- 1 подписчик
- 12 мая
- 142 просмотра
1

ответ
Python

+3 ещё

Средний
Как перенести позу SMPL модели на игровую 3д модель?
- 2 подписчика
- 10 мая
- 374 просмотра
1

ответ
MySQL

+2 ещё

Простой
Как исправить ошибку could not load file or assembly «System.Data.SqlClient»?
- 1 подписчик
- 06 мая
- 118 просмотров
1

ответ
C#

+2 ещё

Простой
Как заставить кнопки в ScrollView корректно перераспределять остальные элементы при анимации?
- 1 подписчик
- 10 апр.
- 106 просмотров
1

ответ
Алгоритмы

Простой
Как реализовать поиск слов в файлах?
- 2 подписчика
- 06 апр.
- 393 просмотра
3

ответа
C#

Простой
Как прочесть без блокировок в многопоточном приложение 16 байт структурное значение?
- 1 подписчик
- 30 мар.
- 198 просмотров
1

ответ
Алгоритмы

Простой
Как распознавать полосу для робота на шахматной доске?
- 1 подписчик
- 19 мар.
- 222 просмотра
1

ответ
C#

+1 ещё

Средний
Как убрать проблему, из-за которой карта не возвращается в руку?
- 1 подписчик
- 18 мар.
- 316 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2023-07-26 17:02:26

Итак, у вас ключи - какая-то древовидная структура и вам надо быстро определять, а есть ли такая структура в таблице. Я правильно понял?

Очевидно, что придется хотябы раз просмотреть все узлы структуры. Ведь иначе я могу какой-то узел глубоко внизу поменять, и такая структура в таблице уже не будет встречатся, но алгоритм, не просматривающий все узлы этого никак обнаружить не сможет.

В этом случае реализуют, например, хитрый хеш - который меняется при изменении какого-либо узла или формы дерева. Например, можно взять вычисленные значения хешей для всех поддеревьев корня, потом от этих значений взять полиномиальный хеш. Таким образом за один рекурсивный проход вы получите значение хеша для всего дерева.

Или можно тупо записать вашу структуру данных в строку (Например, расставив скобки вокруг каждого поддерева вроде "(a(b)(ccc(dd))" - это узел a, у которого есть дети b и ccc, у последнего есть ребенок dd) и потом как угодно хешировать уже строку, тогда ничего самостоятельно реализовавать ничего вообще не надо (to_json и hash от строки возможно уже есть).

Answer 2 · 2023-07-26 18:12:48

Дружище тебе не надо портить дерево. Оно и так хорошо.
Просто заведи отдельную хеш-таблицу и трекай две структуры
одновременно.

LRU например так и делает. Цепной список + Hashtable.

Как хешировать в хеш таблице узлы дерева?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт