Как работает поиск в хэш-таблицах?

Question

Rild2 @Rild2

Как работает поиск в хэш-таблицах?

Всем доброго времени суток. Я относительно недавно начал знакомиться с алгоритмами и нашёл такое понятие, как хэш-таблицы - массивы, где каждому значению принадлежит свой уникальный ключ. Мне не особо понятно, как находятся значения в хэш-таблицах, но считается, что в них поиск элементов происходит быстрее всего.

Почему? Разве в обычном массиве и хэш-таблице не одинаковое количество элементов?
Поиск, по-моему, должен занимать O(n) времени, несмотря на то, сколько значений в массиве и несмотря на то, есть ли в нём ключи или нет. Просто в массиве мы сравниваем каждый элемент с нужным, а в хэш-таблице сравниваем значение каждого ключа с нужным... и в чём тогда разница по времени?

Вопрос задан более года назад
578 просмотров

1 комментарий

Подписаться 1 Средний 1 комментарий

Пригласить эксперта

Ответы на вопрос 3

3 комментария

Rild2 @Rild2 Автор вопроса

Спасибо за ответ, но мне нужно было узнать, не как получить ключ для значения в хэш-таблице, а как происходит именно сам поиск нужного ключа. Если это действительно занимает всего O(1) времени, то на каком алгоритме это устроено? Мне в голову приходит только простой поиск O(n) и бинарный (это если ключи отсортированы по возрастанию), правда даже в этом случае поиск займёт O(log2 n).
O(1) как получается?

Написано более года назад
Anonymous Penguin @Anopeng

Rild2, в массивах время поиска занимает O(1), у них такая архитекрута. Это основы, это нужно было изучить до хеш-таблиц

Написано более года назад
FedorWK @FedorWK

Rild2, там происходит не поиск, а выбор элемента по индексу, что и в массиве и в хэш-мапе составляет О(1)

Написано более года назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Алгоритмы

Простой
Как определить сложность алгоритма?
- 1 подписчик
- 17 часов назад
- 85 просмотров
2

ответа
Алгоритмы

+2 ещё

Простой
Какая может быть формула для решения этой задачи?
- 3 подписчика
- 11 апр.
- 5202 просмотра
3

ответа
Хеширование

Средний
Как называется этот алгоритм разбиения хэша?
- 1 подписчик
- 08 апр.
- 108 просмотров
1

ответ
Алгоритмы

+1 ещё

Простой
Как узнать, входит ли игрок1 (x,y,z) в поле игрок2 (x,y,z)?
- 1 подписчик
- 08 апр.
- 186 просмотров
3

ответа
C++

+1 ещё

Простой
Как решить данную задачу при помощи префиксного дерева?
- 2 подписчика
- 05 апр.
- 179 просмотров
1

ответ
Хеширование

Простой
Как работает хэшиоование sha-3?
- 1 подписчик
- 31 мар.
- 39 просмотров
1

ответ
Алгоритмы

+1 ещё

Средний
Есть ли современная реализации алгоритма триангуляции невыпуклого многоугольника с отверстиями?
- 1 подписчик
- 29 мар.
- 107 просмотров
0

ответов
JavaScript

+1 ещё

Средний
Как найти начальную точку для определения маршрутов в двумерном массиве?
- 1 подписчик
- 15 мар.
- 226 просмотров
6

ответов
Алгоритмы

+1 ещё

Простой
Как объединить списки, полученные от 2 REST API с параметрами `limit` и `offset`, и вернуть его, согласно параметрам `limit` и `offset`?
- 1 подписчик
- 15 мар.
- 104 просмотра
2

ответа
Алгоритмы

Средний
Как правильно удалять элементы хэш таблицы?
- 1 подписчик
- 10 мар.
- 101 просмотр
2

ответа
Показать ещё Загружается…

С developer (алгоритмист)

СберТех • Москва

от 350 000 ₽

Senior Java Developer, Database Engine

CedrusData

от 350 000 ₽

Senior Java Engineer (JavaSE, algorithms, optimization)

Brain Shells

от 6 000 $

Интеграция-сборка сайта на ModX

16 апр. 2024, в 18:09

45000 руб./за проект

Написать скрипт на Python для уникализации и склейки видео

16 апр. 2024, в 17:36

15000 руб./за проект

Перенести полную копию сайта без доработок с opencart

16 апр. 2024, в 17:32

1000 руб./в час

А стоп, пардон)
Только что прочитал, что сложность поиска равна log2 (n), что аналогично бинарному поиску. Получается, хэш-ключи - это числа, отсортированные по возрастанию?

Answer 1 · 2022-05-11 18:48:19

У нас есть определенное строчное значение, по которому мы хотим найти или добавить элемент в хеш-таблице. Сначала нам нужно узнать хеш строки - это уникальное число, которое мы получаем в результате провождения операций хеш-функции над строкой. Мы получили число, и как раз это число мы используем как индекс к хеш-таблице (по сути, это просто массив, в котором время поиска составляет O(1)). А про хеш-функции и коллизии нужно уже читать отдельно

Answer 2 · 2022-05-11 21:07:08

это какой-то винегрет из прочитанного, для начала стоит разобраться как работает поиск в списках/массивах и что-такое бинарные деревья, а потом уже идти дальше.

Answer 3 · 2022-05-12 11:45:06

Хеш-таблица - это не массив. Хотя она может опираться на массив как на базовую структуру хранения (в случае метода открытой адресации). В классическом варианте хеш таблица - это совокупность структур данных в памяти. Массив массивов. Или массив списков (как будет угодно).

Про количество элементов - это сложный вопрос. Хеш таблица (ХТ) обычно резервирует памяти чуть больше чем надо. И экстендится когда памяти не хватает. Там для экстенда есть отдельный алгоритм. Можно считать что оверхед такой хеш-таблицы больше чем у массива. А количество элементов фактически - хранится отдельным счетчиков.

Вообще русская wiki достаточно хорошо описывает ХТ и можно начать читать с нее и далее по ссылкам.

Как работает поиск в хэш-таблицах?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт