Как происходит разрешение коллизий в хэшах PostgreSQL?

Question

beduin01 @beduin01

PostgreSQL

Как происходит разрешение коллизий в хэшах PostgreSQL?

Если тип индекса - hash, то что происходит если возникает коллизия? Как БД обрабатывает эту ситуацию?

Вопрос задан более трёх лет назад
462 просмотра

Комментировать

Подписаться 2 Простой Комментировать

Помогут разобраться в теме Все курсы

Hi-TECH Academy

Администрирование PostgreSQL 16. Базовый курс

3 дня

Далее
OTUS

PostgreSQL. Advanced

4 месяца

Далее
Учебный центр IBS

QPT PostgreSQL 16. Оптимизация запросов

1 неделя

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PostgreSQL

Простой
Postgres выдаёт unknown для типа char — в чём ошибка?
- 2 подписчика
- 11 часов назад
- 144 просмотра
1

ответ
PostgreSQL

Простой
Почему не рабоатет npx prisma generate?
- 1 подписчик
- 02 дек.
- 233 просмотра
2

ответа
Windows

+1 ещё

Средний
Работа PostgreSQL на процессорах с гетерогенной архитектурой под Windows?
- 2 подписчика
- 29 нояб.
- 435 просмотров
4

ответа
Windows

+1 ещё

Средний
Почему не создается логическая репликация на Windows 10 и падает воркер?
- 5 подписчиков
- 17 нояб.
- 360 просмотров
1

ответ
PostgreSQL

Простой
Как сделать поиск определенного значение в строке отобранной SELECT * FROM?
- 1 подписчик
- 13 нояб.
- 251 просмотр
2

ответа
SQL

+2 ещё

Средний
Как правильно обрабатывать концевые пробелы в SQL Server и PostgreSQL?
- 2 подписчика
- 11 нояб.
- 231 просмотр
1

ответ
PostgreSQL

+1 ещё

Простой
Как вести историю работы с записями во всех таблицах для всех пользователей?
- 2 подписчика
- 08 нояб.
- 264 просмотра
2

ответа
PostgreSQL

Средний
Как получить данные и обновить записи в таблицах-источниках?
- 1 подписчик
- 05 нояб.
- 115 просмотров
1

ответ
PostgreSQL

+1 ещё

Средний
Как установить Postgres в Ubuntu от 1с (c ИТС)?
- 1 подписчик
- 22 сент.
- 233 просмотра
2

ответа
PostgreSQL

Простой
Есть ли способ логировать работу процедуры?
- 1 подписчик
- 12 сент.
- 156 просмотров
2

ответа
Показать ещё Загружается…

DWH Analyst

Анвио Парк

от 200 000 до 300 000 ₽

Golang Developer

SMALL

от 280 000 до 350 000 ₽

Golang Developer

SMALL

До 370 000 ₽

Answer 1 · 2021-05-07 20:06:23

Хеш индекс для базы данных не требует уникальности хеша (т.е. это может быть 2-байтовый хеш с 65536 количеством значений для базы в миллион строк на каждое значение будет много коллизий), это механизм нужен больше чтобы поделить трудоемкость сканирования всей таблицы на возможное количество значений хеша, т.е. в индексе для записей с равным хешем запрос пройдет по всем таким (если у хеша коллизия для id равным 1 и 10 то в таблице индекса у этого хеша будет 2 записи и при поиске нужной обе они будут просканированы).

тут или тут чуток про это есть

Answer 2 · 2021-05-07 19:00:16

никак, а какие там коллизии? запрос - хеш - возврат по хешу, ты сам жертвуешь точностью в угоду скорости

где точность - там B-Tree

Answer 3 · 2021-05-07 22:47:12

При записи данных tuple id просто сохраняются как есть в индексе. Неважно, это другая версия строки или неудачно попали на коллизию хеш-функции с другими данными
При чтении hash индекс сообщает executor'у, что возвращаемые tuple id необходимо перепроверить по реальным данным (проставляет xs_recheck для indexscan либо выбирается bitmap scan с recheck condition) - механизм lossy поиска.

Как происходит разрешение коллизий в хэшах PostgreSQL?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт