Как правильно сделать фильтрацию по числу JSONB в PostgreSQL используя индекс?

Question

danforth @danforth

PostgreSQL

Как правильно сделать фильтрацию по числу JSONB в PostgreSQL используя индекс?

Есть примерно такая структура: sqlfiddle.com/#!17/6cea9/1

Всего около 2 млн. товаров, все запросы с подмножествами выполняются быстро, в пределах 20 мс. максимум, а вот запрос с использованием числового сравнения выполняется долго.
1. Какой нужно индекс повесить и как нужно писать запрос, чтобы этот индекс использовался? Пробовал обычный (не gin) индекс, а также btree. Но если писать (features->>'capacity')::int < 300, то запрос все равно отрабатывает очень долго (около 300-500 мс.).

2. Есть ли какой-то универсальный способ выборки со сравнением по числу, чтобы не индексировать каждое поле JSON объекта? Сегодня там capacity, завтра color в десятичном формате, каждый раз вешать индекс при добавлении числовой характеристики не очень хочется.

upd.: при запросе

EXPLAIN (ANALYSE, BUFFERS) SELECT id, name, price, features FROM product
WHERE (features->>'color')::int > 1000000
ORDER BY price ASC
LIMIT 25

получаю:

EXPLAIN

Limit  (cost=0.43..10.56 rows=25 width=161) (actual time=0.018..0.093 rows=25 loops=1)
  Buffers: shared hit=51
  ->  Index Scan Backward using product_price_index on product  (cost=0.43..317546.33 rows=783959 width=161) (actual time=0.016..0.071 rows=25 loops=1)
        Filter: (((features ->> 'color'::text))::integer > 1000000)
        Rows Removed by Filter: 23
        Buffers: shared hit=51
Planning time: 0.068 ms
Execution time: 0.120 ms

Т.е. индекс используется, хотя в данном случае index срабатывает на price столбце? Тогда почему запрос отрабатывает быстро? Как заставить работать индекс, если условий WHERE несколько?

Вопрос задан более трёх лет назад
431 просмотр

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Решения вопроса 1

2 комментария

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PostgreSQL

+1 ещё

Средний
Sqlx + pgx — выборка по набору пар значений столбцов без танцев с бубном?
- 1 подписчик
- 07 июл.
- 68 просмотров
1

ответ
Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 350 просмотров
2

ответа
PostgreSQL

Простой
Запрос с 1 условием для выбора источника данных?
- 1 подписчик
- 08 апр.
- 169 просмотров
2

ответа
PostgreSQL

+1 ещё

Средний
Как в PostgreSQL организовать синхронизацию данных между геораспределенными копиями?
- 1 подписчик
- 25 мар.
- 331 просмотр
3

ответа
PostgreSQL

Простой
Как оптимизировать запрос с фильтром?
- 2 подписчика
- 13 мар.
- 341 просмотр
1

ответ
PostgreSQL

+1 ещё

Простой
Как работает Housekeeper в Zabbix?
- 1 подписчик
- 07 мар.
- 345 просмотров
3

ответа
PostgreSQL

+3 ещё

Средний
Как обновить PostgreSQL 1С с 12 до 18 версии на windows?
- 3 подписчика
- 11 февр.
- 790 просмотров
2

ответа
PostgreSQL

Простой
Как увидеть все запросы к postgres?
- 1 подписчик
- 15 янв.
- 315 просмотров
1

ответ
PostgreSQL

+1 ещё

Средний
Почему не запускается контейнер DB в Docker?
- 1 подписчик
- 08 янв.
- 385 просмотров
2

ответа
Linux

+4 ещё

Средний
Runtipi: как корректно переключить встроенный Postgres-контейнер на внешний Postgres (.env / runtipi-cli / docker compose)?
- 1 подписчик
- 26 дек. 2025
- 210 просмотров
0

ответов
Показать ещё Загружается…

Answer 1 · 2017-12-11 22:03:19

Индекс возможно повесить функциональный:

create index on tablename using btree(((features ->> 'capacity'::text)::integer));

Соответственно предикат по этому же самому выражению получит возможность использовать этот индекс.

Больше возможностей внятно индексировать jsonb для запросов на числовые диапазоны мне как-то не вспоминается. Сортировку по полю-то только btree и умеет из всех актуальных access method.

Т.е. индекс используется, хотя в данном случае index срабатывает на price столбце? Тогда почему запрос отрабатывает быстро?

Да, индекс используется - индекс по price. Потому что вы по нему сортируете. И планировщик опираясь на свою статистику надеется, что сможет быстро найти 25 строк читая строки в порядке требуемой сортировки по индексу и по пути проверять выкидывать неподходящие.

Как правильно сделать фильтрацию по числу JSONB в PostgreSQL используя индекс?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт