Почему DISTINCT ON так медленно выполняется?

Question

un1t @un1t

PostgreSQL

Почему DISTINCT ON так медленно выполняется?

Табличка 931 263 записей.
Запрос

select distinct on (o.group_id) o.id group_id from offers o limit 10;

выполняется больше чем пол секунды. Причем есть индекс по group_id.

Структура таблицы:

# \d+ offers;
                                                        Table "public.offers"
    Column    |          Type           |                      Modifiers                      | Storage  | Stats target | Description 
--------------+-------------------------+-----------------------------------------------------+----------+--------------+-------------
 id           | integer                 | not null default nextval('offers_id_seq'::regclass) | plain    |              | 
 name         | character varying(400)  | not null                                            | extended |              | 
 group_id     | integer                 |                                                     | plain    |              | 
Indexes:
    "offers_pkey" PRIMARY KEY, btree (id)
    "offers_group_id_e0c51f8a" btree (group_id)

EXPLAIN ANALYZE

# explain analyze select distinct on (o.group_id) o.id group_id from offers o limit 10;
-[ RECORD 1 ]---------------------------------------------------------------------------------------------------------------------------------------------------------------
QUERY PLAN | Limit  (cost=0.42..59572.55 rows=10 width=8) (actual time=0.089..566.879 rows=1 loops=1)
-[ RECORD 2 ]---------------------------------------------------------------------------------------------------------------------------------------------------------------
QUERY PLAN |   ->  Unique  (cost=0.42..1191442.91 rows=200 width=8) (actual time=0.087..566.876 rows=1 loops=1)
-[ RECORD 3 ]---------------------------------------------------------------------------------------------------------------------------------------------------------------
QUERY PLAN |         ->  Index Scan using offers_group_id_e0c51f8a on offers o  (cost=0.42..1189221.41 rows=888599 width=8) (actual time=0.085..529.775 rows=931263 loops=1)
-[ RECORD 4 ]---------------------------------------------------------------------------------------------------------------------------------------------------------------
QUERY PLAN | Planning time: 0.137 ms
-[ RECORD 5 ]---------------------------------------------------------------------------------------------------------------------------------------------------------------
QUERY PLAN | Execution time: 566.925 ms

Как можно ускорить?

Вопрос задан более трёх лет назад
879 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

+2 ещё

Простой
Postgres Docker: Странные временные файлы в папке overlay2?
- 1 подписчик
- 23 июл.
- 191 просмотр
0

ответов
PostgreSQL

Простой
Почему не удается авторизоваться под юзером postgres?
- 1 подписчик
- 22 июл.
- 99 просмотров
3

ответа
PostgreSQL

Простой
Как подружить анализатор PostgreSQL со своим составным типом?
- 2 подписчика
- 19 июл.
- 1259 просмотров
1

ответ
PostgreSQL

Простой
Как отсортировать дни рождения от ближайшего?
- 1 подписчик
- 16 июл.
- 137 просмотров
1

ответ
PostgreSQL

Простой
Как понять почему размер БД вырос на 30%?
- 5 подписчиков
- 14 июл.
- 3366 просмотров
2

ответа
PHP

+1 ещё

Простой
Как получить id добавленной записи PHP PDO PGSQL?
- 1 подписчик
- 01 июл.
- 229 просмотров
1

ответ
PostgreSQL

Средний
В чем может быть причина сброса значения sequence в БД?
- 1 подписчик
- 23 июн.
- 153 просмотра
1

ответ
PostgreSQL

Простой
Как обнаружить все битые таблицы?
- 1 подписчик
- 12 июн.
- 186 просмотров
1

ответ
Linux

+3 ещё

Простой
Вылеты 1с без ошибок на дебиане, как исправить?
- 1 подписчик
- 10 июн.
- 265 просмотров
2

ответа
PostgreSQL

Простой
Нормально ли дублирование строк в IN?
- 1 подписчик
- 19 мая
- 237 просмотров
3

ответа
Показать ещё Загружается…

Администратор баз данных PostgreSQL

Bell Integrator • Москва

Администратор прикладного ПО (PostgreSQL)

Гринатом

Администратор баз данных (PostgreSQL)

Bell Integrator • Москва

Answer 1 · 2017-04-12 16:57:06

Ускорить можно вот такой милой рекурсивной cte'шкой: https://wiki.postgresql.org/wiki/Loose_indexscan
Нативно pg пока не умеет loose indexscan. Поэтому distinct читает все элементы дерева вместо поиска следующего большего элемента.

Answer 2 · 2017-04-12 17:34:42

Сергей Горностаев @sergey-gornostaev Куратор тега PostgreSQL

Седой и строгий

Использовать группировку по требующему уникальности полю

select min(id), group_id from offers group by group_id;

В моём случае это примерно в 6.5 раз быстрее.

Ответ написан более трёх лет назад

1 комментарий

Почему DISTINCT ON так медленно выполняется?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт