Почему так много Shared Read Blocks, если запрос под индексом?

Question

lookingfor2 @lookingfor2

PostgreSQL

Почему так много Shared Read Blocks, если запрос под индексом?

Есть такие таблицы в базе данных postgresql:

-- в таблице около 5 миллионов записей
create table raitings
(
    id              bigserial primary key,
    state           varchar(50)                                            not null,
    raiting_cause   varchar(100)             default ''::character varying not null,
    item_id         bigint                                                 not null,
    article_id      bigint not null constraint items_pk 				   primary key,
    seller_id       uuid                                                   not null,
    feedback_id     varchar(36)                                            not null,
    deleted         boolean                  default false                 not null

    ....
);

-- в таблице около 200 миллионов записей
create table items
(
    item_id         bigint                                                 not null,
    article_id      bigint not null constraint items_pk 				   primary key,

    ....
);

create index idx_items_article_id_item_id_covering
    on items (article_id) include (item_id, supplier_id);

Есть такой запрос:
Суть в том чтобы обновить нестабильный item_id по стабильному article_id.

WITH raitings_imt AS (
    SELECT rs.id, rs.item_id AS old_item_id, ims.item_id AS new_item_id
    FROM raitings rs
             JOIN items ims USING (article_id)
    WHERE (rs.state = 'active' OR rs.raiting_cause = 'price')
),
 mismatched AS (
     SELECT id, new_item_id
     FROM raitings_imt
     WHERE old_item_id <> item_id  -- Фильтрация уже по подготовленным данным
     LIMIT 10000
 )
select * from mismatched;

Вот план выполнения:
1) Почему так много Shared Read Blocks(как следствие I/O Read Time": 104076.195), ведь Index Only Scan, из-за условаия (rr.item_id <> ims.item_id но как по другому)?
Или другие запрос вытисняют информацию из индексов из кеша ?

"Node Type": "Index Only Scan",
  "Parent Relationship": "Inner",
  "Parallel Aware": false,
  "Async Capable": false,
  "Scan Direction": "Forward",
  "Index Name": "idx_items_article_id_item_id_covering",
  "Relation Name": "items",
  "Schema": "public",
  "Alias": "ims",
  "Startup Cost": 0.57,
  "Total Cost": 2.10,
  "Plan Rows": 1,
  "Plan Width": 16,
  "Actual Startup Time": 0.075,
  "Actual Total Time": 0.075,
  "Actual Rows": 0,
  "Actual Loops": 1575285,
  "Output": ["si.article_id", "si.item_id", "si.supplier_id"],
  "Index Cond": "(ims.article_id = rr.article_id)",
  "Rows Removed by Index Recheck": 0,
  "Filter": "(rr.item_id <> ims.item_id)",
  "Rows Removed by Filter": 1,
  "Heap Fetches": 1023819,
  "Shared Hit Blocks": 7512544,
  "Shared Read Blocks": 1338914,
  "Shared Dirtied Blocks": 9499,
  "Shared Written Blocks": 18210,
  "Local Hit Blocks": 0,
  "Local Read Blocks": 0,
  "Local Dirtied Blocks": 0,
  "Local Written Blocks": 0,
  "Temp Read Blocks": 0,
  "Temp Written Blocks": 0,
  "I/O Read Time": 104076.195,
  "I/O Write Time": 404.416,

2) Как быть в таких случаях?
Чтобы обновить эти item_id в raitings из items, мне приходится прочесывать все таблицу raitings.
Может надо как то батчами доставать из raitings, а потом идти в items?

Вопрос задан 15 часов назад
571 просмотр

4 комментария

Подписаться 2 Средний 4 комментария

Everything_is_bad @Everything_is_bad

наверно стоит показывать нормальный explain?

Написано 14 часов назад
Владимир Юрченков @EPIDEMIASH

По батчам не хочется?

Написано 14 часов назад
lookingfor2 @lookingfor2 Автор вопроса

Everything_is_bad, там тоже самое будет, какая разница или ты имеешь ввиду прям полный ?

Написано 14 часов назад
lookingfor2 @lookingfor2 Автор вопроса

Владимир Юрченков, наверное, это единственный вариант
join идет как NESTED LOOP, что вроде как правильно.
данные достаются по индексу, видимо из-за того, что гоняеется большой объем данных, вымывается кеш
Наверное, надо кусками брать из первой таблицы и ходить сверять во вторую, просто это не такие большие объемы, а транзакции зависает на 10 минут, алерты летят из за io и тд

Написано 14 часов назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+1 ещё

Простой
Как получить id добавленной записи PHP PDO PGSQL?
- 1 подписчик
- 01 июл.
- 161 просмотр
1

ответ
PostgreSQL

Средний
В чем может быть причина сброса значения sequence в БД?
- 1 подписчик
- 23 июн.
- 128 просмотров
1

ответ
PostgreSQL

Простой
Как обнаружить все битые таблицы?
- 1 подписчик
- 12 июн.
- 167 просмотров
1

ответ
Linux

+3 ещё

Простой
Вылеты 1с без ошибок на дебиане, как исправить?
- 1 подписчик
- 10 июн.
- 229 просмотров
2

ответа
PostgreSQL

Простой
Нормально ли дублирование строк в IN?
- 1 подписчик
- 19 мая
- 225 просмотров
3

ответа
PostgreSQL

Простой
Как отработать EXTRACT(epoch FROM MAX(null))?
- 1 подписчик
- 15 мая
- 71 просмотр
1

ответ
PostgreSQL

Простой
Как корректно завершить процесс postgresql?
- 1 подписчик
- 06 мая
- 186 просмотров
1

ответ
PostgreSQL

+1 ещё

Простой
Почему не запускается PostgreSQL в open server?
- 2 подписчика
- 26 апр.
- 182 просмотра
0

ответов
PostgreSQL

Средний
Как временно повышать права пользователю?
- 2 подписчика
- 23 апр.
- 151 просмотр
1

ответ
Показать ещё Загружается…

DBA (PostgreSQL)

СберТех • Москва

До 420 000 ₽

Инженер баз данных

Сбер • Санкт-Петербург

До 100 000 ₽

QA-инженер/тестировщик

DimaTech Ltd • Краснодар

от 70 000 ₽

наверно стоит показывать нормальный explain?
Everything_is_bad, там тоже самое будет, какая разница или ты имеешь ввиду прям полный ?
Владимир Юрченков, наверное, это единственный вариант
join идет как NESTED LOOP, что вроде как правильно.
данные достаются по индексу, видимо из-за того, что гоняеется большой объем данных, вымывается кеш
Наверное, надо кусками брать из первой таблицы и ходить сверять во вторую, просто это не такие большие объемы, а транзакции зависает на 10 минут, алерты летят из за io и тд

Почему так много Shared Read Blocks, если запрос под индексом?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт