Как написать запрос, который будет считывать меньше данных?

Question

mak_arti @mak_arti

Оптимизация SQL-запросов

Как написать запрос, который будет считывать меньше данных?

Таблица Crosses (ArticleId, CrossArticleId)

Строки ArticleId = 1 во временную таблицу @tempFlatCrosses (ArticleId, CrossArticleId)

Далее нужно сделать повторную выборку

select с.CrossArticleId from Crosses c
inner join @tempFlatCrosses f on c.ArticleId = f.CrossArticleId

То мы получим много дубликатов, будет считывать много лишних строк из таблицы Crosses.

Я понимаю что можно обойтись оператором Distinct, но все же хотелось чтобы запрос сканировал меньше данных из таблицы.

Вопрос задан более двух лет назад
98 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

mak_arti @mak_arti Автор вопроса
SELECT c.CrossArticleId FROM Crosses c WHERE EXISTS ( SELECT 1 FROM @tempFlatCrosses f WHERE c.ArticleId = f.CrossArticleId );

Так мы тоже получим дубли( Просто не знаем как подсказать серверу, что такой CrossArticleId один раз уже учли
Написано более двух лет назад

3 комментария

mak_arti @mak_arti Автор вопроса

Спасибо, мне решение понятна. Нужные индексы есть. Если в "inner join Crosses" будут 2000 записей, удовлетворяющие условии, то уже будет много логический чтений, более 200 000 строк. А в итоге получаю 3000 записей уникальных. Наверное задал тупой вопрос. Идеи нет

Написано более двух лет назад
MVV @mvv-rus

Сделайте запрос и посмотрите его план выполнения. Возможно, идеи появятся. Или вы уже делали, но просто про это не рассказали?

Написано более двух лет назад
mak_arti @mak_arti Автор вопроса

MVV, Делал, все нужные индексы есть, все seek'ается.
Попробую на примере:
Есть две кросс-связи 1- 2, 1 - 3. Собственно у 2 есть 4, и у 3 есть 4. В этом случае будет два логических чтений 2-4, 3-4. Я просто подумал есть ли возможность сделать если прочитали 2-4, то остальных строк игнорировали на чтение, у которых есть связь к 4. В данном примере игнорировать бы чтение строки 3-4

Написано более двух лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

1С

+2 ещё

Простой
Как искать по ссылке в запросе 1с?
- 1 подписчик
- более года назад
- 217 просмотров
3

ответа
PostgreSQL

+1 ещё

Простой
Как определить тяжелые запросы?
- 2 подписчика
- более двух лет назад
- 495 просмотров
2

ответа
MySQL

+1 ещё

Простой
Как можно ускорить выполнение SQL запроса?
- 4 подписчика
- более двух лет назад
- 2368 просмотров
7

ответов
Oracle

+1 ещё

Сложный
Хаотичное ухудшение производительности запроса — как определить причину?
- 3 подписчика
- более двух лет назад
- 187 просмотров
2

ответа
Оптимизация SQL-запросов

Простой
Какое должно быть время выполнение, чтобы его оптимизировать?
- 1 подписчик
- более трёх лет назад
- 75 просмотров
2

ответа
MySQL

+1 ещё

Простой
Как можно оптимизировать запрос?
- 1 подписчик
- более трёх лет назад
- 171 просмотр
1

ответ
Оптимизация SQL-запросов

Простой
Как оптимизироваться SQL запросы?
- 1 подписчик
- более трёх лет назад
- 115 просмотров
2

ответа
MySQL

+1 ещё

Простой
Как оптимизировать высокий lock_time в slow_query_log на insert или update?
- 1 подписчик
- более трёх лет назад
- 137 просмотров
1

ответ
MySQL

+1 ещё

Средний
Как оптимизировать NOT IN (SELECT)?
- 4 подписчика
- более трёх лет назад
- 332 просмотра
2

ответа
Показать ещё Загружается…

Answer 1 · 2024-02-23 14:06:46

Запрос можно оптимизировать тремя способами:
1) Использовать индексы по полям ArticleId и CrossArticleId в таблице Crosses;
2) Использовать группировку по полю CrossArticleId во временной таблице @tempFlatCrosses, чтобы избежать дубликатов при соединении с таблицей Crosses;
3) Использовать оператор EXISTS, вместо INNER JOIN, чтобы проверить наличие соответствующих записей в таблице Crosses, без возврата лишних данных.

-- Создаем индексы по полям ArticleId и CrossArticleId в таблице Crosses
CREATE INDEX idx_crosses_articleid ON Crosses (ArticleId);
CREATE INDEX idx_crosses_crossarticleid ON Crosses (CrossArticleId);

-- Достаем все строки, у которых ArticleId = 1 и группируем по CrossArticleId
SELECT ArticleId, CrossArticleId
INTO @tempFlatCrosses
FROM Crosses
WHERE ArticleId = 1
GROUP BY CrossArticleId;

-- Делаем выборку из таблицы Crosses, используя оператор EXISTS
SELECT c.ArticleId
FROM Crosses c
WHERE EXISTS (
  SELECT 1
  FROM @tempFlatCrosses f
  WHERE c.CrossArticleId = f.CrossArticleId
);

Answer 2 · 2024-02-23 15:54:51

Здесь временная таблица не нужна: все можно сделать одним запросом:

select distinct c.CrossArticleId from Crosses c inner join Crosses f 
on c.ArticleId=f.CrossArticleId where f.ArticleId=1

А чтобы избежать сканирования всей таблицы, создайте (если их ещё нет)индексы по полям Crosses.ArticleId и Crosses.CrossArticleId - например, как в предыдущем ответе написано. И пусть работает и оптимизирует запрос планировщик: он кремниевый, и у него есть статистика по индексам. Если вдруг сомневаетесь в планировщике - посмотрите план выполнения запроса.
Индексы - это ключевой момент: без них серверу придется сканировать всю таблицу.

Как написать запрос, который будет считывать меньше данных?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт