Почему union так сильно замедляет запрос?

Question

WebDev @kirill-93

MySQL

Почему union так сильно замедляет запрос?

Решил оптимизировать запрос.
Запрос вытаскивал посты из таблицы posts по некоторым условиями и сортировал их по дате или непрочитанности. Непрочитанность - это отсутствие постов в таблице post_user.
В итоге получался примерно такой код для сортировке по дате

select * from posts where ... order by created_at desc

и такой для сортировке по непрочитанности

select * from posts 
left join post_user on post_user.post_id = posts.id and post_user.user_id = 2
where ...
order by post_user.id desc, posts.created_at desc

Второй запрос работает намного медленнее первого. Поэтому я решил отдельно выбрать все непрочитанные новости и отдельно все прочитанные. Просто склеить 2 результата не получится, потому что в запросах используется limit offset, поэтому я решил объединить 2 запроса в один с помощью union.
Получилось так:

(select 0 as is_unread, * from posts where ...)
union
(select 1 as is_unread, * from posts where ... and not exists(select * from post_user where post_id = posts.id and user_id = 2))
order by is_unread desc, created_at desc
limit 20 offset 0

Оба этих запроса по отдельности выполняются достаточно быстро и в explain все хорошо.
Но с использованием union значение поля rows увеличивается с 900 (если выполнять каждый запрос отдельно) до 200000. Дело не в сортировке, если выполнить запрос без сортировки, ничего не изменится, и даже если второй запрос в union будет полностью соответствовать первому, тоже ничего не изменится.
Почему так происходит?
И как бы вы сделали сортировку в таком случае?

Вопрос задан более трёх лет назад
1747 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Java-разработчик

9 месяцев

Далее
GB (GeekBrains)

Профессия Python-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

MySQL

Простой
Влияет ли размер индекса на скорость MySQL?
- 3 подписчика
- 09 дек.
- 339 просмотров
2

ответа
MySQL

+1 ещё

Простой
Как правильно реализовать структуру таблиц продукт и цены продуктов?
- 1 подписчик
- 20 нояб.
- 210 просмотров
2

ответа
MySQL

Простой
Почему SQL-запрос на MacOS (M2) исполняется медленнее, чем на shared-хостинге?
- 1 подписчик
- 08 нояб.
- 226 просмотров
1

ответ
MySQL

Средний
Почему после импорта базы из .sql файлов таблицу с 13Гб раздуло до 55Гб?
- 4 подписчика
- 29 окт.
- 633 просмотра
1

ответ
Python

+2 ещё

Средний
При подключении к бд MySQL через SSH из Python появляется ошибка, а через DBeaver всё чётко. В чём дело?
- 2 подписчика
- 29 сент.
- 343 просмотра
1

ответ
MySQL

Простой
MySQL JSON_OBJECT Приводит значение к строковому типу, возможно ли это как то обойти?
- 2 подписчика
- 26 сент.
- 129 просмотров
1

ответ
MySQL

+1 ещё

Простой
Как исправить ошибку «No connection could be made because the target machine actively refused it»?
- 2 подписчика
- 02 сент.
- 467 просмотров
1

ответ
MySQL

Простой
Почему у некоторых таблиц Update_time равен null?
- 1 подписчик
- 20 авг.
- 129 просмотров
2

ответа
Python

+1 ещё

Простой
Как создать параметризированный SQL запрос через pyodbc к Mysql?
- 1 подписчик
- 16 авг.
- 183 просмотра
2

ответа
Python

+1 ещё

Простой
Как сделать экранирование символов в Python для SQL запроса?
- 1 подписчик
- 16 авг.
- 205 просмотров
1

ответ
Показать ещё Загружается…

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 350 000 ₽

Программист Embedded Linux, OpenWrt

Ростовский завод электроники • Москва

от 80 000 до 120 000 ₽

Answer 1 · 2016-09-25 09:32:04

Потому что union это псевдоним для "UNION DISTINCT", т.е. сначала создается временная таблица, потом перебираются все строки для удаления дублей и потом строки сортируются. Попробуйте заменить на "UNION ALL" разница в скорости выполнения будет в разы, но не уверен что для вашего случая такая замена корректна.

Answer 2 · 2016-09-25 10:19:56

если коротко, то одним запросом выбрать все явно не прочитанные. Т.е. выбираем только те, которые присутствуют во второй таблице через RIGTH JOIN ... ON A.Key=B.Key. А другим запросом используя юнион олл, и выбираем все явно прочитанные, через конструкцию RIGTH JOIN ... WHERE A.Key IS NULL, таким образом исключая дубли и два запроса останутся быстрыми

Почему union так сильно замедляет запрос?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт