Какая особенность MySQL вызывает такую разницу в обработке запросов?

Question

Павел Китьян @bookworm

Какая особенность MySQL вызывает такую разницу в обработке запросов?

Приветствую. Предположим, что я хочу из таблицы messages получить данные сообщения, которое на сутки (или более) старше текущего (для текущего у меня есть его id).

Пробный запрос:

SELECT * FROM messages WHERE id = 
  (SELECT MAX(id) FROM messages WHERE 
     id < 40000 AND dt <= DATE_SUB('2016-04-18 23:23:23', INTERVAL 24 HOUR));

Функционирует быстро. Есть индекс на поле dt, хотя не уверен, что он используется в DATE_SUB()
А вот при использовании переменной - намертво глохнет:

SET @myid = 40000;
  (SELECT MAX(id) FROM messages WHERE 
     id < @myid AND dt <= DATE_SUB('2016-04-18 23:23:23', INTERVAL 24 HOUR));

Почему?! В чем особенность запроса?
В рабочем коде я использую хранимую процедуру, в которую передаётся myid. И, опять-таки, работает быстро.

DROP PROCEDURE IF EXISTS `TEST`;
DELIMITER $$
CREATE DEFINER=`root`@`localhost` PROCEDURE `TEST`(IN myid INT)
BEGIN
  (SELECT MAX(id) FROM messages WHERE 
     id < myid AND dt <= DATE_SUB('2016-04-18 23:23:23', INTERVAL 24 HOUR));
END$$
DELIMITER ;
CALL TEST(40000);

Вопрос задан более трёх лет назад
396 просмотров

1 комментарий

Подписаться 4 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Java-разработчик

9 месяцев

Далее
GB (GeekBrains)

Профессия Python-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

3 комментария

Павел Китьян @bookworm Автор вопроса

Знаете, смотрел немного, хотя и плаваю в понимании результатов EXPLAIN. Однако...
1) Если давать только вложенный запрос, без внешнего, то результаты одинаковы, как и план выполнения.
2) Если же завернуть как в условиях вопроса, то EXPLAIN у них очень разный. Там где переменная - появляется полное сканирование во внешнем запросе. Но главное - запрос виснет совсем, а не просто долго выполняется. Статус запроса на сервере - Sending data.
3) Опять-таки, если убрать условие по dt, то оба запроса выполняются нормально.

Честно говоря, непонятно отличие переменной заданной через SET и переданной в процедуру с точки зрения возможности её изменения. Ну пусть это не дает оптимизировать план выполнения или кэшировать запрос. Но неадекватно вешать? Таблица-то небольшая, не более 50 тыс. строк.

Написано более трёх лет назад
Павел Китьян @bookworm Автор вопроса

Да, и, если не затруднит, поясните сказанное по индексу на колонке dt. Имелось ввиду, что надо использовать DESC вместо ASC? Разве это влияет в случае, если индекс на одной колонке? Я не делал индекс на двух колонках id и dt. Там бы это имело наверное смысл.

Или обратный индекс - это вообще что-то другое?

Написано более трёх лет назад
Melkij @Melkij

> непонятно отличие переменной заданной через SET и переданной в процедуру с точки зрения возможности её изменения
Я видимо спутал с каким-то другим диалектом, думал, что IN параметру в принципе ничего другого присвоить уже нельзя. Оказывается, можно.
Но переменные - всё-таки другая штука. Во время выполнения запроса переменную изменить легко, а вот параметр - уже нет, с ходу вообще не получилось найти способа. У них даже разный синтаксис.

По поводу индекса по dt - чтобы получить данные по индексу, надо прочитать индекс, доставать из него указатели на данные (а в случае Innodb это значения первичного ключа), потом доставать данные. Это всё дофига случайного чтения.
Если относительно общего массива данных вам нужно получить небольшое число строк - то по индексу работать всё-таки гораздо быстрее.
А вот если по индексу выбирается много данных относительно общего массива - часто выгоднее от использования индекса отказаться и читать напрямую таблицу простым и последовательным чтением seq scan. Некоторые данные прочитаем напрасно, но последовательное чтение на пару порядков быстрее случайного.
Судя по названию таблиц, у вас большая часть данных будет как раз в куске индекса до указанной даты.

Возвращаясь к теме - да, всего на 50 тыс записей виснуть не должен.
Посмотрите как mysql переписывает запрос: после explain сделайте show warnings - будет примерный вид переписанного оптимизатором запроса. Может будет понятнее, что он решает делать странно.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Базы данных

+1 ещё

Простой
Где взять актуальный список городов в странах с таймзонами на русском?
- 1 подписчик
- 21 дек.
- 74 просмотра
1

ответ
MySQL

Простой
Влияет ли размер индекса на скорость MySQL?
- 3 подписчика
- 09 дек.
- 344 просмотра
2

ответа
MySQL

+1 ещё

Простой
Как правильно реализовать структуру таблиц продукт и цены продуктов?
- 1 подписчик
- 20 нояб.
- 210 просмотров
2

ответа
Базы данных

Простой
Как настроить десятки связей и не потеряться в модели (prisma orm)?
- 1 подписчик
- 10 нояб.
- 86 просмотров
0

ответов
PostgreSQL

+1 ещё

Простой
Как вести историю работы с записями во всех таблицах для всех пользователей?
- 2 подписчика
- 08 нояб.
- 266 просмотров
2

ответа
MySQL

Простой
Почему SQL-запрос на MacOS (M2) исполняется медленнее, чем на shared-хостинге?
- 1 подписчик
- 08 нояб.
- 226 просмотров
1

ответ
Базы данных

+1 ещё

Средний
Какие методы синхронизации SQL Express и MSSQL Server порекомендуете?
- 3 подписчика
- 03 нояб.
- 199 просмотров
2

ответа
MySQL

Средний
Почему после импорта базы из .sql файлов таблицу с 13Гб раздуло до 55Гб?
- 4 подписчика
- 29 окт.
- 633 просмотра
1

ответ
Базы данных

+1 ещё

Простой
Как правильно реализовать обновление порядка (поле order) в бд?
- 1 подписчик
- 19 окт.
- 206 просмотров
2

ответа
SQL

+1 ещё

Простой
Как сделать уменьшение склада в СУБД безопасными правильным?
- 2 подписчика
- 14 окт.
- 256 просмотров
4

ответа
Показать ещё Загружается…

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

Веб-разработчик (PHP) в продукт из сферы FinTech

ITWORK AGENCY • Москва

До 500 000 ₽

Программист Embedded Linux, OpenWrt

Ростовский завод электроники • Москва

от 80 000 до 120 000 ₽

Answer 1 · 2016-04-21 10:55:57

Посмотрите в explain, что планировщик думает по этим запросам. Есть большое подозрение, что хранимка и константный запрос идут по индексу по id, запрос с переменной - как-то иначе.

Одна очевидная грабля:
Значение переменной может изменяться во время выполнения запроса.
Константное значение в запросе и аргумент хранимки - не могут.
Соответственно моё предположение: глупый оптимизатор не смотрит, что в запросе переменная никак не изменяется, значит не может просто взять индекс по id и надо делать что-то другое. Скорей всего seq scan - судя по названию таблицы, данных подпадающих под условие dt <= дата куда больше, чем данных под него не попадающих. Для хорошей работы по индексу надо обратное свойство.

Какая особенность MySQL вызывает такую разницу в обработке запросов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт