Как ускорить запрос с условием WHERE NOT IN?

Question

Андрей Стрелков @strelkov_av

MySQL

Как ускорить запрос с условием WHERE NOT IN?

Добрый день, не могу понять, почему запрос долго выполняется,
имеется таблица в 10 000 записей, следующего вида

id ; computer_name ; hash
1 ; a ; 11
2 ; b ; 22
3 ; b ; 22
4 ; c ; 33
5 ; c ; 34

Задача такая, что из таблицы нужно удалить дубликатные данные, причём дубликаты нужно определять по полям computer_name и хэш вместе

т.е. из примера выше дубликатом являются строки 2 и 3 т.к. у них одинаковые значения обоих полей (computer_name и hash)
а строки 4 и 5 не являются дубликатом, т.к. их hash разный
Причём после удаления нужно оставить только тут строку из группы дубликатов, чей ID максимальный, другими словами в результате нужно получить

1 ; a ; 11
3 ; b ; 22
4 ; c ; 33
5 ; c ; 34

Написал такой запрос:

DELETE FROM table
   WHERE id NOT IN (SELECT MAX(id)
                      FROM table
                     GROUP BY computer_name, hash);

И проблема в том, что на моём примере, таблица содержит 10 000 записей, при это пока дубликатов нет, т.е. все строки уникальны, так вот запрос выполняется 3 минуты, и в результате говорит что ничего не удалено, и это правильно, т.к. нет дубликатов, проблема в том, почем он 3 минуты выполняется :///

Если я делаю запрос

SELECT * FROM table
   WHERE id NOT IN (SELECT MAX(id)
                      FROM table
                     GROUP BY computer_name, hash);

то моментально выполняется :/ Поле id - первичный ключ соответственно с индексом

Вопрос задан более трёх лет назад
136 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Java-разработчик

9 месяцев

Далее
GB (GeekBrains)

Профессия Python-разработчик

10 месяцев

Далее

Решения вопроса 1

2 комментария

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

MySQL

Простой
Влияет ли размер индекса на скорость MySQL?
- 3 подписчика
- 09 дек.
- 342 просмотра
2

ответа
MySQL

+1 ещё

Простой
Как правильно реализовать структуру таблиц продукт и цены продуктов?
- 1 подписчик
- 20 нояб.
- 210 просмотров
2

ответа
MySQL

Простой
Почему SQL-запрос на MacOS (M2) исполняется медленнее, чем на shared-хостинге?
- 1 подписчик
- 08 нояб.
- 226 просмотров
1

ответ
MySQL

Средний
Почему после импорта базы из .sql файлов таблицу с 13Гб раздуло до 55Гб?
- 4 подписчика
- 29 окт.
- 633 просмотра
1

ответ
Python

+2 ещё

Средний
При подключении к бд MySQL через SSH из Python появляется ошибка, а через DBeaver всё чётко. В чём дело?
- 2 подписчика
- 29 сент.
- 343 просмотра
1

ответ
MySQL

Простой
MySQL JSON_OBJECT Приводит значение к строковому типу, возможно ли это как то обойти?
- 2 подписчика
- 26 сент.
- 129 просмотров
1

ответ
MySQL

+1 ещё

Простой
Как исправить ошибку «No connection could be made because the target machine actively refused it»?
- 2 подписчика
- 02 сент.
- 467 просмотров
1

ответ
MySQL

Простой
Почему у некоторых таблиц Update_time равен null?
- 1 подписчик
- 20 авг.
- 129 просмотров
2

ответа
Python

+1 ещё

Простой
Как создать параметризированный SQL запрос через pyodbc к Mysql?
- 1 подписчик
- 16 авг.
- 183 просмотра
2

ответа
Python

+1 ещё

Простой
Как сделать экранирование символов в Python для SQL запроса?
- 1 подписчик
- 16 авг.
- 205 просмотров
1

ответ
Показать ещё Загружается…

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

Программист Embedded Linux, OpenWrt

Ростовский завод электроники • Москва

от 80 000 до 120 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 350 000 ₽

Answer 1 · 2020-05-28 16:15:10

NOT IN очень медленный для такой задачи. Попробуйте заменить его на NOT EXISTS

или

SELECT * FROM table t1
LEFT JOIN (SELECT MAX(id) id
                      FROM table
                     GROUP BY computer_name, hash) t2 
ON t1.id = t2.id
WHERE t2.id IS NULL

Как ускорить запрос с условием WHERE NOT IN?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт