Как оптимизировать COUNT(*)?

Question

Евгений Обыкновенный @evgeniy8086

Как оптимизировать COUNT(*)?

Планируется очень большая таблица с текстовым полем. Нужно часто узнавать, имеется ли в ней больше 10 строк, удовлетворяющих сложному полнотекстовому условию.

Если делать запрос

SELECT COUNT(*) AS num_rows FROM my_table WHERE [проверяемое условие];

то будут искаться и подсчитываться все строки, удовлетворяющие условию.

Можно ли как-то оптимизировать эту задачу? Добавление в этот запрос LIMIT ничего не дает. Все равно считает общее количество подходящих строк.

Есть мысль делать так:

SELECT COUNT(*) AS num_rows 
FROM ( SELECT `id` FROM my_table WHERE [проверяемое условие] LIMIT 11 ) AS good_rows;

Будет ли от этого оптимизация или будет еще хуже?

Вопрос задан более трёх лет назад
924 просмотра

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Python-разработчик

10 месяцев

Далее
Академия Eduson

Python-разработчик

9 месяцев

Далее
Merion Academy

Базы данных с нуля

2 месяца

Далее

Решения вопроса 2

Комментировать

Пригласить эксперта

Ответы на вопрос 2

Комментировать

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

MySQL

+1 ещё

Простой
Как правильно реализовать структуру таблиц продукт и цены продуктов?
- 1 подписчик
- 20 нояб.
- 185 просмотров
2

ответа
MySQL

Простой
Почему SQL-запрос на MacOS (M2) исполняется медленнее, чем на shared-хостинге?
- 1 подписчик
- 08 нояб.
- 211 просмотров
1

ответ
MySQL

Средний
Почему после импорта базы из .sql файлов таблицу с 13Гб раздуло до 55Гб?
- 4 подписчика
- 29 окт.
- 610 просмотров
1

ответ
Python

+2 ещё

Средний
При подключении к бд MySQL через SSH из Python появляется ошибка, а через DBeaver всё чётко. В чём дело?
- 2 подписчика
- 29 сент.
- 337 просмотров
1

ответ
MySQL

Простой
MySQL JSON_OBJECT Приводит значение к строковому типу, возможно ли это как то обойти?
- 2 подписчика
- 26 сент.
- 128 просмотров
1

ответ
MySQL

+1 ещё

Простой
Как исправить ошибку «No connection could be made because the target machine actively refused it»?
- 2 подписчика
- 02 сент.
- 368 просмотров
1

ответ
MySQL

Простой
Почему у некоторых таблиц Update_time равен null?
- 1 подписчик
- 20 авг.
- 127 просмотров
2

ответа
Python

+1 ещё

Простой
Как создать параметризированный SQL запрос через pyodbc к Mysql?
- 1 подписчик
- 16 авг.
- 180 просмотров
2

ответа
Python

+1 ещё

Простой
Как сделать экранирование символов в Python для SQL запроса?
- 1 подписчик
- 16 авг.
- 202 просмотра
1

ответ
MySQL

Простой
Как свзять столбцы по внешнему ключу?
- 1 подписчик
- 06 авг.
- 134 просмотра
1

ответ
Показать ещё Загружается…

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

Сетевой инженер, OpenWrt, Linux

Ростовский завод электроники • Санкт-Петербург

от 20 000 до 60 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 350 000 ₽

Answer 1 · 2022-04-23 06:25:13

создайте таблицу в ней что то типа rows_matched
при инсерте нужной фразы добавляйте 1
при удалении вычитайте

по итогу у вас вместо тяжелого селекта очень легкий запрос

Answer 2 · 2022-04-23 06:58:46

Будет ли от этого оптимизация или будет еще хуже?

В описанной ситуации, скорее всего, будет.
Вот пример для таблицы на 5 млн строк:

> EXPLAIN ANALYZE select count(*) from u where val like 'xz%';
-> Aggregate: count(0)  (actual time=358.829..358.829 rows=1 loops=1)
    -> Filter: (u.val like 'xz%')  (cost=1081.88 rows=4995) (actual time=0.388..358.196 rows=4995 loops=1)
        -> Index range scan on u using u_val  (cost=1081.88 rows=4995) (actual time=0.383..356.709 rows=4995 loops=1)

> EXPLAIN ANALYZE select count(*) from (select id from u where val like 'zx%' limit 11) q;
-> Aggregate: count(0)  (actual time=1.609..1.609 rows=1 loops=1)
    -> Table scan on q  (actual time=0.002..0.005 rows=11 loops=1)
        -> Materialize  (actual time=1.594..1.601 rows=11 loops=1)
            -> Limit: 11 row(s)  (actual time=0.089..1.560 rows=11 loops=1)
                -> Filter: (u.val like 'zx%')  (cost=1183.58 rows=5465) (actual time=0.088..1.555 rows=11 loops=1)
                    -> Index range scan on u using u_val  (cost=1183.58 rows=5465) (actual time=0.082..1.537 rows=11 loops=1)

Ускорение более чем в 200 раз. Разумеется, тут важно, что строк, подходящих под условие, в таблице значительно больше 10 - в данном случае 5.5 тысяч. Если подходящих строк будет в пределах нескольких десятков, разница будет не особо заметна.

Answer 3 · 2022-04-23 02:36:13

SELECT СOUNT(*) as num_rows FROM my_table WHERE [проверяемое условие]

SELECT id FROM my_table WHERE [проверяемое условие] LIMIT 10

SELECT COUNT(*) AS num_rows  FROM shop_category WHERE id IN (SELECT id FROM shop_category WHERE [проверяемое условие])

Answer 4 · 2022-04-23 12:32:24

Николай Савельев @AgentSmith

Это мой правильный ответ на твой вопрос

Ещё дополнение.
Не нужно использовать COUNT(*)
надо использовать всего лишь одно поле, например, COUNT(id)

Ответ написан более трёх лет назад

1 комментарий

Как оптимизировать COUNT(*)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт