Как оптимизировать запрос SELECT COUNT?

Question

Антон @hummingbird

Как оптимизировать запрос SELECT COUNT?

Всегда считал, что если указать в теле COUNT поле, то запрос будет выполняться быстрее. Решил это проверить и удивился:

SELECT count(*) FROM public.news;

1 row retrieved starting from 1 in 252ms (execution: 245ms, fetching: 7ms)
1 row retrieved starting from 1 in 231ms (execution: 227ms, fetching: 4ms)

SELECT count(id) FROM public.news;

1 row retrieved starting from 1 in 343ms (execution: 340ms, fetching: 3ms)
1 row retrieved starting from 1 in 300ms (execution: 296ms, fetching: 4ms)

У запроса, в котором указано поле, всегда время больше. Выполнял запрос несколько раз с небольшим (несколько секунд) интервалом.

И теперь у меня возник вопрос: как же все-таки оптимизировать запрос по подсчету количества строк, чтобы он выполнялся максимально быстро?

Вопрос задан более трёх лет назад
2983 просмотра

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Продвинутый SQL

5 недель

Далее
Яндекс Практикум

SQL для разработки

4 месяца

Далее
Skypro

SQL с нуля

9 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 216 просмотров
2

ответа
PostgreSQL

Простой
Запрос с 1 условием для выбора источника данных?
- 1 подписчик
- 08 апр.
- 129 просмотров
2

ответа
Базы данных

Простой
Как решить проблему когда две запущенные транзакции изменяют одну и ту же строку, но одна из транзакций видит старые данные а не новые?
- 1 подписчик
- 28 мар.
- 236 просмотров
3

ответа
PostgreSQL

+1 ещё

Средний
Как в PostgreSQL организовать синхронизацию данных между геораспределенными копиями?
- 1 подписчик
- 25 мар.
- 243 просмотра
4

ответа
1С-Битрикс

+1 ещё

Простой
Как получить доступ к SQL-базе Bitrix 14.5?
- 2 подписчика
- 18 мар.
- 268 просмотров
2

ответа
PostgreSQL

Простой
Как оптимизировать запрос с фильтром?
- 2 подписчика
- 13 мар.
- 313 просмотров
1

ответ
Базы данных

Простой
Когда использовать рекурсивное удаление?
- 1 подписчик
- 10 мар.
- 144 просмотра
2

ответа
PostgreSQL

+1 ещё

Простой
Как работает Housekeeper в Zabbix?
- 1 подписчик
- 07 мар.
- 248 просмотров
3

ответа
SQL

+2 ещё

Простой
Как ИИ использовать для написания sql запросов?
- 1 подписчик
- 02 мар.
- 816 просмотров
5

ответов
PostgreSQL

+3 ещё

Средний
Как обновить PostgreSQL 1С с 12 до 18 версии на windows?
- 3 подписчика
- 11 февр.
- 614 просмотров
2

ответа
Показать ещё Загружается…

C# Developer (WinForms + SQL)

Ляпунов и Резниченко • Санкт-Петербург

от 350 000 ₽

Администратор баз данных (Middle/Senior DBA)

Street Falcon • Москва

от 250 000 ₽

Go Developer

ITK academy • Казань

от 75 000 до 125 000 ₽

Answer 1 · 2016-11-14 11:31:59

SELECT COUNT(*) FROM - перебрать все строки.
SELECT COUNT(id) FROM - перебрать все строки, в которых указанное поле (в данном случае id) имеет значение отличное от NULL.

Без указания полей - наиболее оптимальный вариант для PostgreSQL:
SELECT COUNT(*) FROM table WHERE field = value
https://wiki.postgresql.org/wiki/Slow_Counting

Если все совсем плохо, то как вариант, можно сделать собственный счетчик.

Вот вырезка из PostgreSQL Wiki на русском языке:

Почему "SELECT count(*) FROM bigtable;" работает медленно?
Потому что не используется индекс. PostgreSQL выполняет проверку видимости каждой записи и таким образом производит последовательное сканирование всей таблицы. Если вы хотите, вы можете отслеживать количество строк в таблице с помощью триггеров, но это вызовет замедление при операциях записи в таблицу.
Вы можете получить некоторую оценку. Колонка reltuples в таблице pg_class содержит информацию из результата выполнения последнего оператора ANALYZE на эту таблицу. На большой таблице, точность этого значения составляет тысячные доли процента, что вполне достаточно для многих целей.
"Точный" результат count, часто не будет точным долгое время в любом случае; из-за конкурентности MVCC, count будет точным только на момент вызова запущенного запроса SELECT count(*) (или ограничиваться уровнями изоляции транзакций данной транзакции), и может потерять актуальность уже в момент завершения запроса. При постоянной работе транзакций, изменяющий таблицу, два вызова count(*), которые завершатся в одно и то же время могут показать разные значения, если изменяющая транзакция завершилась между их вызовами.
https://wiki.postgresql.org/wiki/Часто_Задаваемые_...

Answer 2 · 2016-11-14 11:52:35

Есть хак. Очень быстрый, но слегка неточный.

SELECT reltuples FROM pg_class WHERE oid = 'schema_name.table_name'::regclass;

Например, в таблице с 31560 строками он только что выдал мне цифру 31558, но выполнялся в 20 раз быстрее. Точность зависит от того, на сколько часто запускается для таблицы ANALYZE.

Как оптимизировать запрос SELECT COUNT?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт