Как лучше ускорить выборку с пагинацией?

Question

Ler Den @givemoneybiatch

Немного веб, немного гейм

Как лучше ускорить выборку с пагинацией?

Сразу скажу, я в нюансах не силен, знаю sql в общих чертах.
Сейчас пагинация сделана стандартно через запоминание последнего айди. Примерно так:

SELECT *          
            FROM recording WHERE recording.id > 0 AND recording.artist_id = '269608'
            ORDER BY recording.id
            LIMIT 10

Запрос идет 5-10 секунд. План запроса здесь https://explain.depesz.com/s/a8Xl
Как видно больше всего времени тянет сканирование индекса, не пойму почему.
Если убрать ORDER BY , то все веселее https://explain.depesz.com/s/WpTp
Еще заметил, что если айдишник артиста не 269608, а меньше, например 500, то запрос идет очень быстро. И чем больше айдишник, тем дольше выполняется запрос. Разве это нормально? Такое впечатление, что все айди пересчитываются по порядку пока не дойдет до нужного.
В общем, как быть без ORDER BY, если нужна и скорость (в первую очередь) ну и фильтрация данных?
Таблица содержит 18млн записей, но не думаю, что это прямо таки неподъемная схема для субд (?)

UPD
Опишу задачу полностью.
Нужно достать треки по айдишнику артиста. Треки лежат в таблице recording, артисты - в таблице artist. Но таблицы не связаны напрямую, а только посредством двух других - artist_credit_name и artist_credit.
Связь следующая: artist.id <--> artist_credit_name .artist, artist_credit_name .artist_credit <--> artist_credit.id <--> recording.artist_credit
Вся схема здесь
Полностью запрос выглядит так:

SELECT recording.id  AS "recordingId", recording.name AS "trackName", artist.name AS "artistName"
            FROM artist
            INNER JOIN artist_credit_name ON artist.id = artist_credit_name.artist
            INNER JOIN artist_credit ON artist_credit_name.artist_credit = artist_credit.id
            INNER JOIN recording ON artist_credit.id = recording.artist_credit                      
            WHERE artist.id = $(artistId) AND recording.id > $(index) 
            ORDER BY recording.id LIMIT $(limit)

Получается так, что одному `artist.id` может соответствовать несколько `artist_credit.id`. Поэтому я пытался переписать запрос таким образом, что сначала выбираем все `artist_credit.id` для данного артиста а потом по ним уже с помощью `WHERE IN` выбирать треки, ускорение примерно на 30% (хотя может это погрешность), но результат все равно не тот что нужен.
Индексы по таблицам :
recording: id (PK),
artist_credit: id (PK),
artist_credit_name: id (PK), artist(FK),
artist: id (PK)
Может добавить индекс на поле `recording.artist_credit` ? Не знаю можно ли добавлять индексы на внешние ключи?

UPD#2 Добавил индекс на `recording.artist_credit`, теперь запрос идет быстро

Вопрос задан более трёх лет назад
137 просмотров

2 комментария

Подписаться 2 Средний 2 комментария

Помогут разобраться в теме Все курсы

Яндекс Практикум

SQL для разработки

4 месяца

Далее
Stepik

SQL с нуля до PRO

2 недели

Далее
Skypro

SQL с нуля

9 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

2 комментария

Ler Den @givemoneybiatch Автор вопроса

кроме pk индексы есть?

Да, в том то и дело, что индекса на artist_credit не было в таблице recording. Из-за этого тормозился весь процесс.
зачем нужна проверка "recording.id > 0"

в реальности вместо 0 там параметром айдишник последней выбранной записи. Для пагинации.
зачем сортировать по id если значения все равно записаны в данном порядке благодаря авто инкрименту.

без сортировки записи выбирались в случайном порядке. Наверное, что легче было выбрать СУБД, что ближе всего лежало то и первым она и выбирала

Написано более трёх лет назад
Антон Шаманов @SilenceOfWinter

Ler Den, я что-то забыл что у Вас PostgreSQL и по привычке пошпарил по MySql)
в реальности вместо 0 там параметром айдишник последней выбранной записи.

PostgreSQL разве не поддерживает запись вида "ORDER BY $page, 10"?

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Windows

+1 ещё

Средний
Работа PostgreSQL на процессорах с гетерогенной архитектурой под Windows?
- 2 подписчика
- 29 нояб.
- 261 просмотр
3

ответа
Windows

+1 ещё

Средний
Почему не создается логическая репликация на Windows 10 и падает воркер?
- 5 подписчиков
- 17 нояб.
- 340 просмотров
1

ответ
PostgreSQL

Простой
Как сделать поиск определенного значение в строке отобранной SELECT * FROM?
- 1 подписчик
- 13 нояб.
- 215 просмотров
2

ответа
SQL

+2 ещё

Средний
Как правильно обрабатывать концевые пробелы в SQL Server и PostgreSQL?
- 2 подписчика
- 11 нояб.
- 206 просмотров
1

ответ
PostgreSQL

+1 ещё

Простой
Как вести историю работы с записями во всех таблицах для всех пользователей?
- 2 подписчика
- 08 нояб.
- 252 просмотра
2

ответа
PostgreSQL

Средний
Как получить данные и обновить записи в таблицах-источниках?
- 1 подписчик
- 05 нояб.
- 110 просмотров
1

ответ
SQL

Простой
Почему INSERT присваивает только один символ вместо полного значения?
- 2 подписчика
- 29 окт.
- 184 просмотра
2

ответа
SQL

Простой
Правильно ли написан SQL-запрос для вывода клиентов с действующими (непогашенными) кредитами?
- 1 подписчик
- 19 окт.
- 228 просмотров
2

ответа
SQL

+1 ещё

Простой
Как сделать уменьшение склада в СУБД безопасными правильным?
- 2 подписчика
- 14 окт.
- 253 просмотра
4

ответа
Python

+2 ещё

Простой
Как получить данные в виде текста на русском языке из базы данных Paradox 4.5?
- 1 подписчик
- 23 сент.
- 327 просмотров
1

ответ
Показать ещё Загружается…

Специалист технической поддержки Oracle Database и PostgreSQL

Омега • Москва

от 90 000 до 120 000 ₽

Database Administrator / DBA

Playerok

от 300 000 ₽

Full-Stack Разработчик (PHP 8 / Node JS / Vue JS / PostgreSQL)

Складно

от 150 000 ₽

Как нетрудно заметить по результату explain - вы показываете совершенно не тот запрос, что исполняет база. Ну или recording - это view.
Соответственно нужны DDL участвующих таблиц и словесное описание что нужно из них достать.

Answer 1 · 2018-05-08 00:26:50

Таблица содержит 18млн записей, но не думаю, что это прямо таки неподъемная схема для субд (?)

это от сервера зависит. кроме pk индексы есть? или пробовал добавлять, например, unique id + artist_id?
зачем нужна проверка "recording.id > 0", вы авто инкримент не используете?
зачем сортировать по id если значения все равно записаны в данном порядке благодаря авто инкрименту.

Answer 2 · 2018-05-19 14:50:59

У вас проблема в том что постгрес сначала сортирует ВСЁ, а потом берет limit.
Попробуйте добавить что-то вроде: AND recording.id < $(index+дофига), где дофига - это limit + максимальный мыслимый размер "дырки" в списке первичных ключей.

Как лучше ускорить выборку с пагинацией?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт