Как сделать запрос на поиск 6 значений в одной таблице и 1 значения в другой, имеется не оптимизированный запрос с ILIKE?

Question

Александр @poter

PostgreSQL

Как сделать запрос на поиск 6 значений в одной таблице и 1 значения в другой, имеется не оптимизированный запрос с ILIKE?

В таблице имеется более 13 миллионов записей. Этот запрос отрабатывает за 80 секунд. Что очень долго. Так как используется ILIKE индексирование не работает.
Как можно оптимизировать запрос? Может нужно создать FULL TEXT INDEX для всех полей?

select *, "user_apps"."id" as "uaId", "messages"."id" as "messageId"
from "messages" 
left join "user_apps" on "user_apps"."id" = "messages"."user_app_id" 
where "user_apps"."unique_id" ilike '%12346789%'
or "sender" ilike '%12346789%' 
or "message" ilike '%12346789%' 
or "receiver" ilike '%12346789%' 
or "messages"."country" ilike '%12346789%' 
or CAST(message.id as VARCHAR(255)) ilike '%12346789%' 
or "sim" ilike '%12346789%' 
and "type" = 'message'
order by "messageId" desc 
limit 51 offset 0

Вопрос задан 31 мая
622 просмотра

4 комментария

Подписаться 3 Простой 4 комментария

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

PostgreSQL

+1 ещё

Средний
Можно ли гарантировать надежность снапшота?
- 1 подписчик
- 19 часов назад
- 65 просмотров
5

ответов
PostgreSQL

Простой
Какая версия PostgreSQL-ODBC-драйвера подойдет для Windows 7?
- 1 подписчик
- вчера
- 32 просмотра
1

ответ
PostgreSQL

+1 ещё

Простой
Как понять супер высокий Query Latency из под докера при коннекте на удаленный хост?
- 1 подписчик
- 18 июн.
- 44 просмотра
1

ответ
PostgreSQL

+1 ещё

Простой
Как восстановить базу из дампа postgres?
- 2 подписчика
- 14 июн.
- 186 просмотров
1

ответ
WordPress

+1 ещё

Простой
Возможно ли подключить PostgreSQL к Wordpress?
- 2 подписчика
- 14 июн.
- 193 просмотра
4

ответа
Ubuntu

+1 ещё

Простой
Как переключаться между разными версиями Postgres?
- 1 подписчик
- 11 июн.
- 125 просмотров
2

ответа
Python

+1 ещё

Простой
Как перенести из sqlite3 в Postgresql?
- 2 подписчика
- 10 июн.
- 275 просмотров
4

ответа
PostgreSQL

+1 ещё

Простой
Как вернуть нотификацию прогресса бекапа в pg admin 4?
- 1 подписчик
- 08 июн.
- 64 просмотра
0

ответов
PostgreSQL

Простой
Как начать пользоваться PostgreSQL?
- 2 подписчика
- 08 июн.
- 128 просмотров
2

ответа
PostgreSQL

+1 ещё

Простой
Как наиболее грамотно запустить sql файл с инициализацией бд в Docker?
- 1 подписчик
- 07 июн.
- 131 просмотр
1

ответ
Показать ещё Загружается…

Администратор баз данных PostgreSQL

Точка • Екатеринбург

от 300 000 ₽

DBA / Администратор баз данных PostgreSQL

СберТех • Москва

от 320 000 ₽

Преподаватель курсов PostgreSQL

Учебный центр «Микротест» • Москва

от 180 000 ₽

Разработка TWA игру-приложение под крипто-проект

22 июн. 2024, в 23:57

250000 руб./за проект

Миграция C++ кода для ARM7TDMI в новую среду разработки

21 июн. 2024, в 17:10

85000 руб./за проект

Конвертация в excel

22 июн. 2024, в 18:44

500 руб./за проект

Как уменьшить время выполнения запроса like '%uri%' в Postgresql?
Дмитрий, а как создать триграмму для нескольких полей, при этом одно поле будет из другой таблице добавленное JOIN?
Александр, так на каждое поле индекс
Александр, https://postgrespro.ru/docs/postgresql/16/indexes-...

Answer 1 · 2024-05-31 21:55:50

Пробуй pg_trgm, там побочный эффект часто помогает для like (но не факт, что тут поможет), а так, подобный треш, только внешним индексатором ускорять. Хотя конечно стоит описать глобальную проблему, может это по другому решается.

Answer 2 · 2024-06-01 11:44:27

Непонятно зачем ты конструируешь ILIKE когда у тебя идет поиск цифр и нет
case-insensitive алгоритмов. Упрости, чтоб было системе проще.

Про триграммы тут уже напихали. Нечего добавить.

Есть идея попробовать следующее. Можно конкатенировать все искомые поля в одно большое
виртуальное поле и построить по нему реальный триграммный индекс. Здесь мы сэкономим на количестве.
Вместо 5 индексов сделаем один и результат будет тот-же самый. Нам по сути безразлично
в каком поле найдена строка. Важно что просто была дизьюнкция предикатов.

CREATE TABLE messages(
    .......
    all_fields text GENERATED ALWAYS AS (CONCAT(sender,' ',message,' ',receiver,' ',sim))
);

CREATE EXTENSION IF NOT EXISTS pg_trgm;

CREATE INDEX messages_tr_idx ON messages USING GIN (all_fields gin_trgm_ops);

Точно так-же поступить с табличкой user_apps.

По поводу этого ограничителя.

....
order by "messageId" desc 
limit 51 offset 0

Судя по всему - это дизайн запроса для показа на UI. Обычно так делают чтобы
показать на формочке веба или в приложении.

Limit и order - это плохая комбинация. Если смысл сортировки по messageId - это показать
последние (оперативные) сообщения то я-бы заменил это на поиск по партишену сегодняшнего
дня (или опер-дня) если можно так сказать.

Разделение данных на оперативные и исторические ускорит поиск многократно. И если
допустии опер-день занимает 500 тыс строк а исторические данные - 13 млн. То вы
сразу получаете вместо 80 секунд ускорение ... эээ в сколько раз? 500 000/13 000 000 = x/80
это будет примерно 3 секунды. Вот. Это если предполагать линейную зависимость от объема.

Как сделать запрос на поиск 6 значений в одной таблице и 1 значения в другой, имеется не оптимизированный запрос с ILIKE?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт