Насколько хорошо/оптимально использовать хранимую процедуру для полинга?

Question

ksimmi @ksimmi

PostgreSQL

Насколько хорошо/оптимально использовать хранимую процедуру для полинга?

Всем привет!

Больше месяца назад я решал проблему описанную в другом вопросе, но, к сожалению, так и не нашел того решения которого хотел, а именно "повесить тригер на устаревание даты и не использовать селекты". Подробно логика поллинга описана по ссылке в вопросе и тут дублировать задачу не буду. В этом же вопросе в секции UPD я указал, что вижу другое решение, через хранимую процедуру с слектованием, по этому пути я и пошел. У меня за одни выходные получилось сделать то, что я хотел, но это мой первый опыт написания хранимых процедур и у меня нет увернности, что я сделал все правильно и вообще это будет быстро работать.

Дано:

Три таблицы очередей с записями, по которым надо делать поллинг: second_intervals_polling, minute_intervals_polling, hour_intervals_polling. Таблицы имеют идентичную структуру, одинаковые индексы, все что их отличает - частота селектования из этих таблиц, т.е. интервал между селектами. В этих таблицах я по полной использую типы данных INTERVAL и ARRAY. ;
Таблица выведенных из очереди записей terminated. Тут все понятно, сюда складываю все записи, которые были успешно доведены до терминального статуса, удаляя их из трех предыдущих таблиц;
Таблица с базовыми настройками очередей для каждого типа поллера. Эта таблица используется на уровне приложения, чтобы считать настройки перед постановкой в очередь очередной записи и далее в объянии фигурировать не будет;
Три хранимых функции для получения записей с истекшей временной меткой из соответствующей ей таблицы poll_second_intervals, poll_minute_intervals, poll_hour_intervals. Код функций приведу ниже, но логика не сложная. Каждая функция селектует записи из связанной с ней таблицы по которым пора запросить статус и для всех таких записей, если они есть, на основании текущей итерации происходит вычисление следующего интервала. Если, например, текущая таблица исчисляется секундными интервалами, а вычисленный интервал в минутах, то запись будет перенесена из секундной таблицы в минутную. В конечном итоге функция фозвращает список строк, по которым пора опрашивать статус;
Одна хранимая функция для выведения из очередей полинга terminate_polling;
Одна хранимая функция для получения последного элемента массива, добавленная просто для семантики array_last.

Как это используется:
На уровне приложения, в зависимости от типа поллера (точнее от требований к частоте поллинга) создается новая запись в одну из трех таблиц second_intervals_polling, minute_intervals_polling, hour_intervals_polling. Допустим, что запись была записана в second_intervals_polling. Есть расписание (например крон), которое, через приложение, раз в секунду вызвает функцию poll_second_intervals. В результате работы этой функции приложение получает все данные, которые пора опросить, а на уровне БД записи присваивается номер итерации и на основании интервала этой итерации (intervals[iteration]) вычисляется следующая дата next_poll_at. При повторномы вызове функции poll_second_intervals итерация будет инкрементирована, и опять произойдет на основании интервала (intervals[iteration + 1]) вычисление следующей даты next_poll_at. Если интервал для текущей итерации будет исчисляться не секундами (больше чем 59 секунд), то запись будет перенесена в другую таблицу minute_intervals_polling. Для данных в таблице minute_intervals_polling справедлива ровно таже самая логика, что и для second_intervals_polling, только расписание вызова связанной с ней функции poll_minute_intervals вызывается раз в минуту сооветственно, а записи с интервалом выходящие за допустимый диапазон интервалов переносятся уже в след. таблицу hour_intervals_polling, где вся начинается заново. После получения терминального статуса вызывается функция terminate_polling, которая удаляет запись из любой из трех таблиц и сохраняет их в таблицу terminated.

Структура табдиц очередей на примере second_intervals_polling:

create table second_intervals_polling
(
    id                 uuid default gen_random_uuid() not null constraint second_intervals_polling_pkey primary key,
    poller_type        varchar                             not null,
    created_at         timestamp default now()             not null,
    next_poll_at       timestamp                           not null,
    iteration          integer   default 0                 not null,
    iteration_interval interval                            not null,
    intervals          interval[]                          not null,
    technical_name     varchar                             not null,
    pollable           jsonb
);

Код функций:

CREATE OR REPLACE FUNCTION array_last(arr anyarray) RETURNS anyelement AS $$
    SELECT arr[array_upper(arr, 1)];
$$ LANGUAGE sql;

CREATE OR REPLACE FUNCTION poll_second_intervals() RETURNS SETOF second_intervals_polling AS $$
WITH 
    deleted AS (
        DELETE FROM second_intervals_polling
        WHERE iteration_interval >= '1 MINUTE'
        RETURNING  *
    ),
    moved AS (
        INSERT INTO minute_intervals_polling SELECT * FROM deleted RETURNING *
    ),
    updated AS (
        UPDATE second_intervals_polling
        SET iteration = iteration + 1,
            next_poll_at = NOW() + iteration_interval,
            iteration_interval = COALESCE(intervals[iteration + 1], iteration_interval)
        WHERE second_intervals_polling.id NOT IN (SELECT id FROM moved)
          AND next_poll_at <= NOW()
        RETURNING *
    )
    SELECT * FROM updated;
$$ LANGUAGE sql;


CREATE OR REPLACE FUNCTION poll_minute_intervals() RETURNS SETOF minute_intervals_polling AS $$
WITH
    deleted AS (
        DELETE FROM minute_intervals_polling
        WHERE iteration_interval >= '1 HOUR'
        RETURNING  *
    ),
    moved AS (
        INSERT INTO hour_intervals_polling SELECT * FROM deleted RETURNING *
    ),
    updated AS (
        UPDATE minute_intervals_polling
        SET iteration = iteration + 1,
            next_poll_at = NOW() + iteration_interval,
            iteration_interval = COALESCE(intervals[iteration + 1], iteration_interval)
        WHERE minute_intervals_polling.id NOT IN (SELECT id FROM moved)
          AND next_poll_at <= NOW()
        RETURNING *
    )
    SELECT * FROM updated;
$$ LANGUAGE sql;


CREATE OR REPLACE FUNCTION poll_hour_intervals() RETURNS SETOF hour_intervals_polling AS $$
WITH
    updated  AS (
        UPDATE hour_intervals_polling
        SET iteration = iteration + 1,
            next_poll_at = NOW() + COALESCE(intervals[iteration + 1], array_last(intervals))
        WHERE next_poll_at <= NOW()
        RETURNING *
    )
    SELECT * FROM updated;
$$ LANGUAGE sql;


CREATE OR REPLACE FUNCTION terminate_polling(ptype varchar, pkey jsonb)
  RETURNS TABLE(
      id uuid,
      poller_type varchar,
      created_at timestamp,
      terminated_at timestamp,
      iteration integer,
      intervals interval[],
      technical_name varchar,
      pollable jsonb
  ) AS $$
WITH deleted_per_seconds AS ( DELETE FROM second_intervals_polling WHERE pkey = pollable AND ptype = poller_type RETURNING  * ),
     deleted_per_minutes AS ( DELETE FROM minute_intervals_polling WHERE pkey = pollable AND ptype = poller_type RETURNING  * ),
     deleted_per_hours   AS ( DELETE FROM hour_intervals_polling   WHERE pkey = pollable AND ptype = poller_type RETURNING  * ),
     moved AS (
          INSERT INTO terminated
               ( id, created_at, poller_type, intervals, iteration, technical_name, pollable )
          SELECT id, created_at, poller_type, intervals, iteration, technical_name, pollable FROM deleted_per_seconds UNION
          SELECT id, created_at, poller_type, intervals, iteration, technical_name, pollable FROM deleted_per_minutes UNION
          SELECT id, created_at, poller_type, intervals, iteration, technical_name, pollable FROM deleted_per_hours
          RETURNING *
     )
SELECT * FROM moved;
$$ LANGUAGE sql;

Протестил локально и на тестовом стенде. Работает как ожидал, но возможно где-то ошибся, т.к. мой первый опыт. Сейчас меня больше всего интересует оценка людей более сведущих, другими словами мне нужна критика. Есть ли очевидные недостатки?

PS На три таблицы разделил по причине того, что по требованиям реально нужно селектовать каждую секунду и я не хочу, чтобы "несрочные" данные лежали вместе со "срочными", мне кажется, что это должно работать быстрее.

Вопрос задан более трёх лет назад
83 просмотра

Комментировать

Подписаться 1 Сложный Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

5 комментариев

ksimmi @ksimmi Автор вопроса

Спасибо большое, что уделили столько времени, ответ не маленький, мне аж стыдно, потому что есть чувство, что я вас не понял, точнее понял не во всем.

1 Вы говорите, что я использую неподходящий инструмент (СУБД?), было бы здорово, если бы вы описали инструменты, которые подходят, а также общепринятые практики для решения подобных задач;
2 Вы говорите, что решение слишком сложное, а также советуете сделать решение на стороне приложения, но я как раз этого стремился избежать. Верю, что вы имеете положительный опыт решения подобных задач на уровне приложения, но мой опыт был плохим, было сложнее и запутаннее;
3 В p.s. вы говорите, что разделение по таблицам на производительность не повлияет. Это полезное замечаение и если это действительно так, то я смогу быстро свести все к одной таблице. Вот только я не знаю как это проверить. Разделил на три таблицы исходя из своего умозрительного заключения о том, что по меньшему набору данных поиск происходит быстрее и что это может быть ценно при ежесекундном селекте.

В целом сервис проектируется предельно простым. Если появится основание переписать и выбросить, то трудностей не будет. Основанием является новое видение или, как вы сказали, появление подходящего инструмента. Мои требования к сервису: должен полить во чтобы то ни стало, без ограничений по количеству итераций, без боязни ошибочного дублирования опросов независимо от того была ли корректировка времени или нет. Поллер тупой, он постоянно спамит в кафку то что ему нужно, подписанные на кафку сервисы реагируют и уже на их стороне лежит ответственность провалидировать и не выполнить одну и туже операцию дважды и т.д. На их же стороне ответственность выбросить событие, на которое подписан поллер, чтобы прекратить поллинг. На количество итеарций я хочу мониторинг повесить, чтобы анализировать на ситуации типа, когда задача была запрошена 100 раз и до сих пор не получила терминальный статус.

Мне бы хотелось получить фидбек и критику именно по саммим функциям. Что в них неправильно? Что опасно? Как их правильно переписать.

Написано более трёх лет назад
rPman @rPman

ksimmi, я описал алгоритм, он предельно простой - у вас есть событие - изменения в настройках интервалов (добавили интервал), то сбрасываем текущий таймер и тупо добавляем этот интервал в базу данных и делаем select время исполнения ближайшего по времени интервала limit 1, если такой найден, запускаем таймер на полученное значение. По окончанию запрашиваем список интервалов, которые опоздали (количество исполнений меньше расчетного) таким же селектом, и исполняем их, после каждого исполнения увеличиваем счетчик в базе. Кстати можно обойтись этим одним селектом, только запрашивать список перед таймаутом, и уже в вашем демоне смотреть какой интервал ближайший, а после интервала повторно не запрашивать, зачем если вы единственный кто пишет в эту таблицу.

Однозначно готовые решения уже есть, не удивлюсь если даже в виде расширения к базе данных, но если вы начинающий программист, настоятельно рекомендую реализовывать это самому хотя бы один раз. Использование сторонних решений это как пользоваться микроволновкой не разбираясь в том как она работает, в результате там собачек сушат (реальный случай) - т.е. когда будут проблемы и неоднозначности, вам будет сложнее найти причину.

Написано более трёх лет назад
ksimmi @ksimmi Автор вопроса

rPman, Все-равно не понимаю вас, мне кажется, что вы предлагаете решение какой-то другой проблемы.
> у вас есть событие
Нет у меня события по изменению интервала на которое я должен реаоигровать. Задача описанного сервиса как раз и заключается, чтобы это событие выбросить. Описанный сервис не ждет событий по изменению интервалов, он их создает. Сам сервис, через одну из описанных хранимых функций, селектует БД ежесекундно пытаясь найти задачи, по которым "пора" запросить статус и, если записи были найдены, то сервис сначала относительно заложенного в НЕИЗМЕНЯЕМЫЙ конфиг интервала высчитывает дату следующего получения статуса, а потом возвращает найденные записи в приложение. Приложение в зависимости от типа записи выбрасывает событие для других сервисов.

> Однозначно готовые решения уже есть, не удивлюсь если даже в виде расширения к базе данных
Извините, но без конкретных примеров, ваши слова не имеют пользы.

> если вы начинающий программист, настоятельно рекомендую реализовывать это самому хотя бы один раз
Я дважды говорил, что уже решал эту задачу. Решал как раз на уровне приложения и у меня не получилось сделать хорошо, было много кода, было трудно разбираться и вносить изменения. Для сравнения, я описал 4 хранимаых функции, суммарным объемом около 100 строк кода. Если учесть ваше замечание, что иметь три разных таблицы бессмыленно, то от двух функций можно избавиться и получть 50 строк кода. Я не вижу способов решить эту задачу на уровне приложения меньшей логикой. Будет сложнее, если переложить работу над данными (расчет итерации и след. интервала) в слой прилы, в таком случае select->обработка_данных->update на большой выборке может быть больше самого интервала с которым надо полить.

Мне интересно, почему вы в первом ответе сказали
неправильный подход к реализации, у которого будут глюки в проблемных местах
. О каких именно проблемных местах речь?

Написано более трёх лет назад
rPman @rPman

если у вас нет изменений интервалов, то значит задача слегка упрощается - т.е. у вас только добавление интервалов и завершение их работы, если события исполняются только один раз (а не повторяются с указанным интервалом) то это еще немного упрощает все

остальное остается таким как я описал, не вижу никаких хранимых процедур в вашей задаче, зачем!?

50 строк это МАЛЕНЬКИЙ код

p.s. про готовые решения, странно что не гуглится в первые 5 минут, наверное задача слишком простой считается чтобы выделять ее в готовом виде в отдельную библиотеку.

само управление таймерами - пожалуйста php react смотреть примеры setInterval если вам на php (react это мультиязыковая асинхронная библиотека) но с базой данных работайте уже сами, но я бы в такой простой задаче не пользовался такой 'сложной' библиотекой

p.p.s. наличие проблем - просто интуиция, проверьте пограничные ситуации, когда к примеру происходит ошибка во время исполнения задачи, т.е. необходима повторная попытка, так же что будет происходить если время будет скорректировано вперед или назад какраз на остаток интервала во время исполнения задачи

Написано более трёх лет назад
ksimmi @ksimmi Автор вопроса

rPman, решил поделиться. Я в итоге решился на использование поллера описанного в топике, прошло почти 10 месяцев и он исправно работает на проде. С одной стороны я рад, что он работает без единого сбоя, а с другой - насторожен, что проблемы могли быть не выявлены из-за низкой нагрузки на него. К сожалению, пока-что не получилось сделать наш проект популярным и поллеру отдается всего около 100-150 задач в сутки.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PostgreSQL

+1 ещё

Средний
Sqlx + pgx — выборка по набору пар значений столбцов без танцев с бубном?
- 1 подписчик
- 07 июл.
- 89 просмотров
1

ответ
Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 353 просмотра
2

ответа
PostgreSQL

Простой
Запрос с 1 условием для выбора источника данных?
- 1 подписчик
- 08 апр.
- 171 просмотр
2

ответа
PostgreSQL

+1 ещё

Средний
Как в PostgreSQL организовать синхронизацию данных между геораспределенными копиями?
- 1 подписчик
- 25 мар.
- 333 просмотра
3

ответа
PostgreSQL

Простой
Как оптимизировать запрос с фильтром?
- 2 подписчика
- 13 мар.
- 347 просмотров
1

ответ
PostgreSQL

+1 ещё

Простой
Как работает Housekeeper в Zabbix?
- 1 подписчик
- 07 мар.
- 349 просмотров
3

ответа
PostgreSQL

+3 ещё

Средний
Как обновить PostgreSQL 1С с 12 до 18 версии на windows?
- 3 подписчика
- 11 февр.
- 802 просмотра
2

ответа
PostgreSQL

Простой
Как увидеть все запросы к postgres?
- 1 подписчик
- 15 янв.
- 318 просмотров
1

ответ
PostgreSQL

+1 ещё

Средний
Почему не запускается контейнер DB в Docker?
- 1 подписчик
- 08 янв.
- 387 просмотров
2

ответа
Linux

+4 ещё

Средний
Runtipi: как корректно переключить встроенный Postgres-контейнер на внешний Postgres (.env / runtipi-cli / docker compose)?
- 1 подписчик
- 26 дек. 2025
- 217 просмотров
0

ответов
Показать ещё Загружается…

Answer 1 · 2020-09-06 07:28:46

Изначально неправильный подход к реализации, у которого будут глюки в проблемных местах. К тому же слишком сложный у вас получился вариант.

Если база данных в своей основе не позволяет нужны вам функционал, как бы вы не извращались, делать его придется снаружи. И лучше чтобы это было 'userspace' а не ядро базы данных или ее расширение, так как стоимость поддержки результата растет экспоненциально.

Правильный подход - у вас работает ваше приложение (не крон), которое в момент изменения/добавления временных интервалов будет вычислять какой следующий интервал в ближайшее время должен тригериться, ждать соответствующее время и исполнять его.

В базе данных (таблица задач), в зависимости от необходимости, у вас должны быть следующие поля:
* таймстамп создания интервала (нужен чтобы вычислять сколько раз должен исполниться и уже исполнился интервал)
Уже в этот момент появляется важное замечание, нужно понимать что время на машине может быть изменено, скорректировано назад например и в зависимости от того на сколько вам важно не пропустить или не получить лишнее исполнение, можно использовать синтетические значения, в т.ч. использовать специальные процессорные счетчики, значение которых не меняется при смене времени, конечно придется добавлять инструменты корректировки/инициализации при перезапуске службы, отдельный разговор и задача.
* временной интервал между повторениями
* лимит количества исполнений - здесь указывается максимальное количество раз исполнений задачи
* количество исполнений - счетчик должен увеличиваться при исполнении задачи
еще нужно учесть что есть просто попытки исполнения и есть успешно завершенные, бывают задачи, при которых не успешные попытки тоже должны быть учтены, так как контроль за ошибками системы важен.

Все изменения интервалов должны проходить через вашу службу или вы должны собирать нотификации базы данных о таких изменениях (некоторые базы данных дают такой инструментарий, позволяют передавать события через отдельные сокеты или даже сессию подключения клиента), правда вам придется учитывать что записи в базе транзакционные и если вдруг произойдет откат записи об интервале а вы уже обработали событие (или наоборот в базе транзакция прошла а у вас из-за ошибки событие не обработалось), поэтому проще управлять интервалами через свое приложение.

В момент когда приложение получает новую ситуацию по интервалам, оно вычисляет какой ближайший интервал и когда закончится, и запускает счетчик времени, который должен быть отменен при получении новых изменений.

По окончанию работы счетчика вы должны снова запросить из базы данных список задач которые опоздали или должны быть исполнены сейчас, вычисляя разницу между расчетным количеством исполнений (now - creation_time)/exec_interval и счетчиком исполнений (тут же проверяем лимит количества запусков, и при его превышении задачу удаляем, не забыв доделать нужное количество запусков). Для каждой задачи получаем количество исполнений - запускаем эти задачи и по окончанию каждой итерации увеличиваем счетчик исполнений.

p.s. разделение задач по разным таблицам в зависимости от длины интервала никак на производительность не повлияют, только усложнят алгоритм

Насколько хорошо/оптимально использовать хранимую процедуру для полинга?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт