Что использовать в качестве workerА для отложенных задач?

Question

zven_bpe @zven_bpe

Что использовать в качестве workerА для отложенных задач?

Пишу бота на aiogram. Админ бота может добавлять события, у которых будет время и дата выполнения. За некоторое время до этого всем пользователям бота должно прийти уведомление об этом. При этом события могут быть отложены на неделю и более. В качестве воркера решил использовать celery, а брокера - redis. Однако, на сайте доки прочитал такую вещь:

Tasks with eta or countdown are immediately fetched by the worker and until the scheduled time passes, they reside in the worker’s memory. When using those options to schedule lots of tasks for a distant future, those tasks may accumulate in the worker and make a significant impact on the RAM usage.
Moreover, tasks are not acknowledged until the worker starts executing them. If using Redis as a broker, task will get redelivered when countdown exceeds visibility_timeout (see Caveats).
Therefore, using eta and countdown is not recommended for scheduling tasks for a distant future. Ideally, use values no longer than several minutes. For longer durations, consider using database-backed periodic tasks, e.g. with https://pypi.org/project/django-celery-beat/ if using Django (see Using custom scheduler classes).

Что значит то, если вкратце, что задачи, отложенные надолго, могут занимать много памяти. Более того, если использовать в качестве брокера redis, то задачи будут доставлятся повторно, когда обратный отсчет превысит Visibility_timeout. Там еще сказано, что идеально не использовать период больше нескольких минут, что вообще не подходит для моей ситуации...
Что посоветуете делать? Менять воркер и/или брокер? Или эти рамки (указанные в доке) не особо строгие? (хотя я понимаю, что это не так) Буду рад любым советам, очень нужна помощь!

Вопрос задан более года назад
223 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее
Skillfactory

Профессия Python-разработчик

9 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

10 комментариев

zven_bpe @zven_bpe Автор вопроса

Vindicar , да, идея хорошая, спасибо большое! Попробую реализовать!

Написано более года назад
Vindicar @Vindicar

zven_bpe, я бы использовал для ожидания не asyncio.sleep(), а asyncio.Event.wait() завёрнутое в asyncio.wait_for(). Тогда, чтобы прервать сон, достаточно взвести этот event.

Написано более года назад
Everything_is_bad @Everything_is_bad

Vindicar, не нужен там велосипед, давно есть решение, автору его уже советовали aioschedule, но он решил радостно забыл на это

Написано более года назад
zven_bpe @zven_bpe Автор вопроса

Everything_is_bad, вот нравится мне, как вы постоянно отвечаете на комментарии, даже не вникая в вопрос. Если хотите знать, я смотрел документацию вашего `aioshedule`, и для себя решил, что пользоваться им НЕ буду. Во-первых, мне НЕ нужна регулярность. Событий вообще может не быть, они могут быть отложены на очень долгое время, а в документации я не увидел ни слова о том, как исполнять события в конкретное время один раз. Это НЕ удобно. Я молчу вообще о том, что если упадет бот, то и исчезнут все задачи, ибо ни нигде не хранятся. Это меня совсем не привлекает. К тому же, если сам `celery` говорит о том, что задачи лучше не откладывать больше чем на несколько минут, то что уж говорить об `aioshedule`. Для меня это неизвестная библиотека. Более того, у меня версия питона 3.12, на которой он не протестирован, а гугля доку наткнулся на множество проблем с использованием `aioshedule` у других программистов.

Написано более года назад
zven_bpe @zven_bpe Автор вопроса

Everything_is_bad, к тому же вы хотите сказать, что этот ваш шедулер разрешает откладывать задачи более чем на неделю и они сто процентов выполнятся? Дайте мне аргументы, почему `aioshedule` имеет место быть, и я может подумаю, а не пишите бесполезные комментарии, никак не аргументируя свою точку зрения.

Написано более года назад
Everything_is_bad @Everything_is_bad

zven_bpe,
и для себя решил, что пользоваться им НЕ буду.
ну вот ты для себя решил что будешь использовать celery и чё в итоге? на каждый чих бегаешь сюда, и всё равно не осилил

что тебе мешает сделать в aioshedule выполнение только 1 раз?

ты сейчас приходишь к велосипеду, где при каждом старте, тебе надо достать из базы данные и на основе их сделать задачу, а потом как-то ее дождаться, ну так достань и сделай задачу в aioshedule, всё.

Дайте мне аргументы, почему `aioshedule` имеет место быть, и я может подумаю
да пока всё выглядит так, что ты не можешь самостоятельно подумать

Написано более года назад
zven_bpe @zven_bpe Автор вопроса

Everything_is_bad, и вы все на своем... почитайте разные статьи об `aioshedule` на досуге и поймите, что все советуют менять шедулер. Тогда уж я распространенный и протестированный `apcheduler` возьму. К тому же вы сами говорите, цитирую:

ну так достань и сделай задачу в aioshedule, всё.

Значит мне все-таки придется использовать БД, верно? А вот как я буду "дожидаться" этой задачи (через `asyncio.sleep()` или ваш шедулер уже не имеет значение, вопрос не в этом состоял.

Написано более года назад
Everything_is_bad @Everything_is_bad

zven_bpe,
мне все-таки придется использовать БД,
тебе в любом случае нужно персистентного хранилище, БД или что-то другое не важно, тут БД как самое универсальное и простое

Написано более года назад
Vindicar @Vindicar

Everything_is_bad, как я понял, schedule и aioschedule всё-таки ориентируются на задачи вида "делай X каждые Y часов/минут/секунд". Такие задачи могут быть просто пересозданы при перезапуске программы, и все дела. Для разовых задач с длительным (дни/недели/месяцы) ожиданием нужна персистентность созданных задач, а я в их доках не увидел никакой поддержки персистентности (хотя может плохо смотрел).
Так что, боюсь, эти либы тут не очень-то помогут. Разве что периодическую проверку "не пора ли напоминать" через них делать, но если других периодических задач в системе нет, то это оверкилл.

Написано более года назад
Everything_is_bad @Everything_is_bad

Vindicar, все задачи хранятся например в БД, при каждом перезапуску сервиса, заново им ставишь задачи и всё. Твой велосипед примерно про это, aioschedule как раз возьмет на себя всю работу с ожиданиями

Написано более года назад

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- вчера
- 121 просмотр
0

ответов
Django

+1 ещё

Простой
Celery worker отказано в доступе?
- 1 подписчик
- 12 нояб.
- 78 просмотров
0

ответов
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 211 просмотров
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- 08 нояб.
- 143 просмотра
0

ответов
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 2 подписчика
- 08 нояб.
- 110 просмотров
1

ответ
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 246 просмотров
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 133 просмотра
0

ответов
Python

+1 ещё

Простой
Почему callback_query_handler в telebot не работает?
- 1 подписчик
- 31 окт.
- 137 просмотров
3

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 140 просмотров
0

ответов
Python

Простой
Что делать если turtle в python не отвечает?
- 1 подписчик
- 22 окт.
- 256 просмотров
2

ответа
Показать ещё Загружается…

Backend developer (Python, FastAPI)

BCraft

До 4 000 $

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

Junior Python Developer

ITK academy • Воронеж

от 75 000 ₽

Answer 1 · 2024-08-01 20:45:34

Я бы вообще изобрёл велосипед, если честно.
У тебя есть список или база активных (неслучившихся) событий. Пусть это будет пара ID-метка времени, остальная инфа нам без надобности.
При запуске бота выбираем из списка ближайшее событие, и вычисляем время ожидания (с небольшим запасом) и спим в корутине. В случае, если ожидание прервано раньше - повторяем то же самое, чтобы либо "доспать", либо переключиться на ожидание более близкого события.
Если же ожидание закончилось успешно, обрабатываем событие и снова повторяем поиск ближайшего события.
Если список событий изменился, прерываем текущее ожидание, чтобы корутина ожидания могла адаптироваться к изменениям.

Кода - строк на пятьдесят, не больше, и выносится в отдельный класс на ура. Как мне кажется, если бот не супер-нагружен (в том смысл, что список хранимых событий изменяется не каждую минуту, и событтия тоже срабатывают не так часто), то этого будет вполне достаточно.
А когда он будет так нагружен - проще будет раз в минуту выбирать то, что должно сработать сейчас.

Answer 2 · 2024-08-01 20:48:52

Для длительного хранения нужно использовать базу данных, а не redis или selery.
Отдельный воркер вообще не обязателен, если нет вычислительных задач.

Раз в миниту/час/день ходишь в базу и смотришь не наступило ли время выполнения, если наступило выполняешь.

Можно добавить полезных оптимизаций: засыпать до ближайшего события или до инсерта новых записей, читать сразу батчами, держать ближайшие события в памяти и проверять только их, но в целом не обязательно.

Что использовать в качестве workerА для отложенных задач?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт