Есть ли какие то варианты вызвать деструктор принудительно кроме обязательного использования контекстного менеджера?

Question

theurus @theurus

Python

Есть ли какие то варианты вызвать деструктор принудительно кроме обязательного использования контекстного менеджера?

Пытаюсь сделать объект - копию обычного словаря но с дополнительной функцией авто-сохранения на диск.

Сохранять можно при записи, например в обработчике __setitem__ но у этого варианта есть проблема с тем что в этот обработчик попадает только верхний уровень
d[1] = 2 # сработает
d[1][2] = 3 # не сработает, тут сработает обработчик объекта d[1].__setitem__ который не имеет ничего общего с d.__setitem__ а d просто не заметит что у него внутри что то изменилось

Что бы замечать изменения глубже 1 уровня попробовал использовать постоянно работающий поток который делает хеш содержимого словаря и сверяет с предыдущим, так всё работает но есть проблема с завершением программы.

Программа не завершается если вручную не остановить этот поток. Вручную вызвать .stop() или использовать with. Я хочу что бы поток принудительно останавливался когда объект выходит из зоны видимости, завершается программа или функция в которой он создан.

#!/usr/bin/env python3


import pickle
import time
import threading
import sqlitedict


class PersistDict:
    def __init__(self, filename = 'test.pickle', timer = 2):
        self.filename = filename
        self.data = {}
        self.last_hash = None
        self.timer = timer
        self.lock = threading.Lock()

        self.load()

        self._thread = threading.Thread(target=self.run)
        self.running = True
        self._thread.start()

    def __del__(self):
        """да я вкурсе что это не деструктор в том смысле что у c++
        вопрос тут как с этим быть, если хочется что бы объект удалялся
        (останавливался поток) при выходе из области видимости?
        без контекстного менеджера и прямого вызова .stop()
        """
        self.stop()

    def stop(self):
        self.running = False
        self._thread.join()
        self.check_for_changes()

    def __enter__(self):
        return self

    def __exit__(self, exc_type, exc_val, exc_tb):
        self.stop()

    def __getitem__(self, key):
        return self.data[key]

    def __setitem__(self, key, value):
        self.data[key] = value

    def __delitem__(self, key):
        del self.data[key]

    def __contains__(self, key):
        return key in self.data

    def __reversed__(self):
        return reversed(self.data)

    def __eq__(self, other):
        return self.data == other
    
    def __hash__(self):
        return hash(pickle.dumps(self.data))

    def __ne__(self, other):
        return self.data != other

    def __len__(self):
        return len(self.data)

    def __iter__(self):
        return iter(self.data)

    def clear(self):
        self.data.clear()

    # def copy(self):
    #     return PersistDict(self.filename, self.data.copy())

    @classmethod
    def fromkeys(cls, keys, value=None):
        return cls({key: value for key in keys})

    def get(self, key, default=None):
        return self.data.get(key, default)

    def items(self):
        return self.data.items()

    def keys(self):
        return self.data.keys()

    def pop(self, key, default=None):
        value = self.data.pop(key, default)
        return value

    def popitem(self):
        key, value = self.data.popitem()
        return key, value

    def setdefault(self, key, default=None):
        value = self.data.setdefault(key, default)
        return value

    def update(self, other):
        self.data.update(other)

    def values(self):
        return self.data.values()

    def load(self):
        try:
            with open(self.filename, 'rb') as f:
                self.data = pickle.load(f)
            self.last_hash = hash(pickle.dumps(self.data))
        except FileNotFoundError:
            pass

    def save(self):
        with self.lock:
            with open(self.filename, 'wb') as f:
                print('saving')
                pickle.dump(self.data, f)

    def check_for_changes(self):
        new_hash = hash(pickle.dumps(self.data))
        if new_hash != self.last_hash:
            self.save()
            self.last_hash = new_hash

    def run(self):
        while self.running:
            time.sleep(self.timer)
            self.check_for_changes()
            print('running')


if __name__ == '__main__':
    # этот вариант работает как задумано но требут контекстного менеджера
    # with PersistDict() as d:
    #     for x in range(10):
    #         d[x] = x+1
    #         time.sleep(1)
    #         print(d[x])


    # этот вариант работает как задумано но требует ручного вызова функции stop
    # d = PersistDict()
    # for x in range(10):
    #     d[x] = x+1
    #     time.sleep(1)
    #     print(d[x])
    # d.stop()


    # в этом варианте программа не завершается
    # объект не уничтожается, поток не останавливается,
    # хотя vscode показывает что потоков больше нет
    # d = PersistDict()
    # for x in range(10):
    #     d[x] = x+1
    #     time.sleep(1)
    #     print(d[x])


    # тот же результат что и в предыдущем варианте
    # попытка удалить объект вручную приводит к.. ничему. это вообще не работает,
    # функция __del__ не вызывается(ставил туда точку останова и принты),
    # но и ошибок никаких не порождает, до финиша доходит в любом случае
    d = PersistDict()
    for x in range(10):
        d[x] = x+1
        time.sleep(1)
        print(d[x])
    del d


    print('finished')

Вопрос задан более года назад
126 просмотров

6 комментариев

Подписаться 1 Простой 6 комментариев

Everything_is_bad @Everything_is_bad

в __del__ точно не стоит использовать stop, он не для этого

ну есть же пример как правильно делать, если хочешь чтобы данные сохранились, это использование close с open, так что правильные только первые два варианта.

если хочется что бы объект удалялся (останавливался поток) при выходе из области видимости? без контекстного менеджера и прямого вызова .stop()

ну сделай, например, декоратор, в любой случае тебе для своей хотелки, потребуется функция-обертка, у которой внутри будут первые два варианта

Написано более года назад
theurus @theurus Автор вопроса

Everything_is_bad, как тут использовать декоратор?

Написано более года назад
Everything_is_bad @Everything_is_bad

theurus, декоратор тут как возможный пример, ты на главное не обратил внимание - функция-обертка, ну и догонку, чем именно тебе контекст-менеджер не устроил, по мне так самый понятный и наглядный способ работы с подобными объектами

Написано более года назад
theurus @theurus Автор вопроса

Everything_is_bad, это объект для долго работающего процесса, демона какого-нибудь. он будет объявлен как глобальный. контекст в этом месте вообще никак

Написано более года назад
Everything_is_bad @Everything_is_bad

theurus, ну так запускай "долго работающий процесс" внутри этого контекст, не вижу в этом проблемы.

Написано более года назад
theurus @theurus Автор вопроса

Everything_is_bad,

глобальный объект объявлен в начале

#!python

d=persistdict()

дальше идут функции. к этому объекту надо доступаться из этих функций, а еще из других модулей которые импортировали этот. где тут какой контекст можно использовать?

def а1()
def f2()
def daemon()

def main()

Написано более года назад

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

3 комментария

theurus @theurus Автор вопроса
shelve не умеет автоматически сохранятся, не принимает в качестве ключей ничего кроме строк, не видит что происходит внутри контейнеров внутри словаря. Не знаю как у редис но у sqlitedict примерно те же проблемы.

d = shelve.open('test123.db') d['1'] = '1' d['2'] = {} d['2'][2] = 2 d.close() d = shelve.open('test123.db') print(d['1'], d['2']) d.close() 1 {} d = PersistDict('test123.db') d['1'] = '1' d['2'] = {} d['2'][2] = 2 d.close() d = PersistDict('test123.db') print(d['1'], d['2']) d.close() 1 {2: 2}
Написано более года назад
fenrir @fenrir1121

Ну смотрите. Я не могу вам дать ответ, потому что не понимаю зачем вы пытаетесь это сделать. Интерфейс словаря исходит из того, что он хранит ссылки на объекты, а не сами объекты. Создавая объект который работает как словарь, но произвольно перестающий это делать вы нарушаете правило наименьшего удивления.

Если вы боитесь потерять данные можно отнаследоваться от collections.UserDict и например периодически выгружает данные в json.

Но если это не учебная задачка, а вы хотите с этим реально работать, кажется вы пытаетесь изобрести документоориентированную СУБД и возможно лучше не изобретать велосипед.

Написано более года назад
theurus @theurus Автор вопроса

fenrir, в каком месте этот эмулятор словаря перестает быть словарем?

это реальная задачка. есть например демон который проверяет доступность ресурсов через прокси. загружает 50т свежих проксей, и пробегает по ним проверяя доступность, время отклика, количество и время удачных откликов итп, следит за прибывшими, убывшими, рейтингами. тут можно конечно использовать обычную БД, но простой словарь кажется намного проще и удобнее

надо будет только доработать сохранение, может быть так что программа прервется прямо во время сохранения словаря, и добавить блокировок во все методы тк приложение многопоточное

ну и разумеется много данных в таком словаре держать нельзя, постоянные пересчеты хешей и перезапись всего файла полностью это не про скорость и большие данные

Написано более года назад

2 комментария

theurus @theurus Автор вопроса

Не понял о чем это. Что бы в словаре не было понапихано оно будет сохранено с помощью pickle. Отслеживать изменения внутри любых типов которые может сохранить pickle можно просто делая дамп пиклом в оперативку и считая хеш от этого.

Написано более года назад
Vindicar @Vindicar

theurus,

Что бы в словаре не было понапихано оно будет сохранено с помощью pickle

Есть классы, которые не сохраняются через pickle без отдельных танцев с бубном.

просто делая дамп пиклом в оперативку и считая хеш от этого

Это, по сути, и есть создание снапшота. На больших структурах данных pickle может давать заметную задержку. Собственно, потому и встаёт вопрос: как нам понять, что снапшот изменился?

Написано более года назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Чтобы сделать несколько запросов к OpenAI серверу из Python, нужно каждый раз вызывать client.chat.completions.create?
- 1 подписчик
- вчера
- 77 просмотров
2

ответа
Python

Простой
Какой отлдачик для Python поставить новичку?
- 1 подписчик
- 20 дек.
- 117 просмотров
2

ответа
Python

Простой
Существует ли менеджер виртуальных окружений для python, который хранит все пакеты в одном месте?
- 3 подписчика
- 18 дек.
- 187 просмотров
1

ответ
Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 218 просмотров
1

ответ
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 75 просмотров
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 198 просмотров
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 228 просмотров
1

ответ
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 141 просмотр
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 247 просмотров
0

ответов
Python

Простой
Как получить конкретный атрибут приложенный в обьект?
- 1 подписчик
- 28 нояб.
- 239 просмотров
1

ответ
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Backend Developer

Hard Bootstrapping LLC. • Санкт-Петербург

от 175 000 до 350 000 ₽

в __del__ точно не стоит использовать stop, он не для этого

ну есть же пример как правильно делать, если хочешь чтобы данные сохранились, это использование close с open, так что правильные только первые два варианта.

если хочется что бы объект удалялся (останавливался поток) при выходе из области видимости? без контекстного менеджера и прямого вызова .stop()

ну сделай, например, декоратор, в любой случае тебе для своей хотелки, потребуется функция-обертка, у которой внутри будут первые два варианта
Everything_is_bad, как тут использовать декоратор?
theurus, декоратор тут как возможный пример, ты на главное не обратил внимание - функция-обертка, ну и догонку, чем именно тебе контекст-менеджер не устроил, по мне так самый понятный и наглядный способ работы с подобными объектами
Everything_is_bad, это объект для долго работающего процесса, демона какого-нибудь. он будет объявлен как глобальный. контекст в этом месте вообще никак
theurus, ну так запускай "долго работающий процесс" внутри этого контекст, не вижу в этом проблемы.
Everything_is_bad,

глобальный объект объявлен в начале

#!python

d=persistdict()

дальше идут функции. к этому объекту надо доступаться из этих функций, а еще из других модулей которые импортировали этот. где тут какой контекст можно использовать?

def а1()
def f2()
def daemon()

def main()

Answer 1 · 2024-02-01 13:03:29

В стандартной библиотеке уже реализован shelve, который делает ровно то же самое причем тоже с помощью pickle.

Но pickle медленный и не безопасный, я бы советовал просто настроить redis, потому что есть Redis persistence

Answer 2 · 2024-02-01 16:23:16

Ну во-первых, ты вот так сходу это не реализуешь, потому что помимо вложенных словарей есть списки и другие коллекции, а также есть классы. Ты, конечно, можешь схитрить - сделать класс-прокси, который сигнализирует об изменениях при __setattr__() и __setitem()__, а также реализует вызовы __getattr__() и __getitem__() так, чтобы возвращать такой же прокси для целевого объекта.
Условно:

l = [1]
d = {'a': l}
pd = MyProxy(d)
lst = pd['a']  # на самом деле lst это MyProxy(l, owner=pd)
lst[0] = 2  # прокси-список реагирует на присваивание и оповещает владлеьца - прокси-словарь

Но и это не очень хорошо, так как в примере выше я могу изменить список через ссылку l. Не говоря уже о проблемах с проверками типов данных. Так что сложно-составные структуры персистентными сделать малореально.

Я бы сказал, вообще не очень хорошая идея реализовывать персистентность вот так.
Вариант А: делай снапшоты в фиксированные моменты времени. Если сохранение снапшота слишком долгое, сделай клон через deepcopy и сохраняй клон, пока оригинал изменяется дальше.
Вариант Б: явно сохраняй изменения, которые должны быть персистентными. Каждое в отдельности.
Вариант В: Используй память, отображаемую на диск. Тогда ОС сама будет периодически сбрасывать изменившиеся страницы памяти на диск (хотя есть метод flush()).
Но в этом случае может потребоваться изменить структуру данных, избавившись по максимуму от сложных объектов типа словарей и заменив их на простые массивы байт. Если нужны структуры, то их придётся распаковывать с помощью struct. Т.е. опять приходим к тому, что структура не должна быть сложной.

Есть ли какие то варианты вызвать деструктор принудительно кроме обязательного использования контекстного менеджера?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт