Правильно (наверное, я этим не пользуюсь) - заплатить и получить штатный функционал памяти, как этим пользоваться я не знаю но практически все топовые компании с этим экспериментируют.
Еще вариант, заплатить и пользоваться сервисом через API, чем то типа openweb ui, как минимум там есть возможность клонировать беседу, редактировать ее по сообщениям и т.п. так же там есть возможность прикрутить свои утилиты, в общем есть где разгуляться.
Ну и вариант, универсальный, последним сообщением в беседе, просите модель дать самморизацию вашего диалога, пусть выделит важные моменты, факты (собственно то каким вы создадите этот промпт, и даст вам нужный функционал), например можно клонировать беседу (сохранить на потом), попросить выделить из склонированной беседы нужные знания по теме, полученный ответ скопировать в новое окно а это удалить (останется клон), в последствии можно снова к сохраненной версии вернуться, составить другой запрос...