Есть ли смысл в handles вместо сырых указателей для аллокации памяти в embedded устройствах?

Question

Catmengi @Catmengi

Зачем я это делаю? Просто потому что

Есть ли смысл в handles вместо сырых указателей для аллокации памяти в embedded устройствах?

Начну с небольшой предыстории, я хочу сделать КПК-подобное устройство на базе esp32s3 с поддержкой загрузки внешних приложений и многозадачностью, Т.к. в моей esp32s3 всего 8мб озу и нет виртуальной памяти + многозадачность + внешние приложения остро встает проблема фрагментации кучи. В теории можно использовать статическую память в приложениях но тогда ОЗУ может забиться очень быстро, поэтому появилась идея использовать handles вместо сырых указателей для работы с кучей как это делали классическая macOS, palmOS и 16 битные версии windows, т.к таким образом система имеет возможность передвинуть память в куче даже без поддержки виртуальной памяти. Но имеет ли смысл такой подход на esp32s3 с 8мб озу? Я знаю про сложность программирования с хэндлами вместо традиционного malloc/calloc (лично для меня это не будет большой проблемой, и вряд-ли это будет устройство под которое найдутся другие разработчики). И я вижу еще 1 плюс в использование handles, в них можно хранить метаданные об объекте, например его размер и тому подобное

Вопрос задан 16 июл.
2408 просмотров

19 комментариев

Подписаться 3 Средний 19 комментариев

res2001 @res2001

А где будете выделять память под handles? Судя по описанию это должен быть какой-то статический массив фиксированного размера не в общей куче.
Для борьбы с фрагментацией идея выглядит здравой. Но с другой стороны, возможно, лучше использовать какой-то аллокатор, в котором уже реализована логика дефрагментации.

Написано 16 июл.
Catmengi @Catmengi Автор вопроса

res2001, Можно использовать под handles статический массив и если его не будет хватать то выделять новый но уже из кучи, и насчет аллокатора, я планировал заранее выделить условно 4 мегабайта памяти и уже из нее выделять память через хэндлы, т.к куча понадобится для загрузки приложений, потоков freeRTOS, сети и т.п.

Написано 16 июл.
Catmengi @Catmengi Автор вопроса

res2001, Логика дефрагментации есть и в стандартном аллокаторе из esp-idf но от маленькой долго живущей аллокации в середине кучи он не защитит, потому что без полноценной виртуальной памяти такое сделать невозможно(или крайне сложно)

Написано 16 июл.
res2001 @res2001

Catmengi, Если массив хэндлов выделять динамически в той же куче, то он сам будет попадать под операцию дефрагментации и может быть перемещен дефрагментатором и тогда все хэндлы станут не действительны.
В таком случае вам, видимо, надо будет делать 2 кучи. Одну по меньше для разных "системных" нужд, где память не будет принудительно дефрагментироваться и где аллокатор будет выдавать прямые указатели. И вторую на которой будет работать дефрагментатор и память будет выдаваться через хэндлы.
Ну или как-то по другому это обходить.
Думаю, что массив хэндлов, который нельзя перемещать, окажется не единственным подобным объектом в вашей системе.

Написано 16 июл.
Catmengi @Catmengi Автор вопроса

res2001, можно как системную кучу использовать обычный malloc/calloc из esp-idf. Насколько я помню 2 кучи реализовала и macos.

Написано 16 июл.
res2001 @res2001

Catmengi,
но от маленькой долго живущей аллокации в середине кучи он не защитит

Для дефрагментации "на лету" хэндлы выглядят нормальным решением.

Написано 16 июл.
Catmengi @Catmengi Автор вопроса

res2001, поэтому я про хэндлы и вспомнил, такая дефрагментация у меня будет происходить когда в куче свободного места больше или равно размеру необходимой аллокации а свободного места "подряд" меньше размера необходимой аллокации. (надеюсь я смогу написать нормальную и удобную имплементацию этих хэндлов на Си с поддержкой метаданных). И сразу вопрос про метаданные, тут есть 2 варианта их адресации: через enum значения что крайне быстро и сразу видно что поддерживается а что нет, или через строки (можно сделать define на строку чтобы было удобнее писать) где можно добавлять какие-то свойства к хэндлу которые не известны для ОС в compile time, например приложение добавляет какие-то свои метаданные, но тогда для каждого свойства в метаданных необходимо будет делать free callback (что бы не городить костыли для очистки) и придется использовать структуру данных по типу хэштаблицы, которая может неплохо вызывать фрагментацию а она вероятно будет хранится в системной куче или массива но поиск в нем будет выполнятся медленнее

Написано 16 июл.
res2001 @res2001

Catmengi, Какие например метаданные могут быть не известны в compile time?
Если пользователю понадобятся добавить к хэндлу свои данные, то он просто объявит свою структуру, хэндл и метаданные положит в эту структуру. В общем как обычно делаются обертки вокруг системных функций.
Вообще в хэндле в качестве метаданных будет некая информация, которая будет необходима вашему дефрагментатору для работы. С их набором вы определитесь, когда будете его писать.
Пока же можно просто положить в структуру хэндла указатель на реальные данные.

Написано 16 июл.
Catmengi @Catmengi Автор вопроса

res2001, ну это тоже вариант (какие данные могут быть не известны в compile time еще не знаю, нет имплементации)

Написано 16 июл.
res2001 @res2001

А вы планируете вытесняемую многозадачность реализовывать или кооперативную? Ядер сколько на вашей железке?
При вытесняемой надо будет блокировать хэндл на мьютексе при попытке доступа к памяти по нему и освобождать после доступа.
В кооперативном варианте на одном ядре этого, видимо, можно избежать. На нескольких ядрах уже начнется конкуренция.

Написано 16 июл.
Catmengi @Catmengi Автор вопроса

res2001, 2 ядра по 240мгц, вытесняющая многозадачность, думаю использовать рекурсивный мьютекс и автоматическую разблокировку через __attribute__ cleanup. чтобы получить указатель надо будет сначала заблокировать хэндл

Написано 16 июл.
Catmengi @Catmengi Автор вопроса

res2001, кстати, насчет многозадачности в GUI я не знаю, т.к планировал делать его на LVGL, есть вариант ограничить количество одновременно работающих GUI приложений до 1, а вот количество приложений без GUI (которые скорее всего будут общаться через RPC, который должен неплохо работать в условиях одного адресного пространства) ограниченно не будет (ограничения будут только по памяти и от самой rtos под капотом)

P.S. или есть вариант написать свой рендерер для этой библиотеки

Написано 16 июл.
jcmvbkbc @jcmvbkbc

Т.к. в моей esp32s3 всего 8мб озу и нет виртуальной памяти

Вообще в нём есть MMU с 64-килобайтными страницами который может отображать до гигабайта флэша или PSRAM в 32-МБ окошки 0x3c000000..0x3e000000 и 0x42000000..0x44000000.
Вот мои заметки о формате и расположении записей этого MMU: wiki.osll.ru/doku.php/etc:users:jcmvbkbc:linux-xte...

Написано 17 июл.
Catmengi @Catmengi Автор вопроса

jcmvbkbc, он есть, да, но заставить кучу работать как на том же самом линуксе с mmu я считаю будет очень тяжело и больно, и наверное не только из-за отсутствия документации, но и из-за размера страницы (я думаю это будет очень затратно для кучи, где большая часть аллокаций будет меньше 64кб)

Написано 17 июл.

Catmengi @Catmengi Автор вопроса

res2001, сейчас начал работать над имплементацией, вот первая версия структуру данных для хэндлов

#include <stdatomic.h>
#include <pthread.h>
#include <stdint.h>

#define auto_unlock __attribute__((cleanup(NULL)));

enum{
    MM_HANDLE_REFCOUNT_METADATA,
    MM_HANDLE_SERIALIZE_FUNC,
    MM_HANDLE_DESERIALIZE_FUNC,
    MM_HANDLE_META_MAX,
}mm_metadata_blocks;

typedef struct{
    uint64_t huid; //handle unique ID
    void* metadata[MM_HANDLE_META_MAX]; //userdefined metadata;

    size_t alloc_size; //size of memory controlled by handle
    void* ptr;     //pointer to chunk of memory

    atomic_int refcount;
}mm_handle_metablock;

typedef struct{
    uint64_t huid; //after mm_handle invalidation it would be changed in metablock and all handles with huid != info->huid will cause assert!
    mm_handle_metablock* info;
}mm_handle;

Написано 17 июл.

res2001 @res2001

Catmengi, huid для 8 Мб хватит и uint32 за глаза.
А где же мьютекс?

Написано 17 июл.

Catmengi @Catmengi Автор вопроса

res2001, мьютекс уже решил вернуть, счетчик ссылок обратно в метаданные переместил

enum{
    MM_HANDLE_REFCOUNT,
    MM_HANDLE_REFCOUNT_METADATA,
    MM_HANDLE_SERIALIZE_FUNC,
    MM_HANDLE_DESERIALIZE_FUNC,
    MM_HANDLE_META_MAX,
}mm_metadata_blocks;

typedef struct{
    int huid; //handle unique ID
    uintptr_t metadata[MM_HANDLE_META_MAX]; //userdefined metadata;

    size_t alloc_size; //size of memory controlled by handle
    void* ptr;     //pointer to chunk of memory

    pthread_mutex_t recursive_lock;

    bool used;
}mm_handle_metablock;

typedef struct{
    int huid; //after mm_handle invalidation it would be changed in metablock and all handles with huid != info->huid will cause assert!
    mm_handle_metablock* info;
}mm_handle;


#define HANDLE_HEAP_SIZE (4 * 1024 * 1024)
#define HANDLE_HEAP_MINALLOC 256

static pthread_mutex_t g_heap_mutex = PTHREAD_MUTEX_INITIALIZER;
static mm_handle_metablock g_handle_metablocks[HANDLE_HEAP_SIZE / HANDLE_HEAP_MINALLOC] = {0};
static uint8_t g_handle_heap[HANDLE_HEAP_SIZE] = {0};

static size_t g_availibe_memory = HANDLE_HEAP_SIZE;
static size_t g_largest_block = HANDLE_HEAP_SIZE;

Написано 17 июл.

Catmengi @Catmengi Автор вопроса

res2001, если вам интересно, вот финальная имплементация, там есть несколько "оссобенностей", например то что 2 потока не могут одновременно блокировать handle, но я считаю что это будет лучше, ведь меньше смогу накосячить с этим в будущем

Написано 20 июл.
res2001 @res2001

Catmengi,
2 потока не могут одновременно блокировать handle

Это лишнее, на мой взгляд. Это должно решать приложение. С таким подходом вы заранее объявляете все данные в куче разделяемым ресурсом, даже если они не являются такими (вышестоящее приложение однопоточное).
Ваш мьютекс должен использоваться только для переноса памяти в другое место. Тут больше подойдет rwlock, где read блокировка будет захватываться потоками при доступе к данным, а write блокировка - дефрагментатором.

Написано 01 авг.

Помогут разобраться в теме Все курсы

Яндекс Практикум

Разработчик C++

9 месяцев

Далее
Яндекс Практикум

Разработчик C++ расширенный

12 месяцев

Далее
Яндекс Практикум

Мидл разработчик С++

4 месяца

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Ноутбуки

+1 ещё

Средний
Почему при замене ОЗУ на старом ноутбуке не запускается Windows?
- 2 подписчика
- 29 окт.
- 207 просмотров
3

ответа
C

Средний
Почему мой лексер выдает неизвестные токены?
- 1 подписчик
- 25 окт.
- 120 просмотров
1

ответ
Linux

+1 ещё

Простой
Какой самый стабильный и лучший вариант собрать QUIC для curl [cross-compilation]?
- 1 подписчик
- 14 окт.
- 138 просмотров
0

ответов
Linux

+3 ещё

Средний
Как портировать U-boot на ASR1803?
- 5 подписчиков
- 06 окт.
- 260 просмотров
0

ответов
Windows

+1 ещё

Средний
Почему Windows жадно использует ОЗУ?
- 5 подписчиков
- 05 окт.
- 4973 просмотра
5

ответов
C++

+1 ещё

Простой
Как обезопасить секрет в памяти?
- 2 подписчика
- 04 окт.
- 316 просмотров
3

ответа
Микроконтроллеры

+3 ещё

Средний
Как открыть таблицу регистров периферии в gdb (openocd)?
- 3 подписчика
- 24 сент.
- 109 просмотров
0

ответов
Компьютеры

+2 ещё

Простой
За счёт чего быстрее работает компьютер?
- 1 подписчик
- 21 сент.
- 560 просмотров
6

ответов
Windows

+2 ещё

Простой
Почему запуск процесса через CreateProcess() может очень медленно выполняться?
- 1 подписчик
- 18 сент.
- 234 просмотра
1

ответ
C

Простой
Почему на запускается Valgrind?
- 1 подписчик
- 13 сент.
- 105 просмотров
1

ответ
Показать ещё Загружается…

QA automation (C#)

Альфа-Банк • Москва

от 200 000 до 350 000 ₽

C++ разработчик (Поиск)

Сбер • Москва

от 250 000 до 400 000 ₽

QA Automation Engineer (C#)

Centicore Group • Москва

До 300 000 ₽

А где будете выделять память под handles? Судя по описанию это должен быть какой-то статический массив фиксированного размера не в общей куче.
Для борьбы с фрагментацией идея выглядит здравой. Но с другой стороны, возможно, лучше использовать какой-то аллокатор, в котором уже реализована логика дефрагментации.
res2001, Можно использовать под handles статический массив и если его не будет хватать то выделять новый но уже из кучи, и насчет аллокатора, я планировал заранее выделить условно 4 мегабайта памяти и уже из нее выделять память через хэндлы, т.к куча понадобится для загрузки приложений, потоков freeRTOS, сети и т.п.
res2001, Логика дефрагментации есть и в стандартном аллокаторе из esp-idf но от маленькой долго живущей аллокации в середине кучи он не защитит, потому что без полноценной виртуальной памяти такое сделать невозможно(или крайне сложно)
Catmengi, Если массив хэндлов выделять динамически в той же куче, то он сам будет попадать под операцию дефрагментации и может быть перемещен дефрагментатором и тогда все хэндлы станут не действительны.
В таком случае вам, видимо, надо будет делать 2 кучи. Одну по меньше для разных "системных" нужд, где память не будет принудительно дефрагментироваться и где аллокатор будет выдавать прямые указатели. И вторую на которой будет работать дефрагментатор и память будет выдаваться через хэндлы.
Ну или как-то по другому это обходить.
Думаю, что массив хэндлов, который нельзя перемещать, окажется не единственным подобным объектом в вашей системе.
res2001, можно как системную кучу использовать обычный malloc/calloc из esp-idf. Насколько я помню 2 кучи реализовала и macos.
Catmengi,
но от маленькой долго живущей аллокации в середине кучи он не защитит

Для дефрагментации "на лету" хэндлы выглядят нормальным решением.
res2001, поэтому я про хэндлы и вспомнил, такая дефрагментация у меня будет происходить когда в куче свободного места больше или равно размеру необходимой аллокации а свободного места "подряд" меньше размера необходимой аллокации. (надеюсь я смогу написать нормальную и удобную имплементацию этих хэндлов на Си с поддержкой метаданных). И сразу вопрос про метаданные, тут есть 2 варианта их адресации: через enum значения что крайне быстро и сразу видно что поддерживается а что нет, или через строки (можно сделать define на строку чтобы было удобнее писать) где можно добавлять какие-то свойства к хэндлу которые не известны для ОС в compile time, например приложение добавляет какие-то свои метаданные, но тогда для каждого свойства в метаданных необходимо будет делать free callback (что бы не городить костыли для очистки) и придется использовать структуру данных по типу хэштаблицы, которая может неплохо вызывать фрагментацию а она вероятно будет хранится в системной куче или массива но поиск в нем будет выполнятся медленнее
Catmengi, Какие например метаданные могут быть не известны в compile time?
Если пользователю понадобятся добавить к хэндлу свои данные, то он просто объявит свою структуру, хэндл и метаданные положит в эту структуру. В общем как обычно делаются обертки вокруг системных функций.
Вообще в хэндле в качестве метаданных будет некая информация, которая будет необходима вашему дефрагментатору для работы. С их набором вы определитесь, когда будете его писать.
Пока же можно просто положить в структуру хэндла указатель на реальные данные.
res2001, ну это тоже вариант (какие данные могут быть не известны в compile time еще не знаю, нет имплементации)
А вы планируете вытесняемую многозадачность реализовывать или кооперативную? Ядер сколько на вашей железке?
При вытесняемой надо будет блокировать хэндл на мьютексе при попытке доступа к памяти по нему и освобождать после доступа.
В кооперативном варианте на одном ядре этого, видимо, можно избежать. На нескольких ядрах уже начнется конкуренция.
res2001, 2 ядра по 240мгц, вытесняющая многозадачность, думаю использовать рекурсивный мьютекс и автоматическую разблокировку через __attribute__ cleanup. чтобы получить указатель надо будет сначала заблокировать хэндл
res2001, кстати, насчет многозадачности в GUI я не знаю, т.к планировал делать его на LVGL, есть вариант ограничить количество одновременно работающих GUI приложений до 1, а вот количество приложений без GUI (которые скорее всего будут общаться через RPC, который должен неплохо работать в условиях одного адресного пространства) ограниченно не будет (ограничения будут только по памяти и от самой rtos под капотом)

P.S. или есть вариант написать свой рендерер для этой библиотеки
Т.к. в моей esp32s3 всего 8мб озу и нет виртуальной памяти

Вообще в нём есть MMU с 64-килобайтными страницами который может отображать до гигабайта флэша или PSRAM в 32-МБ окошки 0x3c000000..0x3e000000 и 0x42000000..0x44000000.
Вот мои заметки о формате и расположении записей этого MMU: wiki.osll.ru/doku.php/etc:users:jcmvbkbc:linux-xte...
jcmvbkbc, он есть, да, но заставить кучу работать как на том же самом линуксе с mmu я считаю будет очень тяжело и больно, и наверное не только из-за отсутствия документации, но и из-за размера страницы (я думаю это будет очень затратно для кучи, где большая часть аллокаций будет меньше 64кб)
res2001, сейчас начал работать над имплементацией, вот первая версия структуру данных для хэндлов

#include <stdatomic.h> #include <pthread.h> #include <stdint.h> #define auto_unlock __attribute__((cleanup(NULL))); enum{ MM_HANDLE_REFCOUNT_METADATA, MM_HANDLE_SERIALIZE_FUNC, MM_HANDLE_DESERIALIZE_FUNC, MM_HANDLE_META_MAX, }mm_metadata_blocks; typedef struct{ uint64_t huid; //handle unique ID void* metadata[MM_HANDLE_META_MAX]; //userdefined metadata; size_t alloc_size; //size of memory controlled by handle void* ptr; //pointer to chunk of memory atomic_int refcount; }mm_handle_metablock; typedef struct{ uint64_t huid; //after mm_handle invalidation it would be changed in metablock and all handles with huid != info->huid will cause assert! mm_handle_metablock* info; }mm_handle;
Catmengi, huid для 8 Мб хватит и uint32 за глаза.
А где же мьютекс?
res2001, мьютекс уже решил вернуть, счетчик ссылок обратно в метаданные переместил

enum{ MM_HANDLE_REFCOUNT, MM_HANDLE_REFCOUNT_METADATA, MM_HANDLE_SERIALIZE_FUNC, MM_HANDLE_DESERIALIZE_FUNC, MM_HANDLE_META_MAX, }mm_metadata_blocks; typedef struct{ int huid; //handle unique ID uintptr_t metadata[MM_HANDLE_META_MAX]; //userdefined metadata; size_t alloc_size; //size of memory controlled by handle void* ptr; //pointer to chunk of memory pthread_mutex_t recursive_lock; bool used; }mm_handle_metablock; typedef struct{ int huid; //after mm_handle invalidation it would be changed in metablock and all handles with huid != info->huid will cause assert! mm_handle_metablock* info; }mm_handle; #define HANDLE_HEAP_SIZE (4 * 1024 * 1024) #define HANDLE_HEAP_MINALLOC 256 static pthread_mutex_t g_heap_mutex = PTHREAD_MUTEX_INITIALIZER; static mm_handle_metablock g_handle_metablocks[HANDLE_HEAP_SIZE / HANDLE_HEAP_MINALLOC] = {0}; static uint8_t g_handle_heap[HANDLE_HEAP_SIZE] = {0}; static size_t g_availibe_memory = HANDLE_HEAP_SIZE; static size_t g_largest_block = HANDLE_HEAP_SIZE;
res2001, если вам интересно, вот финальная имплементация, там есть несколько "оссобенностей", например то что 2 потока не могут одновременно блокировать handle, но я считаю что это будет лучше, ведь меньше смогу накосячить с этим в будущем
Catmengi,
2 потока не могут одновременно блокировать handle

Это лишнее, на мой взгляд. Это должно решать приложение. С таким подходом вы заранее объявляете все данные в куче разделяемым ресурсом, даже если они не являются такими (вышестоящее приложение однопоточное).
Ваш мьютекс должен использоваться только для переноса памяти в другое место. Тут больше подойдет rwlock, где read блокировка будет захватываться потоками при доступе к данным, а write блокировка - дефрагментатором.

Есть ли смысл в handles вместо сырых указателей для аллокации памяти в embedded устройствах?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт