По загрузчику думаю надо делать так: находите PID процесса, потом OpenProcess и получаете hProcess, который указывает на начало загруженного образа. Потом, вероятно, нужно делать ReadProcessMemory для чтения заголовка, который начинается с IMAGE_DOS_HEADER. Находите IMAGE_NT_HEADERS, вычисляете смещение до начала таблицы секций. Читаете оную таблицу и разбирая IMAGE_SECTION_HEADER узнаете какие секции, куда, как с какими флагами загружены. Только процесс, скотина такая, может напрочь затереть все указанные данные после своего запуска.
Alexandre: Я еще раз попробую объяснить: объем данных - десятки байт. Над этой порцией данных нужно выполнить одну и ту же операцию миллиарды раз, максимально быстро. И операции эти производятся сотни тысяч раз в секунду на каждом процессорном ядре, коих сотни. Это несколько иной порядок цифр и никакому интерпретируемому коду (Py, Java, .NET и т.п.) в вычислениях тут не место. И это, определенно, высоконагруженные вычисления.
akalend: У меня данных 16 байт, например, но надо на них провернуть определенные операции несколько миллиардов раз как можно быстрее. И для таких задач куда как правильнее применять C в самих вычислениях.
globuzer: Ну это как раз исполнение нативного кода с оберткой на питоне :-) Но само вычислительное ядро я бы никогда не стал писать на интерпретируемом языке :-)
Не нужно паять кислотой там, где можно обойтись без нее. Нормальный припой с флюсом не потребует дополнительного флюса вообще. Даже канифоль для поделок не требует отмывки.