обычно современные форматы файлы бывают:
-- бинарные
* по разному сериализованные через protobuf, BSON, свой бинарный manual coded формат
-- текстовые
* json, xml, yaml
exe содержит PE header и т.п.
doc специфичный формат для MS, его можно читать/писать специальными библиотеками