я практически уверен, что кто-то что-то подобное уже написал
писал давно для себя
такую подделку на perl, из внешних зависимостей — Image::ExifTool.
Только скачивает все ресурсы в сам html в виде datauri, кроме файлов больше 1MB (константу можно уменьшить внутри скрипта), их в отдельно в папку рядом.
JS/CSS превращает в инлайновые, чтобы скачивало js нужно запускать с -j.