Тебе придётся:
1. Сделать HTTP-запрос к хабру и получить html разметку
2. Рекурсивно пройтись по html и css, загрузив все картинки и стили
3. Сохранить все эти файлы, сохранив структуру. Попутно поменяв пути, чтобы браузер потом смотрел на локальные файлы, а не в интернет.
С комментариями сложнее, так как они прогружаются динамически.
Кмк, проще будет запустить полновесный браузер, пролистать всю страницу, раскрыв все ветки комментариев со спойлерами, и сделать печать в PDF.
Ну и да, гораздо лучше с такой задачей справится какой-нибудь python или nodejs, вооружённые puppeteer или playwright