Необходима возможность выкачивать сайты с минимальными потерями внешнего вида(
*), при этом полноценное функционирование не очень важно.
Вопрос не касается каких-то конкретных сайтов, а любых. Понятно же, что более-менее полноценную выкачку любого сайта организовать сложно, но хочется хотя бы повысить процент таковых.
Вопрос:
1. Если решения, которые уже решают проблемы внешнего вида и качественной выкачки?
Типичный пример: если src вмещает в себе относительный путь - подгружать домен.
2. Есть ли вещи, на которые стоит сразу обратить внимание, при разработке подобного решения?
Важный критерий: необходимо чтобы решение было "одним файлом". То есть, не качало дополнительные CSS, JS на сервер. Например, чтобы подставляло ссылки с сайта-донора, либо добавляло код прямо в тело документа(пример: обнаруживаем подключение CSS=>Выкачиваем код=>Помещаем в тело документа между=>Затираем подключение.
P.S.
Тэг
base раньше серьёзно помогал в данном вопросе, но сейчас нет возможности его применять.
* - дабы загружась файлы, которые нужны для отображения страницы HTML. Пример: изображения, стили.
Т.е. чтобы не было большое визуальное отличие от оригинала(было схожее на ~70-80%)