Задать вопрос
@luaPower

Как из браузера выгрузить всю страницу целиком?

Как известно, многие сайты ставят защиту на сохранение своих страниц стандартными средствами браузера (save page as). В таких случаях на помощь приходит панель разработчика и копирование всего содержимого тегов body или html. Но даже в этом случае почему-то не всегда удается получить весь контент страницы. Приходится пробираться через всю структуру html, отыскивая нужную таблицу и копируя ее вручную.

Может кто-нибудь объяснить, почему так получается? Ведь контент подгружен в браузер и доступен для визуального восприятия.

Но мой основной вопрос о другом. Какие посоветуете инструменты или средства для выгрузки целиком всей страницы, отображаемой браузером? Может быть есть какие-то плагины или это можно сделать с помощью JavaScript? Я не силен в последнем, поэтому буду признателен хотя бы за наводку (куда смотреть, что подучить для реализации поставленной задачи).
  • Вопрос задан
  • 12752 просмотра
Подписаться 1 Простой 1 комментарий
Решение пользователя hint000 К ответам на вопрос (3)
hint000
@hint000
у админа три руки
Затруднение связано с тем, что часть контента может генерироваться при исполнении JavaScript. И защита от копирования\сохранения реализована через JavaScript. Если отключить выполнение скриптов, то защита не будет работать, но тогда и часть контента не будет сгенерирована. Так что уже требуется разбираться в коде и выборочно отключать конкретные куски кода. И даже это не гарантирует успех во всех случаях. Если разработчик сильно заморочился на защите (такое встречается редко), то вам придётся ещё сильнее заморочиться на обходе защиты. Если нужен только контент, видимый глазом, то иногда проще будет сделать скриншот и прогнать его через OCR, чем тратить время на разборки с кодом.
Ответ написан
Комментировать