Скопировать сайт с wget или httrack со скачкой скриптов с внешних сайтов?

Question

Дмитрий Соколов @flager

Wget

Скопировать сайт с wget или httrack со скачкой скриптов с внешних сайтов?

Всем привет!

Хочу скачать сайт типа:

<!DOCTYPE HTML>
<html lang="ru">
<head>
....
<link rel="stylesheet" href="//google.com/css/style.min.css">
<script src="https://yandex.ru/js/script.min.js"></script>
....
</head>
<body>
....
<a href="/catalog-2/">Другая страница данного сайта</a>
....
</body>

Мне нужно чтобы не было рекурсивной скачки, чтобы не переходила по ссылкам данного сайта (не качала "catalog-2"), НО скачивала все файлы стилей, шрифтов, картинок и т.д. с внешних сайтов (как стили и скрипты google и yandex на примере выше).

Перечитал все документации, перепробовал все параметры, но ничего не выходит.

Вопрос задан более трёх лет назад
314 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик с нуля

6 месяцев

Далее
Skillfactory

DevOps-инженер

6 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Windows

+2 ещё

Простой
Как скопировать сайт с помощью PowerShell на Windows 11?
- 1 подписчик
- 13 февр.
- 1354 просмотра
2

ответа
Windows

+1 ещё

Средний
Не работает Wget на Windows 11?
- 1 подписчик
- 10 янв.
- 547 просмотров
2

ответа
Wget

Средний
Как скачать файлы с директории сайта, если не знаешь имени файлов?
- 2 подписчика
- 23 дек. 2024
- 467 просмотров
2

ответа
Wget

Простой
Как укоротить путь к файлу при скачивании через wget?
- 1 подписчик
- более года назад
- 114 просмотров
2

ответа
Wget

Простой
Как загружать правильно через wget файлы, у которых названия одинаковые, но регистр разный?
- 1 подписчик
- более года назад
- 195 просмотров
1

ответ
Парсинг

+1 ещё

Средний
Как выкачать все gif с сайта?
- 1 подписчик
- более года назад
- 365 просмотров
2

ответа
Wget

Простой
Можно ли в Wget сохранять файл по имени запроса?
- 1 подписчик
- более года назад
- 29 просмотров
0

ответов
Linux

+1 ещё

Средний
Как выкачать часть сайта через wget?
- 2 подписчика
- более года назад
- 276 просмотров
2

ответа
Wget

Средний
Как совместить в опциях wget -nc и -k?
- 1 подписчик
- более двух лет назад
- 59 просмотров
0

ответов
Wget

Сложный
Как ускорить wget, убрав подозрительные страницы из списка с символами \&quot; но не \&quot;\&quot;?
- 1 подписчик
- более двух лет назад
- 101 просмотр
0

ответов
Показать ещё Загружается…

Ведущий разработчик, С++

U-System • Москва

от 220 000 ₽

Системный аналитик

Data World • Москва

от 180 000 до 210 000 ₽

Старший системный администратор

Mindbox • Ереван

от 175 000 до 350 000 ₽

Answer 1 · 2021-01-24 01:17:09

Как вариант, можно спарсить (с помощью grep / sed / awk) все внешние ссылки на странице (предварительно загрузив страницу, например, через curl) и дальше уже по этим ссылкам пройтись wget'ом в цикле. Но это уже тянет на целый скрипт.

Скопировать сайт с wget или httrack со скачкой скриптов с внешних сайтов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт