Как с помощью Wget скачать список файлов по маске с сайта с авторизацией?
Добрый день!
Очень прошу помощи у сведующих, кто знаком с Wget. Я в этом деле новичок и очень замучался.
Необходима помощь с пакетной закачкой файлов.
Нужно скачать файлы определенных форматов из известного диапазона линков по которым находятся разные типы файлов и нужно закачать все файлы за исключением mp3, ogg и тд. Нужны только файлы pdf и zip. Какой по ссылке тип файла точно неизвестно.
Ссылки формата хттп://сайт/books/download?id=1789 и далее нумерация в конце. Большая просьба помочь с написанием команды для Wget.
Сайт с авторизацией. Логин и пароль имеются.
Пробовал написать такую команду
wget --no-check-certificate --user=xxx --password=xxx -i c:\url-list.txt --secure-protocol=auto -nc -c -P c:\files\
, но в папку сохраняются файлы по 57кб такого формата download@id=6008.
Буду признателен за помощь!
В download master и Offline explorer логин и пароль нормально подхватывает и все качает хорошо и список ссылок из txt файла и групповую загрузку массива, вопрос только в том, чтобы выкачать нужные форматы файлов, исключив остальные. Но в ссылках расширения не указаны.
А можно как-нибудь вытянуть с сайта все ссылки, которые ссылаются на нужный формат файла? Например, если на сайте есть кнопки скачать pdf, скачать zip и тд. То есть по скрипту собрать ссылки с форматами pdf и zip и исключить все остальные?