@Printip

Как задать регулярку wget?

Здравствуйте! При скачивании сайта я получаю ссылки вида:

https://site.com/&sl=&sp=nmt4&tl=&u=https://site.org/?832947r
https://site.com/&sl=&sp=nmt4&tl=&u=https://site.net/?832947r
https://site.com/&sl=&sp=nmt4&tl=&u=https://site.biz/?832947r
https://site.com/&sl=&sp=nmt4&tl=&u=https://site.ru/?832947r
https://site.com/&sl=&sp=nmt4&tl=&u=https://site.biz/?832947r

Подскажите пожалуйста как указать wget-у чтобы он скачивал страницы только если в ссылке присутствует текст site.biz
  • Вопрос задан
  • 747 просмотров
Пригласить эксперта
Ответы на вопрос 1
Skiphog
@Skiphog
Crutch developer
Если посмотреть
wget --help
Там есть параметры
--accept-regex=РЕГВЫР - регулярное выражение для разрешённых URL
--reject-regex=РЕГВЫР - регулярное выражение для запрещённых URL

Пробовали?
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы