Задать вопрос
@Printip

Как задать регулярку wget?

Здравствуйте! При скачивании сайта я получаю ссылки вида:

https://site.com/&sl=&sp=nmt4&tl=&u=https://site.org/?832947r
https://site.com/&sl=&sp=nmt4&tl=&u=https://site.net/?832947r
https://site.com/&sl=&sp=nmt4&tl=&u=https://site.biz/?832947r
https://site.com/&sl=&sp=nmt4&tl=&u=https://site.ru/?832947r
https://site.com/&sl=&sp=nmt4&tl=&u=https://site.biz/?832947r

Подскажите пожалуйста как указать wget-у чтобы он скачивал страницы только если в ссылке присутствует текст site.biz
  • Вопрос задан
  • 771 просмотр
Подписаться 1 Простой Комментировать
Помогут разобраться в теме Все курсы
  • Нетология
    Специалист по информационной безопасности + нейросети
    12 месяцев
    Далее
  • Академия Эдюсон
    Python-разработчик + ИИ
    9 месяцев
    Далее
  • ProductStar × РБК
    Профессия: Инженер по информационной безопасности + ИИ
    9 месяцев
    Далее
Пригласить эксперта
Ответы на вопрос 1
Skiphog
@Skiphog
Crutch developer
Если посмотреть
wget --help
Там есть параметры
--accept-regex=РЕГВЫР - регулярное выражение для разрешённых URL
--reject-regex=РЕГВЫР - регулярное выражение для запрещённых URL

Пробовали?
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы