Smartaleck
@Smartaleck

Как скачать все файлы pdf с сайта с помощью Python?

Привет. Задача выкачать все пдфники с сайта. Они находятся на разных страницах. Тоесть скрипт должен обойти все страницы сайта и скачать файлы
  • Вопрос задан
  • 165 просмотров
Пригласить эксперта
Ответы на вопрос 1
@Filart97
Ну, нужно спарсить первую страницу сайта. Найти на ней все pdf поиском по тексту или по ссылкам/кнопкам на странице, смотря как там файлы представлены для скачивания.
Также найти на этой странице пагинацию и в ней - ссылку на следующую страницу.
Все это рекурсивно запустить, условие выхода - когда ссылка на след страницу не найдена.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы