Задать вопрос
Smartaleck
@Smartaleck

Как скачать все файлы pdf с сайта с помощью Python?

Привет. Задача выкачать все пдфники с сайта. Они находятся на разных страницах. Тоесть скрипт должен обойти все страницы сайта и скачать файлы
  • Вопрос задан
  • 177 просмотров
Подписаться 1 Простой Комментировать
Помогут разобраться в теме Все курсы
  • Яндекс Практикум
    Python-разработчик
    10 месяцев
    Далее
  • Skillbox
    Python-разработчик
    10 месяцев
    Далее
  • Нетология
    Fullstack-разработчик на Python + нейросети
    20 месяцев
    Далее
Пригласить эксперта
Ответы на вопрос 1
@Filart97
Ну, нужно спарсить первую страницу сайта. Найти на ней все pdf поиском по тексту или по ссылкам/кнопкам на странице, смотря как там файлы представлены для скачивания.
Также найти на этой странице пагинацию и в ней - ссылку на следующую страницу.
Все это рекурсивно запустить, условие выхода - когда ссылка на след страницу не найдена.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы