Можно ли скачать все pdf файлы с сайта?

Question

Рустам Идрисов @RustaMechanic

Разработчик, студент, кодер

Автоматизация

Можно ли скачать все pdf файлы с сайта?

Добрый день, очень надеюсь на помощь!

Суть: есть адрес сайта, на которым есть несколько pdf документов (нет названий, только *.pdf). Они доступны для всех пользователей (без авторизации).

Нужно их скачать, т.к. их много, а "ручками" очень долго нужно будет лазить по сайту.

Со скриптами я знаком, но понимаю, что ведь "если бы я был вредителем", то мог бы сожрать кучу трафика, поставив скачивание файла на цикл. В общем могу ли я это сделать (как) и в чем могут быть проблемы, если таких сайтов несколько?

Вопрос задан более трёх лет назад
14481 просмотр

Комментировать

Подписаться 1 Оценить Комментировать

Решения вопроса 1

3 комментария

Рустам Идрисов @RustaMechanic Автор вопроса

Вообще, суть именно в скрипте, потому что потом нужно будет обработать (около) еще 300+ сайтов.
И 2 проблема, сейчас понял - скачивание доступно-то для "всех", но из-за куки. А получаеся если брать скрипт, то он должен сначала получить куки?

Тут либо, конечно, ручками в итоге придется, либо скрипт. Исходные данные - это тупо адрес (корень сайта, получается). Вот и хочу понять, на сколько реалено уйти от "ручек".

Написано более трёх лет назад
Алексей @alsopub

Рустам Идрисов: В любом случае - это реально, другой вопрос - на сколько сложно. Надо смотреть сами сайты.

Написано более трёх лет назад
Рустам Идрисов @RustaMechanic Автор вопроса

Алексей: Лёха, спасибо!

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Автоматизация

+1 ещё

Простой
Как изучать SCADA и программирование ПЛК самостоятельно дома?
- 1 подписчик
- 19 сент.
- 64 просмотра
1

ответ
Python

+1 ещё

Простой
Как имитировать нажатие пкм в неактивное окно DirectX?
- 1 подписчик
- 15 авг.
- 82 просмотра
1

ответ
Автоматизация

+1 ещё

Средний
Как парсить/взять результат решения капчи в BAS?
- 1 подписчик
- 09 авг.
- 65 просмотров
0

ответов
Автоматизация

Простой
Для чего нужна программа Hetic X.1000?
- 1 подписчик
- 06 авг.
- 128 просмотров
0

ответов
Автоматизация

+1 ещё

Сложный
Из конструктора АСУТП в инженера АСУТП?
- 4 подписчика
- 30 июл.
- 2101 просмотр
2

ответа
YouTube

+1 ещё

Средний
Как загружать на YouTube массово ролики / Вести много каналов?
- 1 подписчик
- 01 июл.
- 331 просмотр
1

ответ
Автоматизация

Средний
Существует ли такой кликер?
- 1 подписчик
- 22 июн.
- 233 просмотра
1

ответ
Python

+2 ещё

Простой
Почему происходит Блокировка доступа при использовании Selenium для парсинга?
- 2 подписчика
- 16 июн.
- 309 просмотров
3

ответа
Железо

+1 ещё

Простой
На сколько сегодня актуально применение аналоговых термодатчиков в автоматике?
- 1 подписчик
- 05 июн.
- 258 просмотров
3

ответа
WordPress

+2 ещё

Средний
Можно ли развернуть многошаговую ИИ-генерацию контента на WP?
- 1 подписчик
- 16 мая
- 307 просмотров
2

ответа
Показать ещё Загружается…

Разработчик 1С (Комплексная автоматизация)

Cicada

от 4 500 до 4 500 $

Аналитик (автоматизация производства, 1С:АСТОР)

SMALL • Алматы

от 800 000 до 1 300 000 ₸

Team Lead | Команда автоматизации производства

SMALL

от 4 000 до 6 000 $

Answer 1 · 2016-06-12 00:05:55

Если сайт хорошо проиндексирован в Яндексе, можете попробовать "Расширенный поиск" по сайту среди pdf документов - https://yandex.ru/search/?text=&lr=5&site=site.ru&...
Если повезет - получите ссылки на все файлы.
Точнее можно сказать увидев сайт, возможно на нем pdf лежат в одном каталоге с открытым индексом.

Answer 2 · 2016-06-14 02:32:45

Павел @pbt39

когда-то я использовал для этого программу https://ru.wikipedia.org/wiki/Teleport_Pro

Ответ написан более трёх лет назад

Комментировать

Можно ли скачать все pdf файлы с сайта?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт