Скачать pdf файл по ссылке на скачивание в python?
Есть ссылка https://www.cian.ru/export/pdf/rent/flat/262482762/ . Если перейти по ней, то откроется страница, которая запустит скачку пдф файла и страница мгновенно закроется. Есть ли способ скачать этот файл в нужную папку через python?
Пытался отправить get запрос с помощью библиотеки requests, выдаёт только response 200, файл при этом не скачивается.
AVKor, с чего вы это взяли? по ссылке - именно PDF, даже wget-ом скачивается.
ТС, поди, "w" вместо "wb" написал - вот и покалечил содержимое.
Впрочем, сайт может быть за защитой от DDoS - это она подсовывает недоверенным сетям капчу.
AVKor, если ваш российский IP принадлежит опсосам, а VPS-ка в облаке, где можно дешево забубенить себе VPN - ничего удивительного, что на то и другое защита делает стойку.
Повторюсь, я ткнулся браузером в ссылку - стал скачиваться файл. При том, что на ЦИАНе я сто лет не бывал и никаких идентифицирующих кук в запросе не передавалось (я проверил).
Ткнулся туда же wget-ом - получил файл. Wget обозвал его index.html, но внутри была корректная PDF, evince ее открыл без всяких возражений и показал все четыре страницы.
Adamos, Ну и что дальше-то? Зависимость от IP, вами предлагаемая, не особо подтверждается. Или следует предположить, что у меня пара IP (весьма, мягко говоря, разных, была заблокирована).