Выполняю парсинг сайта с предварительной авторизацией через библиотеку
requests. Дошёл до момента скачивания файла по ссылке вида
https://somesite.org/download.php?id=433
Проблема в том, что такая ссылка требует предварительной инициализации (
как, кстати, такие ссылки называются по-английски?) - т.е. сначала обращаешься к ссылке, а далее выдается сам файл на скачивание.
Был
тут, не помогло, ибо сюда
local_filename
передается не само название файла, а кусок ссылки (в моем примере это "download.php?id=433").
Нашёл
это, однако там предлагается использовать библиотеку
urllib, но дело в том, что я работаю из-под
requests и переделываться на
urllib не хочу (да и
requests как бы стандартом считается, что ли), а
urllib, к сожалению, не знает ничего про сессию (куки), созданную библиотекой
requests и, соответственно, ничего скачать вот таким образом:
urllib.request.urlretrieve(url, path_to_file)
не может, т.к. не имеет доступа к файлу.
Подскажите, пожалуйста, какие могут быть решения?
Спасибо!