@san_m_m

Как скачать файл?

Добрый день!

Мне нужно открыть файл под названием "Реестр выданных разрешений на осуществление деятельности по перевозке пассажиров и багажа легковым такси на территории Сахалинской области" на странице https://mintrans.sakhalin.gov.ru/about/rezultaty-d...
Изначально планировал сделать в лоб через:
url = 'https://mintrans.sakhalin.gov.ru/about/rezultaty-dejatelnosti/reestry/'
r = requests.get(url )
#а дальше бы через суп или регулярное выражение вытащил ссылку

Но что-то, видимо, этот способ здесь не подходит.
  • Вопрос задан
  • 84 просмотра
Решения вопроса 1
herypank
@herypank
У меня все получилось :)
url = 'https://mintrans.sakhalin.gov.ru/about/rezultaty-dejatelnosti/reestry/'
user_agent_val = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36'
r = requests.get(url, headers = {
    'User-Agent': user_agent_val
})

У тебя просто вылетает 403(т.к не указан юзер агент), поэтому ты на сайт попасть не можешь. Если остались вопросы пиши. Дополню ответ.
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
В данном случае вытащить ссылку можно через браузер (например используя selenium)
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы