Как извлечь ссылку исходного кода сайта, используя Python?

Question

Suohit @Suohit

Python

Как извлечь ссылку исходного кода сайта, используя Python?

Есть сайт 1 "example.com/sometext/etc" (ненастоящий, просто для примера). На данной странице находится изображение, которое в свою очередь хранится на стороннем ресурсе. В исходном коде сайта 1 есть ссылка на источник этого изображения. Пытался извлечь исходный код страницы, используя библиотеку urllib:

import urllib.request


URL = 'http://example.com/sometext/etc'
site = urllib.request.urlopen(URL)
print(site.read())

После чего найти ссылку не составило бы труда. Но сайт выдаёт следующую ошибку: "urllib.error.HTTPError: HTTP Error 403: Forbidden", о её значении я знаю. Почему я не могу получить доступ к сайту таким образом, если доступ непосредственно из браузера к странице есть? Может я что-то делаю не так?

Вопрос задан более трёх лет назад
288 просмотров

2 комментария

Подписаться 1 Простой 2 комментария

s4q @s4q
Для создания запросов лучше использовать requests.

import requests resp = requests.get('http://example.com/sometext/etc').text print(resp)

А затем парсить через bs4
Написано более трёх лет назад
Suohit @Suohit Автор вопроса

s4q, это помогло, как ни странно. Перенесите ваш комментарий в ответы, чтобы я мог отметить его решением

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 198 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 512 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 483 просмотра
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 276 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 497 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 209 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 124 просмотра
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 330 просмотров
1

ответ
Python

Простой
Стоит ли переходить на IDE?
- 1 подписчик
- 25 мая
- 660 просмотров
5

ответов
Python

+2 ещё

Простой
Где хранить сессию SQLAlchemy в FastAPI: в конструкторе сервиса или передавать в каждый метод?
- 2 подписчика
- 23 мая
- 345 просмотров
1

ответ
Показать ещё Загружается…

Для создания запросов лучше использовать requests.

import requests resp = requests.get('http://example.com/sometext/etc').text print(resp)

А затем парсить через bs4
s4q, это помогло, как ни странно. Перенесите ваш комментарий в ответы, чтобы я мог отметить его решением

Answer 1 · 2020-09-22 20:44:41

Для создания запросов лучше использовать requests.

import requests

resp = requests.get('http://example.com/sometext/etc').text
print(resp)

А затем парсить через bs4

Answer 2 · 2020-09-22 20:25:59

soremix @SoreMix Куратор тега Python

yellow

Заголовки установите нужные, User-Agent и прочее

Ответ написан более трёх лет назад

Комментировать

Как извлечь ссылку исходного кода сайта, используя Python?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт