Почему проверка ссылки выдаёт ошибку 403?

Question

Дарья @darina46722

Почему проверка ссылки выдаёт ошибку 403?

Хочу спарсить сайт Beautiful Soup, но сервер против. Также проверила ссылки из вкладки "нетворкс" - ошибка остаётся. Кто знает как исправить ситуацию?

import requests
from bs4 import BeautifulSoup
import csv


def get_html(url):
    r = requests.get(url)
    if r.ok: 
        return r.text
    print(r.status_code)


def main():
    url = 'https://www.qoo10.sg/s/EYELASH?keyword=eyelash&keyword_auto_change=&curPage=5'
    get_html(url)



if __name__ == '__main__':
    main()

P.S. до этого спарсила сайт scrapy без проблем

Вопрос задан более трёх лет назад
190 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- вчера
- 68 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 232 просмотра
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 228 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 630 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 545 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 305 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 557 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 226 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 140 просмотров
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 339 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2019-11-04 13:27:26

Вы забыли про сессии - Вас просто банят из-за этого.

вот как будет правильно

import requests
from bs4 import BeautifulSoup
import csv

headers = {
	'accept': '*/*',
	'user-agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.120 Mobile Safari/537.36'

}

url = 'https://www.qoo10.sg/s/EYELASH?keyword=eyelash&keyword_auto_change=&curPage=5'
def get_html(base_url, headers):
	request = requests.get(url, headers=headers)
	if request.status_code == 200:
		print('OK')
	else:
		print('ERROR')
	return print(request.status_code)



get_html(url, headers)

Почему проверка ссылки выдаёт ошибку 403?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт