Задать вопрос

Как показать страницу с hCaptcha в Jupyter Notebook?

Собираю данные с одного сайта, для небольшого исследования. В объеме чуть большем, чем бытовое пролистывание, и меньшем, чем злостный парсинг. Но вот капча вылызает.

Работаю в Google Colab, запрашиваю страницы с помощью requests, далее разбираю BeautifulSoup.

На каком-то этапе вместо запрошенной страницы получаю такую:
spoiler
<html>
<head>
<title>hCaptcha solve page</title>
<script async="" defer="" src="https://www.hcaptcha.com/1/api.js"></script>
</head>
<body>
<form action="/jobs?as_and=UX&amp;as_any=&amp;jt=all&amp;radius=25&amp;l=London&amp;fromage=all&amp;as_ttl=product%20manager&amp;limit=50&amp;psf=advsrch&amp;from=advancedsearch" method="POST">
<div class="h-captcha" data-sitekey="eb27f525-f936-43b4-91e2-95a426d4a8bd"></div>
<br/>
<input type="submit" value="Submit"/>
</form>
</body>
</html>


Можно ли как-то её отобразить в ноутбуке, чтобы вручную разгадать и двигаться дальше?
Или она не заработает вне назначенного домена и все бессмысленно и надо парсить Selenium'ом с прикрученной платной разгадывалкой?
  • Вопрос задан
  • 35 просмотров
Подписаться 1 Простой Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы