@Valentine5

Как обойти капчу при при парсинге на PHP?

Пишу парсер выдачи поиска с использованием Yanedx XML. Разместил парсер на хостинге. Конструкция парсера незамысловата: ссылки на материалы из выдачи попадают в функцию с курлом. Потом srtip_tags($articles), но на первой же ссылке вот:

INSERT INTO u0189754_default.parsed_articles(text,title) VALUES('Фонетика_древнеанглийского_языка', 'Ой!@media only screen and (min-width:651px){body{background-image:url('https://captcha-backgrounds...., что запросы отправляли вы, а не роботНам очень жаль, но запросы с вашего устройства похожи на автоматические. Почему это могло произойти?У вас отключено исполнение JavaScript. По нажатию вы будете направлены на дополнительную проверку. Как включить JavaScript?Я не роботНажмите, чтобы продолжитьYandex SmartCaptcha•Обработка данныхconnect-link-descriptionСайт с информацией об обработке данныхSmartCaptcha нужна проверка пользователяЕсли у вас возникли проблемы, пожалуйста, воспользуйтесь формой обратной связиconst button=document.getElementById("js-button");button.addEventListener("click",function n(t){window.__JS_BUTTON_CLICKED__=!0,this.removeEventListener("click",n,!1)},!1),window.onerror=function(n,t)

Подскажите, пожалуйста, что можно сделать, чтобы спарсить информацию?
  • Вопрос задан
  • 396 просмотров
Решения вопроса 1
Mike_Ro
@Mike_Ro
Python, JS, WordPress, SEO, Bots, Adversting
Конструкция парсера незамысловата

Вы действительно думали, что можно просто так прийти и 3 строчками кода спарсить ресурсы, где работают отдельные команды для того, чтобы их не парсили?

Подскажите, пожалуйста, что можно сделать, чтобы спарсить информацию?

Подключить сервис расшифровки капчи. С таким "незамысловатым" скриптом Вам придется достаточно часто пополнять счет этих сервисов :)
На прокси можете не тратиться, ибо Вас будут ловить раньше :)
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы