@WebEditor

Как получить контент с Yandex без Яндекс.XML?

Добрый день.
Делали скрипт и наткнулись на проблему с яндексом:

Нам очень жаль, но запросы, поступившие с вашего IP-адреса, похожи на автоматические. По этой причине мы вынуждены временно заблокировать доступ к поиску.

Чтобы продолжить поиск, пожалуйста, введите символы с картинки в поле ввода и нажмите «Отправить».


В общем яндекс вместо контента вернул страницу с каптчей.

Используемый код:

echo file_get_contents("http://yandex.ru/yandsearch?text=мазда");


или
$url = "http://yandex.ru/yandsearch?text=мазда";
$ch = curl_init();
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
        curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
        curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 20);
        curl_setopt($ch, CURLOPT_ENCODING,'gzip,deflate');
        curl_setopt($ch, CURLOPT_URL, $url);
        curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows; U; Windows NT 6.1; ru; ru:1");
        $data = curl_exec($ch);
        curl_close($ch);
        echo $data;
  • Вопрос задан
  • 2609 просмотров
Пригласить эксперта
Ответы на вопрос 4
Lomoson
@Lomoson
Даже если использовать кучу прокси яндекс понемногу начинает их банить.
Затусуйтесь на форумах сеошников и купите/попросите дополнительные идиницы webmaster для Яндекс.XML.
Ответ написан
opium
@opium
Просто люблю качественно работать
разбирайте капчу через антигейт
используйте много прокси и впнов
Ответ написан
bigton
@bigton
Web-программист
Распознавание одной капчи удаленным сервисом может занимать 30-60 сек. Когда Яндекс поймет, что вы точно робот, он будет выдавать капчу на каждый запрос.
Работайте через XML, лимиты можно приобрести тут xmlstock.com/.
Все таки, если вы зарабатываете на продвижении, можете понести небольшие издержки на снятие позиций.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы