Задать вопрос
@Petr41

Каков оптимальный вариант стратегии относительно разгадывания капчи с прокси/без при парсинге поисковой выдачи Яндекса?

Есть допустим 100000 поисковых фраз, по которым надо спарсить поисковую выдачу из Яндекса. Берется какая нибудь программа, умеющая это делать (например Key Collector) и начинается процесс парсинга, но Яндекс подсовывает свою капчу и на ее распознание будут тратиться деньги в сервисах. Так за капчу может накапать некоторая сумма, а как ее можно максимально сократить? Может я чего то не знаю или как то не так настраиваю процесс парсинга и для капчи обязательно нужно задействовать прокси сервера (которые тоже стоят денег), или выставить многосекундную задержку между запросами, чтобы Яндекс не подсовывал капчу?
Допустим с одного аккаунта парсить 100000 запросов может растянуться на неделю. А для нескольких аккаунтов потребуется покупать прокси (иначе Яндекс что то заподозрит, если запросы с разных аккаунтов, но с одного ip, и опять же подсунет капчу).
Допускаю что возможно даже существуют варианты с помощью бесплатного ПО разгадывать капчу, но пока нашел только xevil, у которого бесплатная версия, как оказалось, капчу Яндекса не разгадывает, а платная стоит 14000 рублей и это никуда не годится при малых объемах.
  • Вопрос задан
  • 101 просмотр
Подписаться 1 Простой 4 комментария
Решения вопроса 1
pro100taa
@pro100taa
Чтобы каптча не беспокоила в кей коллектор:

1. Выберите аккаунты и проверьте их на закапчованность. Оставьте только те, которые будут без каптчи.

2. Купите прокси (можно найти по 100 р. за штуку https://proxy-sale.com/russian-proxy.html). Хотя бы штук 5.

3. Выставьте время 15 - 20 сек.
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
opium
@opium
Просто люблю качественно работать
На такой объем надо брать несколько тысяч проксей резидентных, капчу пробовать гадать софтом типо ксевил или камонстр если они умеют гадать капчу Яндекс, затраты фиксированные выходят
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы