Столкнулся с проблемой при парсинге Яндекса - частая капча, очень частая. Использование различных платных проксей не решает проблемы, так как некоторое время нет капч, после немного появляется (1-5), а далее 15 и выше, что влияет на скорость.
Есть ротация проксей, учитываются куки, но частые капчи никак не уходят.
Может у кого есть подобный опыт или направление, которое поможет справиться с частыми капчами при парсинге выдачи Яндекса?
Очевидно, что качество прокси незначительно влияет на появление капчи. Тут в первую очередь играет роль поведенческий фактор (вы циклически проделываете одни и те же манипуляции) и это конечно усугубляется тем фактором, что для яндекса вы совершенно новый клиент (новая сессия).
Если нет возможности и/или желания поработать над алгоритмом парсера - просто купите в специальном сервисе разгадывание капчи.
Интересное предложение, но разгадывание капчи в автоматическом режиме без сервисов и чтобы все были корректно - есть.
Проблемы разгадать капчу никакой нет, поэтому просто купить разгадывание, которое и без того реализовано, увы, не решение проблемы с частым появлением капчи как таковой.
И да, проблема именно в самих прокси, пока свежие все хорошо, но быстро становятся "не вариант", отсюда и вопрос о том, какие взять хорошие прокси или как еще можно решить данный вопрос.
Geronom, диапазоны айпи адресов мобильных телефонов и сим карт как таковых у антифрод систем всего мира на хорошем счету из-за технических особенностей реализации сотовых сетей, а конкретнее - из за динамической выдачи айпи адресов клиентам
Наводку дал, остальные фишки сори стоят денег :)