Каков оптимальный вариант стратегии относительно разгадывания капчи с прокси/без при парсинге поисковой выдачи Яндекса?

Question

Petr41 @Petr41

Каков оптимальный вариант стратегии относительно разгадывания капчи с прокси/без при парсинге поисковой выдачи Яндекса?

Есть допустим 100000 поисковых фраз, по которым надо спарсить поисковую выдачу из Яндекса. Берется какая нибудь программа, умеющая это делать (например Key Collector) и начинается процесс парсинга, но Яндекс подсовывает свою капчу и на ее распознание будут тратиться деньги в сервисах. Так за капчу может накапать некоторая сумма, а как ее можно максимально сократить? Может я чего то не знаю или как то не так настраиваю процесс парсинга и для капчи обязательно нужно задействовать прокси сервера (которые тоже стоят денег), или выставить многосекундную задержку между запросами, чтобы Яндекс не подсовывал капчу?
Допустим с одного аккаунта парсить 100000 запросов может растянуться на неделю. А для нескольких аккаунтов потребуется покупать прокси (иначе Яндекс что то заподозрит, если запросы с разных аккаунтов, но с одного ip, и опять же подсунет капчу).
Допускаю что возможно даже существуют варианты с помощью бесплатного ПО разгадывать капчу, но пока нашел только xevil, у которого бесплатная версия, как оказалось, капчу Яндекса не разгадывает, а платная стоит 14000 рублей и это никуда не годится при малых объемах.

Вопрос задан более трёх лет назад
125 просмотров

4 комментария

Подписаться 1 Простой 4 комментария

Помогут разобраться в теме Все курсы

Skillbox

Интернет-маркетолог с нуля до PRO

4 месяца

Далее
Digital Skills Academy

Mini-MBA: Интернет-маркетолог

4 месяца

Далее
Rush Academy

Нейросети для SEO

1 месяц

Далее

Решения вопроса 1

2 комментария

Petr41 @Petr41 Автор вопроса

Как на закапчованность проверяются аккаунты?
Прокси как то дороговато стоят - это везде такие цены на подходящие прокси?
100000 фраз будут парситься дня три круглосуточно с такими задержками и на 5 аккаунтах с 5 прокси.
В таком ритме аккаунт наверно не то что за дни, а за минуты или часы станет подозрительным в глазах Яндекса и почти сразу закапчуется?

Написано более трёх лет назад
Дмитрий @pro100taa

Как на закапчованность проверяются аккаунты?

В кей коллекторе есть специальная проверка. Далее, можете провести пробный сбор и посмотреть.

Прокси как то дороговато стоят - это везде такие цены на подходящие прокси?

Те что дал - одни из самых дешевых

100000 фраз будут парситься дня три круглосуточно с такими задержками и на 5 аккаунтах с 5 прокси.

Тогда до 10 увеличьте

В таком ритме аккаунт наверно не то что за дни, а за минуты или часы станет подозрительным в глазах Яндекса и почти сразу закапчуется?

Совсем не обязательно. У меня сутками парсилось и без каптчи. Каптча будет редко. Не думаю, что больше 1 $ потратите.

Если серьезно собираетесь заниматься, то без вложений не обойтись.

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

React

+1 ещё

Средний
SEO оптимизация в React?
- 1 подписчик
- 21 дек.
- 92 просмотра
2

ответа
Поисковая оптимизация

Простой
Как вывести сайт из SEO песочницы (sandbox)?
- 1 подписчик
- 06 дек.
- 122 просмотра
2

ответа
Поисковая оптимизация

+1 ещё

Простой
Почему сбросились подтверждения права в Google Search Console?
- 1 подписчик
- 17 нояб.
- 107 просмотров
3

ответа
Поисковая оптимизация

Простой
Реклама через mp3, как повлияет на СЕО?
- 2 подписчика
- 04 нояб.
- 255 просмотров
2

ответа
WordPress

+1 ещё

Простой
Как убрать название сайта из выдаче (title)?
- 1 подписчик
- 03 нояб.
- 213 просмотров
3

ответа
Поисковая оптимизация

Сложный
Что будет если поставить 301 редирект в Яндексе таким образом?
- 2 подписчика
- 03 окт.
- 163 просмотра
1

ответ
Поисковая оптимизация

+1 ещё

Простой
Влияет ли наличие целей в метрике на ранжирование?
- 3 подписчика
- 01 окт.
- 192 просмотра
2

ответа
Поисковая оптимизация

+3 ещё

Простой
Нужна ли официальная маркировка покупаемых в SAPE ссылок как реклама?
- 1 подписчик
- 15 сент.
- 195 просмотров
2

ответа
WordPress

+1 ещё

Простой
Сильно ли влияет использование элементора на скорость загрузки сайта?
- 2 подписчика
- 06 сент.
- 505 просмотров
6

ответов
Поисковая оптимизация

Средний
Почему в сниппете не миниатюра, а рандомные картинки с сайта?
- 1 подписчик
- 02 сент.
- 137 просмотров
1

ответ
Показать ещё Загружается…

Менеджер проектов

Vital Partners • Москва

от 160 000 до 180 000 ₽

Database Administrator / Администратор PostgreSQL

Vital Partners

от 200 000 до 270 000 ₽

Technical support (Ассистент Product Owner)

uKit Group • Ростов-на-Дону

от 50 000 до 55 000 ₽

Есть ещё capmonster - аналог xevil. Также у них в облаке capmonster cloud - $0,8 за 1000
kot2566, capmonster с Key Collector будет работать, если воспользуюсь демонстрационным режимом?
kot2566, благодарю за Capmonster, думаю это то что мне нужно.

Answer 1 · 2021-10-20 13:04:07

Чтобы каптча не беспокоила в кей коллектор:

1. Выберите аккаунты и проверьте их на закапчованность. Оставьте только те, которые будут без каптчи.

2. Купите прокси (можно найти по 100 р. за штуку https://proxy-sale.com/russian-proxy.html). Хотя бы штук 5.

3. Выставьте время 15 - 20 сек.

Answer 2 · 2021-10-21 09:57:57

На такой объем надо брать несколько тысяч проксей резидентных, капчу пробовать гадать софтом типо ксевил или камонстр если они умеют гадать капчу Яндекс, затраты фиксированные выходят

Каков оптимальный вариант стратегии относительно разгадывания капчи с прокси/без при парсинге поисковой выдачи Яндекса?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт