Как парсить выдачу Google без блокировки (PHP + cURL)?
Парсю выдачу Гугла (только первую страницу выдачи), после примерно 30 запросов Гугл вываливает капчу. Можно ли парсить без блокировок, не используя прокси? Нужно, чтобы отработало ~1500 запросов не более чем за три часа.
Паузы между запросами ставил, браузероподобные заголовки отправлял.
АПИ (а именно Google Custom Search), насколько я понял, платный, бесплатно только 100 запросов в день: https://developers.google.com/custom-search/json-a...
For CSE users, the API provides 100 search queries per day for free.
На днях написали статью "How to check which URLs have been indexed by Google using Python"
Тут имеется в виду парсинг по списку URL, можно подшаманить и парсить по запросу.
Парсить с одного IP без блокировок не получится, но можно настроить сетку проксей на одну геолокацию для ровных результатов. А можно купить услуги готовых сервисов, например serpentine.io.