@Zimaell

Как лучше парсить через прокси сервера?

купил на good-proxies.ru прокси и использовал для curl но вот такую вот ошибку мне показывает

HTTP/1.0 501 Tor is not an HTTP Proxy Content-Type: text/html; charset=iso-8859-1

сам запрос таков

$ch=curl_init();
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch,CURLOPT_TIMEOUT,60);
curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,60); 
curl_setopt($ch,CURLOPT_FOLLOWLOCATION,FALSE);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,TRUE);
curl_setopt($ch,CURLOPT_SSL_VERIFYPEER,FALSE);
curl_setopt($ch,CURLOPT_SSL_VERIFYHOST,FALSE);
curl_setopt($ch,CURLOPT_HEADER,TRUE);
curl_setopt($ch,CURLOPT_POST,FALSE);
curl_setopt($ch,CURLOPT_PROXY,$proxy_ip);
curl_setopt($ch,CURLOPT_PROXYPORT,$proxy_port);
curl_close($ch);

заменил пару строк
curl_setopt($ch,CURLOPT_PROXY,$proxy_ip.':'.$proxy_port);
curl_setopt($ch,CURLOPT_PROXYTYPE,CURLPROXY_SOCKS5_HOSTNAME);

но ответа так и не получал, в смысле данные так и не приходят...
подскажите что я делаю не так, или что лучше использовать для парсинга амазона к примеру?
  • Вопрос задан
  • 649 просмотров
Пригласить эксперта
Ответы на вопрос 1
donflash
@donflash
Для парсинга ebay я использую облако Hetzner.
Поднимается дешевая тачка или несколько тачек на несколько часов (сколько нужно времени для прогона парсера).
Тачки поднимаются уже из готового образа с socks5 проксей на докере.

Далее скрипт php7.2 + guzzle осуществляют парсинг.
Настрадался в свое время с платными/бесплатными проксями, да и стоимость облака копейки.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы