Задать вопрос
prolisk
@prolisk
Верстая. Криво.

Selenium python 3 подставляет в прокси другие значения, что делать?

Будет два вопроса :)
Через Pool делаю массовый запуск браузеров, в python3 , selenium - chromedriver.
Подставляю прокси с авторизацией (через плагин). Предварительно смотрю какой прокси взял (print), но реально грузит совсем другой прокси. В чем может быть причина? Или это "селениум потоко небезопасен"?

И вся проблема в том, что определенной зависимости нет: может открыть 8 из 8 уникальных, а может 2-7 открыть одинаковых.

Код:
#!/usr/bin/python3
from multiprocessing import Process, Pool, Queue, freeze_support
from multiprocessing.pool import ThreadPool

from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
import time, random
import re, os, requests

from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.action_chains import ActionChains
import zipfile, subprocess

def brows(accs):
            time.sleep(random.randint(2,5))
            print(accs)
            def bigproxy():
                manifest_json = """
                    {
                    "version": "1.0.0",
                    "manifest_version": 2,
                    "name": "Chrome Proxy",
                    "permissions": [
                        "proxy",
                        "tabs",
                        "unlimitedStorage",
                        "storage",
                        "<all_urls>",
                        "webRequest",
                        "webRequestBlocking"
                    ],
                    "background": {
                        "scripts": ["background.js"]
                    },
                    "minimum_chrome_version":"22.0.0"
                }
                """
                
                background_js = """    
                var config = {
                    mode: "fixed_servers",
                    rules: {
                      singleProxy: {
                        scheme: "http",
                        host: """+'"'+ipadr+'"'+""", 
                        port: parseInt("""+port_adr+""")
                      },
                      bypassList: ["bdseo.ru"]
                    }
                  };

                chrome.proxy.settings.set({value: config, scope: "regular"}, function() {});

                function callbackFn(details) {
                    return {
                        authCredentials: {
                            username: """+'"'+login_pr+'"'+""",
                            password: """+'"'+pass_pr+'"'+"""
                        }    
                    };
                }

                chrome.webRequest.onAuthRequired.addListener(
                        callbackFn,
                        {urls: ["<all_urls>"]},
                        ['blocking']
                );
                """
                pluginfile = os.getcwd() + '/plugins/' + 'proxy_auth_plugin.zip'

                with zipfile.ZipFile(pluginfile, 'w') as zp:
                    zp.writestr("manifest.json", manifest_json)
                    zp.writestr("background.js", background_js)

                global co
                co = Options()
                co.add_argument("--start-maximized")    
                userag = 'Mozilla/5.0 (iPhone; CPU iPhone OS 11_4_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/11.0 Mobile/15E148 Safari/604.1'
                userag = common_user[random.randint(0, len(common_user) - 1)].replace('\n', '')
                co.add_argument("user-agent=" + userag) #добавляем user agent    
                for plug in os.listdir(os.getcwd() + '/plugins'):
                    co.add_extension(os.getcwd() + '/plugins/' + plug) #'multilogin.zip')
                    
            def anyheaders():
                        global common_user
                        with open(os.getcwd() + '//common_user.txt', 'r') as hed_te: #часто используемые юзер-агенты
                                common_user = hed_te.readlines()  
            anyheaders()
            
            global  login_pr, pass_pr, ipadr, port_adr
            aco = accs.split('@')        
            username_p = aco[0].split(':')[0]
            pass_p = aco[0].split(':')[1]
            proxy = {'address': aco[1],
             'username': username_p,
             'password': pass_p}
            
            ipadr = aco[1].split(':')[0]
            port_adr = aco[1].split(':')[1]
            login_pr = proxy['username']
            pass_pr = proxy['password']
        
            bigproxy()
            global browser        
            browser = webdriver.Chrome(executable_path = os.getcwd() + '//settings/chromedriver.exe', chrome_options=co)
            
            url = 'http://2ip.ru'
            browser.get(url)
           

            #browser.quit()
            time.sleep(1)

def main2():                  
        def proxylist():
                        global proxys
                        with open(os.getcwd() + '//proxy.txt') as fg:
                                proxys = fg.readlines()                       
        proxylist()        
        try:
            time.sleep(2.5)
            pol = Pool(len(proxys))
            output = pol.map(brows, proxys)
            for an in output:                
                print('.')
        except Exception as erro:
            print(erro)
            pass  
if __name__ == '__main__':
        freeze_support()        
        try:        
            main2()
        except Exception as eror:
            print(eror)
            time.sleep(20)


Второй вопрос:
делаю через цикл for, без multiprocessing, так вот браузер открывает, грузит страницу, а потом спустя какое-то время закрывает, хотя "запроса" на quit() нет.
Код (все также кроме функции main2():
def main2():                  
        def proxylist():
                        global proxys
                        with open(os.getcwd() + '//proxy.txt') as fg:
                                proxys = fg.readlines()                       
        proxylist()        
        try:
            for proxy in proxys:
                  brows(proxy)
        except Exception as erro:
            print(erro)
            pass

Никаких ерроров нет, максимум при старте первого chromedriver выскакивает Warning, но все работает "по скрипту".
Спасибо. Потратил 3 дня, не могу доковырять.
  • Вопрос задан
  • 586 просмотров
Подписаться 1 Средний 3 комментария
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы