Что делать с проблемой при парсинге сайта?

Question

Максим Василенко @vasil3nk

python junior developer

Что делать с проблемой при парсинге сайта?

import requests
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from random import choice

    
def main():
    url = '--url--'
    useragents = open('useragents.txt').read().split('\n')
    proxies = open('proxies').read().split('\n')

    proxy = {'http' : 'http://' + proxies[0]}
    useragent = {'User-Agent' : choice(useragents)}

    opts = Options()

    opts.add_argument("user-agent=" + str(useragents[0]))
    opts.add_argument('--proxy-server=http://' + proxies[0])
    driver = webdriver.Chrome(executable_path=r'--path to chromedriver--',chrome_options=opts)
    driver.get(url)
    print(driver.find_element_by_class_name('ip').text())


if __name__ == '__main__':
    main()

Испoльзую web-browser slenium для для нахождения свободных дат на сайте посольства. После нескольких минут работы
сайт не пускает и выдает ошибку(Не удается получить доступ к сайту). User-agent's меняю, proxy купленный. Как сайт определяет что работает бот??

Вопрос задан более трёх лет назад
317 просмотров

3 комментария

Подписаться 2 Средний 3 комментария

Сергей c0re @erge
где же вы их меняете??
все время выбираются первые:
opts.add_argument("user-agent=" + str(useragents[0])) opts.add_argument('--proxy-server=http://' + proxies[0])
Написано более трёх лет назад
500rur @500rur

Зачем здесь используется Селениум? Может, requests будет достаточно?

Написано более трёх лет назад
IvanSstarr @IvanSstarr

А у Вас есть рабочий механизм по изменению user-agent уже после запуска браузера?
Задавал этот вопрос тут но наверно никто не знает:
Как изменить User Agent в Selenium WebDriver c помощью ExecuteScript?

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- вчера
- 62 просмотра
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 224 просмотра
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 226 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 628 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 544 просмотра
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 304 просмотра
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 557 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 226 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 139 просмотров
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 339 просмотров
1

ответ
Показать ещё Загружается…

где же вы их меняете??
все время выбираются первые:
opts.add_argument("user-agent=" + str(useragents[0])) opts.add_argument('--proxy-server=http://' + proxies[0])
Зачем здесь используется Селениум? Может, requests будет достаточно?
А у Вас есть рабочий механизм по изменению user-agent уже после запуска браузера?
Задавал этот вопрос тут но наверно никто не знает:
Как изменить User Agent в Selenium WebDriver c помощью ExecuteScript?

Answer 1 · 2019-10-14 16:23:02

Dimonchik @dimonchik2013

non progredi est regredi

по ИП прокси, например

или никак - просто блочит частые попытки с IP

Ответ написан более трёх лет назад

1 комментарий

Что делать с проблемой при парсинге сайта?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт