Как обойти блокировку selenium'а сайтом?

Question

tem12qaz @tem12qaz

Как обойти блокировку selenium'а сайтом?

Раньше удавался парсинг сайта с помощью requests.
Сейчас он начал выдавать пустой html с одним js скриптом.
Попробовал через Selenium - та же картина.

Если открыть его в обычном хроме, произойдет переадресация на нужный url.
Если открыть его в Selenium Chrome то ничего не произойдет.

На stackoverflow прочитал совет, что сайт обнаруживает selenium.
Чтобы обойти проблему, требуется открыть chromedriver.exe в hex редакторе
и изменить все "cdc_" на другую строку.
Попробовал - не помогло. Также пробовал использовать прокси и fakeuseragent вместе с Selenium и измененным файлом chromedriver.

Есть ли способ обойти этот блок?

Сам html не помещается.
Спасибо за помощь

UPD:
Использую следующие настройки:

options.add_argument("--disable-blink-features")
options.add_argument("--disable-blink-features=AutomationControlled")
options.add_experimental_option("excludeSwitches", ["enable-automation"])
options.add_experimental_option('useAutomationExtension', False)
options.add_argument("start-maximized")

driver = webdriver.Chrome(
    executable_path=r"C:\Users\User\Desktop\project_parse_v3\chromedriver.exe",
        options=options
)

driver.execute_script("Object.defineProperty(navigator, 'webdriver', {get: () => undefined})")
driver.execute_cdp_cmd('Network.setUserAgentOverride', {
    "userAgent": user_agent.random}
)

РЕШЕНИЕ:
Ответ Максима помог
https://pypi.org/project/selenium-stealth/
Использовал это решение и настройки хрома выше.
Также использовал измененный в Hex редакторе chromedriver, как будет работать с оригиналным не знаю.

Вопрос задан более трёх лет назад
14463 просмотра

Комментировать

Подписаться 17 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

3 комментария

Пригласить эксперта

Ответы на вопрос 1

6 комментариев

Александр @cry_san

Добрый!
Можете посоветовать сниффер?

Написано более трёх лет назад
Uno @Noizefan

Александр, wireshark

Написано более трёх лет назад
Александр @cry_san

Uno, понял, спасибо!

Написано более трёх лет назад
Андрей @rsytrade

А по-подробнее можно?
Вот мне, допустим, вышеперечисленные методы не помогли… Сайт просто банит после нажатия активной кнопки, ничего не помогает…

Написано более трёх лет назад
Uno @Noizefan

Андрей, прокси, юзерагенты, фингерпринты
Глупые проверки на встроенные идентификаторы - может, какая то функция жса возвращает в селениуме слово selenium и благослови тебя господь.
Ищи антидетекты с апи или пиши свой

Написано более трёх лет назад
Андрей @rsytrade

@Noizefan
я по запросам, выяснил что за моей "проблемой" стоит DataDome в комплекте с Cloudflare...
а можешь посоветовать антидетектор, scraperapi.com нормальный? Или может сам поможешь пару функций «накидать»??? )))

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Сложный
Как обойти uefi при создании собственной операционной системы?
- 1 подписчик
- 4 часа назад
- 113 просмотров
2

ответа
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 9 часов назад
- 41 просмотр
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 206 просмотров
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 222 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 620 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 538 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 300 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 553 просмотра
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 223 просмотра
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 135 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2021-05-29 13:22:10

maksam07 @maksam07

https://pypi.org/project/selenium-stealth/
https://pypi.org/project/undetected-chromedriver/
Что-то из этого скорее всего поможет.

Ответ написан более трёх лет назад

3 комментария

Answer 2 · 2021-06-07 09:51:06

На будущее - вместо паники запускаем сниффер -> делаем одинаковые запросы удачный и не удачный -> полностью изучаем оба пакета (и все данные кои идут хосту useragent и весь фингерпринт итд) и методом логики определяем что не нравится хосту. Делов останется в львиной половине случаев пофиксить простейшую мелочь в полторы строки вместо припипирования к и без того громоздкому селениуму лишних либ. А то и вовсе "даунгрейд" до requests случится. Крайне маловероятно, что сайт тебя резал из за webgl вендора, правда? учитывая, что раньше "антифрода" и вовсе не было. А то опять отвалится а автор либы видите ли не всё в апдейте предусмотрел х)

Как обойти блокировку selenium'а сайтом?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт