Как обойти CloudFlare на python?

Question

Влад Володько @Ruless

Frontend development

Как обойти CloudFlare на python?

Пытаюсь получить данный с сайта https://dexscreener.com/solana

Но там стоит Cloudflare:

Пытался использовать и cloudscraper и cloudflare-scrape показывает ошибку 403 что впринце логично, но в интернетах пишут что данные инструменты должны решать данную проблему

import asyncio
import cloudscraper
from create_bot import bot
from bs4 import BeautifulSoup

async def connect_to_websocket(fdv, admin_id):
    try:
        await bot.send_message(admin_id, "Открытие страницы Dexscreener...")
        scraper = cloudscraper.create_scraper(disableCloudflareV1=True)
        response = scraper.get("https://dexscreener.com/solana")
        await bot.send_message(admin_id, f"{response.status_code}")
        
        if response.status_code == 200:
            body_content = response.content
            await bot.send_message(admin_id, f"{response.status_code}")
            soup = BeautifulSoup(body_content, 'html.parser')
            target_element = soup.find(class_='ds-dex-table')
            
            if target_element:
                await bot.send_message(admin_id, f"Найден элемент: {target_element.text[:2000]}")
            else:
                await bot.send_message(admin_id, "Элемент с классом 'ds-dex-table' не найден.")
        else:
            await bot.send_message(admin_id, f"Ошибка при загрузке страницы: {response.status_code}")

    except Exception as e:
        await bot.send_message(admin_id, f"Ошибка при загрузке страницы или получении ссылок: {e}")

Также пытался использовать selenium

import asyncio
import time
import undetected_chromedriver as uc
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC


from create_bot import bot
from bs4 import BeautifulSoup

async def connect_to_websocket(fdv, admin_id):
    
    options = uc.ChromeOptions()
    options.add_argument("--headless")  # Запуск в фоновом режиме
    options.add_argument("--auto-open-devtools-for-tabs")
    options.add_argument('--disable-blink-features=AutomationControlled')

    driver = uc.Chrome(options=options)

    try:
        await bot.send_message(admin_id, "Открытие страницы Dexscreener...")

        driver.get("https://dexscreener.com/solana")

        time.sleep(5)

        page_source = driver.page_source
        soup = BeautifulSoup(page_source, 'html.parser')
        body_content = soup.body
        body_html = str(body_content)

        await bot.send_message(admin_id, f"Текст страницы: {body_html[:2000]}")

        # Ищем блок с нужным классом
        target_block = soup.find('div', class_='ds-dex-table')  # замените на нужный класс
        
        if target_block:
            body_html = str(target_block)
            await bot.send_message(admin_id, f"Блок найден: {body_html[:2000]}")
        else:
            await bot.send_message(admin_id, "Блок не найден.")
    except Exception as e:
        await bot.send_message(admin_id, f"Ошибка при загрузке страницы или получении ссылок: {e}")
    finally:
        driver.quit()

Но здесь загружается только страница где типа надо ввести капчу Just a moment... Verify you are human...., но что делать дальше я уже не знаю, даже сам блок капчи не появляется, убил на это уже около недели и так никуда и не продвинулся.

Помогите кто чем может, я уже прям не знаю

Вопрос задан более года назад
1801 просмотр

Комментировать

Подписаться 2 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее
Skillfactory

Профессия Python-разработчик

9 месяцев

Далее
SF Education

Бэкенд-разработчик на Python

3 месяца

Далее

Пригласить эксперта

Ответы на вопрос 4

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- вчера
- 82 просмотра
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- вчера
- 75 просмотров
0

ответов
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 1 подписчик
- вчера
- 41 просмотр
1

ответ
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 223 просмотра
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 109 просмотров
0

ответов
Python

+1 ещё

Простой
Почему callback_query_handler в telebot не работает?
- 1 подписчик
- 31 окт.
- 129 просмотров
3

ответа
VPN

+2 ещё

Средний
VLESS+Reality перестал работать на мобильном интернете Yota, хотя на Wi-Fi всё в порядке — где искать причину?
- 15 подписчиков
- 30 окт.
- 25264 просмотра
10

ответов
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 130 просмотров
0

ответов
Python

Простой
Что делать если turtle в python не отвечает?
- 1 подписчик
- 22 окт.
- 247 просмотров
2

ответа
Python

Простой
Не могу разобраться почему не работает код python?
- 1 подписчик
- 22 окт.
- 412 просмотров
1

ответ
Показать ещё Загружается…

Backend developer (Python, FastAPI)

BCraft

До 4 000 $

Python Developer

Strikt

от 100 000 до 150 000 ₽

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

Answer 1 · 2024-08-10 06:00:30

Надо просто перестать парсить сайты на которых такая защита, а начать использовать API, который предлагает либо этот сайт, либо аналогичные

Answer 2 · 2024-08-11 13:02:25

Можешь воспользоваться запросами через библиотеки с поддержкой TLS (tls_client/curl_ciffi/curl-impersonate), чтобы обойти cloudflare-защиту. А вообще, использование selenium тут очень странно, учитывая что ты получаешь только страницу, ничего не кликая

К слову, для обхода может понадобиться правильно настроить юзерагент и хедеры запроса.

Answer 3 · 2024-11-06 19:26:12

Мой способ : понимаем докер из https://github.com/yoori/flare-bypasser , делаем к нему запрос за куками и с этими куками ломимся на целевой сайт - у меня стабильно работает

Answer 4 · 2024-12-24 07:48:57

gronobro @gronobro

Таки получилось?
Если да, то как?

Ответ написан 24 дек. 2024

Комментировать

Как обойти CloudFlare на python?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт