Задать вопрос
@Nikita235

Как избежать блокировки на сайте?

В общем пытаюсь спарсить определенный сайт: Ссылка удалена модератором.

Но как я понял, он отлично защищен. Мне не помог ни фейковый юзер агент, ни прокси(не использую публичный)

Вот код для примера:
import requests
from bs4 import BeautifulSoup

proxies = {
}


def get_local(url):
    response = requests.get(url=url,proxies=proxies)
    soup = BeautifulSoup(response.text, 'lxml')
    print(soup)


def main():
    get_local(url='https://getgems.io/')


if __name__ == '__main__':
    main()


В терминале есть вывод, но там какая-то несуразица. Если попытаться сохранить html файл, а затем открыть его в браузере, то откроется белое окно.

Быть может, кто-то имеет опыт обхода защиты подобных сайтов. Поделитесь, пожалуйста.

Я пробовал использовать selenium, он замечательно обходил защиту сайта, но за это приходится платить очень медленной работой
  • Вопрос задан
  • 165 просмотров
Подписаться 2 Средний 5 комментариев
Пригласить эксперта
Ответы на вопрос 1
dimonchik2013
@dimonchik2013
non progredi est regredi
requests.get(url=url,proxies=proxies)

добавь хотя бы юзерагента для начала

вообще защиту надо тыкать постепенно, углубляясь
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы