Через что парсить сайт на Python?

Question

chtopisatsuda @chtopisatsuda

Парсинг

Через что парсить сайт на Python?

На чем парсить сайт
Какую библиотеку использовать ибо Bs4 и Selenium блокает соединение сам сайт.
Или может использовать другой ЯП?

Вопрос задан более двух лет назад
150 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Skillfactory

Профессия Python-разработчик PRO

12 месяцев

Далее
Stepik

Парсинг на Python для начинающих

2 недели

Далее
OTUS

iOS Developer

12 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Парсинг

Средний
Вся сложность парсинга Авито. Как это сделать правильно?
- 1 подписчик
- 26 нояб.
- 161 просмотр
1

ответ
Telegram

+1 ещё

Простой
Как спарсить подписчиков своего телеграм канала?
- 2 подписчика
- 20 нояб.
- 387 просмотров
2

ответа
Веб-разработка

+1 ещё

Простой
Каким образом правильно сделать скрипт?
- 2 подписчика
- 15 нояб.
- 360 просмотров
2

ответа
Python

+1 ещё

Сложный
Как автоматизировать работу с сайтом используя Camoufox библиотеку?
- 2 подписчика
- 14 окт.
- 193 просмотра
0

ответов
Парсинг

Простой
Как получить ID всех ПВЗ?
- 1 подписчик
- 24 сент.
- 266 просмотров
0

ответов
Парсинг

+1 ещё

Простой
Как увеличить охват поисковых фраз Wildberries и ускорить?
- 2 подписчика
- 23 сент.
- 206 просмотров
0

ответов
Парсинг

Простой
Как парсить несколько сайтов, отличающихся друг от друга?
- 2 подписчика
- 09 сент.
- 207 просмотров
3

ответа
Node.js

+4 ещё

Простой
В чем разница между selenium, playwright и puppeteer?
- 3 подписчика
- 09 сент.
- 294 просмотра
2

ответа
Node.js

+1 ещё

Простой
NODE.JS – парсинг контента. При скачивании изображений получаю битые файлы. Как поправить?
- 1 подписчик
- 08 сент.
- 136 просмотров
1

ответ
Python

+2 ещё

Средний
Как правильно принимать платежи пользователей в сети Tron?
- 1 подписчик
- 03 сент.
- 230 просмотров
3

ответа
Показать ещё Загружается…

C++ / Qt Разработчик

Алабуга • Екатеринбург

от 127 500 ₽

Разработчик JavaScript/NodeJS, специалист технической поддержки

A-Parser

от 600 до 800 $

Инженер по инцидентам информационной безопасности

SMALL

от 3 400 до 4 700 $

Answer 1 · 2024-02-25 13:20:25

Ну я с начало использовал requests (я так понимаю ты тут имел в виду bs4), для того что бы делать запросы к серверу и собирать инфу, после перешёл на curl_cffi. Curl_cffi как то быстрее работает, и он собирает нужную инфу. К примеру попробуй достать обычный get запросом спарсить этот сайт. Если его парсить через обычный requests, отправляя все заголовки запросов что есть в условном хроме, то тебе отдаст html разметку для ботов. А curl_cffi получает нужную html разметку. Про то что сайт блокает selen такое может быть, сайты зачастую видят что ты запускаешься через selen и это нужно обходить. Есть много библиотек и статей для undetected selenium, просто погугли.

Через что парсить сайт на Python?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт