darina46722
@darina46722

Как получить страницу curl(ом), представившись Chrome(ом)?

Нужно получить содержимое страницы.
Далее собираюсь парсить его регулярными выражениями.

Не понятно как запрос в терминале..
curl -o test.txt (ссылка на сайт)

..использовать в питоновском файле.
  • Вопрос задан
  • 242 просмотра
Решения вопроса 1
samodum
@samodum
Какой вопрос - такой и ответ
В python'е лучше пользоваться библиотекой requests.
Чтобы представиться хромом, надо в хедерах передать User-agent с данными от Хрома
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
@ventormo
Скорее всего, в Python должна быть библиотека для работы с CURL (как, например, в PHP). Но вы можете и сам курл вызвать примерно так:

import subprocess

curl = subprocess.Popen( ["curl", "-o", "test.txt", "https://toster.ru", "-A", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36"], stdout=subprocess.PIPE ).communicate()

Что же до представиться хромом — используйте хромовский юзерагент. В CURL это ключ -A пример.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
23 нояб. 2024, в 01:31
1000 руб./за проект
23 нояб. 2024, в 00:16
2000 руб./за проект