djQuery
@djQuery
"Кодируем помаленьку" ("Сказка о Тройке")))

Как парсить сайт с авторизацией?

На localhost'е формируется перечень ссылок, ведущих на отдельные страницы некого сайта site.com; ссылки имеют вид https://site.com/id/nnnnn. Есть потребность сохранить эти страницы локально, но сайт без авторизации часть информации скрывает. Данные для авторизации (логин/пароль) есть.

Понятно, что при обращении к страницам сайта он определяет факт авторизации через сессионные куки. Вопрос в том, как авторизоваться с localhost'a, используя эти самые куки?
  • Вопрос задан
  • 637 просмотров
Решения вопроса 1
@MagicMight
no magic quotes
Пройдите сначала авторизацию через запрос на форму авторизации с вашими данными
А потом выбирайте - либо используете curl + cookiejar/cookiefile, либо парсите куки из хедеров ответа вручную и добавляете их к каждому следующему запросу

upd. нет никакой разницы, локалхост это или нет. curl запрос - это запрос в роли клиента к серверу
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы