Как с помощью python производить логин на ресурсном сайте университета?

Question

vitom @vitom

Как с помощью python производить логин на ресурсном сайте университета?

Нам на одном предмете показали как создать web-crawler на питоне. А я хочу создать оповещалку о новостях moodle. Не знаю или в России употребляется такое, но вот в моем барселонском университете, да. Я пытаюсь скачать html сайта, найти секцию где учителя выставляют оценки, материалы pdf… и при обнаружании чего то нового, оповещать. Просто и элементарно. Но заноза в том что сайт требует authentification. На первый взгляд лишь submit form по протоколу http. Но на самом деле производится аутентификация через это место по https.

<form action="https://auten.ub.edu/uauten.pl" method="post" name="login" id="login">

Как залогинится и скачать страницу курса campusvirtual.ub.edu/course/view.php?id=34437

Вопрос задан более трёх лет назад
8054 просмотра

1 комментарий

Подписаться 8 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

Яндекс Практикум

Профессиональная вёрстка на HTML и CSS

3 месяца

Далее
Stepik

Основы HTML и CSS

2 недели

Далее
Бруноям

Вёрстка на HTML и CSS

3 месяца

Далее

Решения вопроса 1

4 комментария

vitom @vitom Автор вопроса
Посмотрел,

<input tabindex="1" type="text" id="user" name="user" size="15" value="" alt="Nom d'usuari"> <input tabindex="2" type="password" name="password" size="15" value="" alt="Contrasenya">

но что именно надо вбить в auth_data?
как с этим дальше идти на
campusvirtual.ub.edu/course/view.php?id=34437? Ведь мне сюда надо а не в auten.ub.edu
Написано более трёх лет назад
mik_os @mik_os
Вам нужно симитировать браузер.

Шаг 1. Отправить форму.
Посмотреть что именно отправляется (auth_data) лучше всего firebug'ом (или встроенным инструментом в Chrome) в момент логина через браузер (параметром может быть больше) и вписать в auth_data:

auth_data = { 'user': '...', 'password': '...', }

Это:

opener.open('https://auten.ub.edu/uauten.pl', urlencode(auth_data))

как раз и делает отправку формы и обрабатывает ответ. В ответе скорей всего будут куки которые запомнит cookie_processor. Теперь opener будем «авторизирован».

Шаг 2. Делайте все что вам нужно (opener.open('http://campusvirtual.ub.edu/course/view.php?id=34437')).
Написано более трёх лет назад
vitom @vitom Автор вопроса

заполнил мои user i password,
и добавил:
req =opener.open('http://campusvirtual.ub.edu/course/view.php?id=34437')
print req.read()
результат: тот же самый html где мне сообщают что я не залогился.
а req.url выдает: campusvirtual.ub.edu/campusub/login/index_form.php

Написано более трёх лет назад
mik_os @mik_os

осмотрите вы в firebug наконец. Там еще пачка input'ов.

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 5

Комментировать

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Какой отлдачик для Python поставить новичку?
- 1 подписчик
- 26 минут назад
- 1 просмотр
0

ответов
Python

Простой
Существует ли менеджер виртуальных окружений для python, который хранит все пакеты в одном месте?
- 1 подписчик
- вчера
- 160 просмотров
1

ответ
Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 210 просмотров
1

ответ
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 64 просмотра
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 186 просмотров
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 205 просмотров
1

ответ
JavaScript

+2 ещё

Средний
Как можно реализовать что то вроде селекта внутри родителя у которого есть скрытые элементы и должна быть горизонтальная прокрутка?
- 2 подписчика
- 11 дек.
- 163 просмотра
0

ответов
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 138 просмотров
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 239 просмотров
0

ответов
Парсинг

Простой
Видит ли администрация сайта сканирование,и можно ли скрыть?
- 1 подписчик
- 07 дек.
- 395 просмотров
2

ответа
Показать ещё Загружается…

WordPress (PHP, HTML/CSS) разработчик

Epiic

от 90 000 ₽

Frontend-разработчик (Vanilla JS, high-load media platform)

Karma8

от 200 000 до 300 000 ₽

Frontend разработчик React / Next.js

PurpleSchool

До 65 000 ₽

если это moodle, нельзя ли использовать его API?

Answer 1 · 2012-06-06 21:00:34

import urllib2
from urllib import urlencode
from cookielib import CookieJar

cookie_processor = urllib2.HTTPCookieProcessor(CookieJar())
opener = urllib2.build_opener(cookie_processor)

auth_data = {
# см. в firebug/еще где-то
}
opener.open('https://auten.ub.edu/uauten.pl', urlencode(auth_data))

и далее используем этот же opener для навигации по сайту.

Answer 2 · 2012-06-06 20:52:01

Ну наверное надо начать отсуда: docs.python.org/library/httplib.html
а конкретно с примера

>>> import httplib, urllib

>>> params = urllib.urlencode({'@number': 12524, 'type': 'issue', 'action': 'show'})

>>> headers = {"Content-type": "application/x-www-form-urlencoded",

... "Accept": "text/plain"}

>>> conn = httplib.HTTPConnection("bugs.python.org")

>>> conn.request("POST", "", params, headers)

>>> response = conn.getresponse()

>>> print response.status, response.reason

302 Found

>>> data = response.read()

>>> data

'Redirecting to http://bugs.python.org/issue12524'

>>> conn.close()

В качестве params — передать логин\пароль и др. параметры (можно подсмотреть в Firebug-е) а дальше посмотреть на возврат на предмет cookies если вдруг там они используются для организации сесии, а дальше пихать их (куки) в каждый запрос к сайту

Answer 3 · 2012-06-06 22:58:57

mik_os @mik_os

Посмотрите вы в firebug наконец. Там еще пачка input'ов,

Ответ написан более трёх лет назад

Комментировать

Answer 4 · 2012-06-06 23:11:03

vitom @vitom Автор вопроса

О! ура получилось. Спасибо за помощь и терпение. Я не знал что надо все input's посылать

Ответ написан более трёх лет назад

Комментировать

Answer 5 · 2012-06-07 16:37:20

Вместо urllib в такой задаче гораздо приятней использовать питонскую нестандартную библиотеку requests.

Answer 6 · 2012-08-12 04:51:32

А что я сдесь упустил?

cookie_processor = urllib2.HTTPCookieProcessor(CookieJar())
opener = urllib2.build_opener(cookie_processor)
auth_data = {
    'login': '*****',
    'password': '******'

}
 
opener.open('https://feinaactiva.gencat.cat/web/guest/candidatelogin?p_p_id=loginCandidate&p_p_lifecycle=1&p_p_state=normal&p_p_mode=view&p_p_col_id=column-1&p_p_col_count=1&_loginCandidate_struts_action=%2FloginCandidate%2Fauthentication', urlencode(auth_data))
req = opener.open('https://feinaactiva.gencat.cat/group/candidate/jobslocator?p_p_id=jobsLocator_WAR_psocwebjobslocator&p_p_lifecycle=1&p_p_state=maximized&p_p_mode=view&_jobsLocator_WAR_psocwebjobslocator_struts_action=%2Fjobslocator%2FjobsLocator&saveLastPath=0&_jobsLocator_WAR_psocwebjobslocator_forwardPath=search')
html = req.read()

Возвращает логин страницу. Вроде больше инпутов нет. А в чем проблема?

Как с помощью python производить логин на ресурсном сайте университета?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт