@cegthgtlhj

Как правильно считать файл вместе с hidden __csrf_token?

пытаюсь написать автоматический вход на сайт с дальнейшим парсингом результатов.
Авторизационная форма кроме логина и пароля пересылает hidden __csrf_token.

Вопрос 1
Правильно ли что сначала нужно этот вебсайт считать GET запросом, потом вытащить из HTML текста __csrf_token и его вместе с логином и паролем отправить следующим запросом для входа на сайт?
если неправильно, то как сделать?

Вопрос 2
Предполагая, что моя логика в Вопросе 1 правильная, пытаюсь нижеуказанным кодом считать сайт.

import requests
from bs4 import BeautifulSoup
s = requests.Session()
_url_00 = "https://www.filter-technik.de/account"
x_00 = s.get(_url_00)
with open("_ELSAESSER_000.html", "w", encoding='utf-8') as f:
    f.write(x_00.text)
soup_00 = BeautifulSoup(x_00.text, "html.parser")
_match = soup_00.find("__csrf_token")
print(_match)
input()


как оказывается, при считывании таким способом, __csrf_token в тексте файла не сохраняется

q06.png

хотя при сохранении в мозилле файла типа Ctrl+S, этот токен там виден

q05.png

Как правильно считать файл вместе с hidden __csrf_token??
  • Вопрос задан
  • 102 просмотра
Решения вопроса 1
@AWEme
Retard Soft Inc.
Собственно после минуты в инспекторе оказалось, что токен отдаётся в заголовке ответа.
r = requests.get('https://www.filter-technik.de/csrftoken')
token = r.headers['X-Csrf-Token']
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
@cegthgtlhj Автор вопроса
AWEme AWEme
Благодарю вас. Для Вас это одна минута, для меня-чайника несколько дней.
Всё расно не совсем понял как вы пришли к этим двум строкам
"https://www.filter-technik.de/csrftoken"
и
'X-Csrf-Token'
Если найдете еще минуту, поясните пож-ста вкратце.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы