День добрый
Есть задача спарсить сайт
https://www.strava.com, для парсинга используем Python.
Парсить надо внутренние пользовательские данные сайта. Для этого надо залогинеца, а с этим проблема. Что бы мы не пробовали пока результат отрицательный. Нужна помощь специалиста в этом вопросе.
Заранее спасибо
from bs4 import BeautifulSoup
import requests
from fake_useragent import UserAgent
from time import sleep
def authorize():
headers = {
'User-Agent': UserAgent().chrome,
}
# utf8: ✓
# 'utf8': '✓',
login_data = {
'utf8': '✓',
'plan': '',
'email': 'mail@ru',
'password': 'pass',
}
with requests.Session() as s:
s.get('https://www.strava.com')
s.verify = False
url = 'https://www.strava.com/login/'
r = s.get(url)
soup = BeautifulSoup(r.text, 'html5lib')
login_data['authenticity_token'] = str(soup.find('input', attrs={'name': 'authenticity_token', 'type': "hidden"})['value'])
headers['X-CSRF-Token'] = soup.select_one('meta[name="csrf-token"]')['content']
headers['cookie'] = '; '.join([x.name + '=' + x.value for x in s.cookies])
sleep(1)
r2 = s.post(url, data=login_data, headers=headers)
r3 = s.get('https://www.strava.com/clubs/225082/members')
sleep(1)
print(r3.text)
def main():
authorize()
if __name__ == '__main__':
main()