@AlexaAioGram

Почему парсит не понятный текст?

Обучаюсь парсингу, и решил попробовать попарсить авито(название товара, цену, описание), но как только начал парсить, вместо html ветки, мне вернуло кучу не понятных символов, пробовал кодировать по utf-8, не помогло. Помогите, что делать ?

Код:
data = {
    ':authority:': 'mc.yandex.ru',
    ':method:': 'GET',
    ':path:': '/watch/34241905?page-url=httpswww.avito.ru%2Frossiya%2Fodezhda_obuv_aksessuary&charset=utf-8&browser-info=nb%3A1%3Acl%3A1833%3Aar%3A1%3Agdpr%3A14%3Avf%3Auq3ipefhyn2n2ej8hz2%3Afu%3A0%3Aen%3Autf-8%3Ala%3Aru%3Av%3A771%3Acn%3A1%3Adp%3A1%3Als%3A357210061102%3Ahid%3A102282673%3Az%3A180%3Ai%3A20220404215952%3Aet%3A1649098793%3Ac%3A1%3Arn%3A1042517430%3Arqn%3A333%3Au%3A1645722845399384042%3Aw%3A1349x133%3As%3A1366x768x24%3Ask%3A1%3Acpf%3A1%3Aeu%3A0%3Ans%3A1649098772749%3Ads%3A%2C%2C%2C%2C%2C%2C%2C%2C%2C9807%2C9811%2C15%2C%3Awv%3A2%3Aco%3A0%3Aadb%3A2%3App%3A3629563401%3Apu%3A14051967041645722845399384042%3Azzlc%3Ana%3Arqnl%3A1%3Ast%3A1649098793&t=gdpr(14)mc(p-1)lt(565100)aw(1)ti(0)&force-urlencoded=1',
    ':scheme:': 'https',
    'accept:': '*/*',
    'accept-language:': 'ru,en;q=0.9,en-GB;q=0S;q=0.7',
    'content-length:': '0',
    'cookie:': 'yandexuid=232923258ss=2329232581642541323; ymex=1957901327.yrts.1642541327; _ym_uid=1642541328926837563; is_gdpr_b=CKm1JBCuXSgC; my=YwA=; amcuid=884899231643122274; yandex_gid=14; i=Dk9zjZe1CTLirUR6hZ6n+yWEGu9b92RSr78hYj1REjFYD7ZOtHx7xVV64ZvgAh1pSlMMOO9J7TLQoLWaWgkJq+LslqQ=; cycada=8eC9kUO8McZ3YUbgQ6PREK24c78f6lF/7+pGpX9U9yI=; _ym_d=1648926628; yabs-sid=438392981649080697; gdpr=0; _ym_isad=2; yabs-frequency=/5/0G0d0CybIs9d9KjY/RwLS71gomcleHITu9NnhXcP6M-j5_F___xMKMpnRSMDSw4KZ8krF10oancxeHIDtZnQAl4EdJBT5_F____k3U5LI8fvdyKMW0PNgtkWvI35My4LWlcJA-2p83dJmHK1TKSj3717qLV158Ed8HGm4nUT3y4KW1rxuULMgFbpnHQ06ujohYroPR7xnHK02K0ukCgDlS7FmHM00/; ys=wprid.1649098620957016-3354873249299549617-vla1-3402-vla-l7-balancer-8080-BAL-9611',
    'origin:': 'https://www.avito.ru',
    'referer:': 'https://www.avito.ru/',
    'sec-ch-ua:': '" Not A;Brand"", "Chromium";v="100", "Microsoft Edge";v="100"',
    'sec-ch-ua-mobile:': '?0',
    'sec-ch-ua-platform:': '"Windows"',
    'sec-fetch-dest:': 'empty',
    'sec-fetch-mode:': 'no-cors',
    'sec-fetch-site:': 'cross-site',
    'user-agent:': 'Mozilla/5.0 (Windows NT 10.0; Win64;ppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.60 Safari/537.36 Edg/100.0.1185.29'
}

url = 'https://www.avito.ru/rossiya/odezhda_obuv_aksessuary'


response = requests.get(url=url, data=data)

html = response.text.encode('utf-8')

print(html)


Вот что возвращает
624b43fc6fd7c846455796.png
  • Вопрос задан
  • 107 просмотров
Решения вопроса 1
SoreMix
@SoreMix Куратор тега Python
yellow
Этот текст есть в коде страницы. Что именно не понравилось в нем?
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы