Почему парсер выдает 403 авито?

Question

Anton27 @Anton27

Python

Почему парсер выдает 403 авито?

import requests
import cloudscraper
from fake_useragent import UserAgent
ua = UserAgent()
PROXY_URLS = {
  'http': "http://109.248.7.158:10331",
  'https': "http://109.248.7.158:10331",
}

headers = {
    "accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",
    "accept-language": "ru-RU,ru;q=0.9,en-US;q=0.8,en;q=0.7",
    "cache-control": "max-age=0",
    'Upgrade-Insecure-Requests': '1',
    'User-agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 10_3_1 like Mac OS X) AppleWebKit/603.1.30 (KHTML, like Gecko) Version/10.0 Mobile/14E304 Safari/602.1',
    'refer': ua.random
}

cookies = dict()
url = "https://www.avito.ru/api/1/user/16e563a214f460550d6e8aa538a89336/extended-profile?key=af0deccbgcgidddjgnvljitntccdduijhdinfgjgfjir"
# url = "https://www.avito.ru/"
# ---------------------- прямой запрос --------------------------------------
response = requests.get(url=url, 
                        #proxies=PROXY_URLS,
                
                        headers=headers,
                        
                        )

# ---------------------- вывод данных --------------------------------------
# вывод данных о статусе запроса
print(f'status_code={response.status_code}')
# сохранение в файл для разбора
with open('test_pars.html', 'w', encoding='utf-8') as f:
    f.write(response.text)

Такой вот скрипт, который недавно перестал работать, неизвестно почему. Выдает 403 при подключении к авито, не знаю что делать.

Вопрос задан более трёх лет назад
4422 просмотра

1 комментарий

Подписаться 3 Средний 1 комментарий

Пригласить эксперта

Ответы на вопрос 4

4 комментария

PerseusPRO @PerseusPRO

Как с тобой можно в телеге связаться?

Написано более трёх лет назад
ubirust @ubirust

Что этот код делает? Можешь плиз скинуть код, который сейчас работает. Выше ты скинул старый код, обновленный пожалуйста скинь.

Написано более трёх лет назад
Gipsme @Gipsme

Чет по этому коду опять 403 выдает(

Написано более трёх лет назад
ubirust @ubirust

Gipsme, Да, аналогичная ситуация. Буквально месяц назад норм было. Не тестил почему так сейчас?

Написано более трёх лет назад

1 комментарий

5 комментариев

Anton27 @Anton27 Автор вопроса

Как это сделать?

Написано более трёх лет назад
Николай Савельев @AgentSmith

сначала сделать авторизационный запрос, получить и сохранить куки, и использовать их при последующих запросах

Написано более трёх лет назад
Anton27 @Anton27 Автор вопроса

извините, я правда не понимаю, как я могу получить куки из авторизлванного запроса, если постоянно выдает 403. Использовать свои куки ?

Написано более трёх лет назад
PerseusPRO @PerseusPRO

Anton27, Agent Smith, я тоже столкнулся с такой проблемой, зашел на сайт с помощью селениума, перенес куки в сессию реквеста, но все равно та же беда. Тут не в куках дело и не в прокси, какая то иная идет проверка

Написано более трёх лет назад
Anton27 @Anton27 Автор вопроса

PerseusPRO, Какую шапку использовали ?

Написано более трёх лет назад

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как распарсить смешанный тип json-данных?
- 1 подписчик
- 26 июл.
- 176 просмотров
3

ответа
Python

+1 ещё

Средний
Как «На лету» добавить клик id в готовый апк, который будет скачиваться с сайта?
- 1 подписчик
- 26 июл.
- 112 просмотров
2

ответа
Python

+1 ещё

Средний
Как подключить отладчик к программе на Python в Docker-контейнере?
- 1 подписчик
- 24 июл.
- 149 просмотров
1

ответ
Python

Простой
Почему не получается создать профиль в программе Dolphin{anty}?
- 1 подписчик
- 24 июл.
- 77 просмотров
1

ответ
Python

Простой
Как совместить два .pdf файла?
- 1 подписчик
- 22 июл.
- 235 просмотров
0

ответов
Python

+1 ещё

Простой
Не доходит колбэк в колбекобработчик, как можно решить эту проблему?
- 1 подписчик
- 22 июл.
- 125 просмотров
1

ответ
Python

Простой
Почему AnaConda или MiniConda автоматически самоликвидируется на win10?
- 1 подписчик
- 22 июл.
- 113 просмотров
0

ответов
Python

+1 ещё

Простой
Почему форма не по центру экрана, как исправить?
- 1 подписчик
- 22 июл.
- 97 просмотров
0

ответов
Python

Простой
Как исправить Python error module 'win32crypt' has no attribute 'CryptProtectData' [closed]?
- 1 подписчик
- 21 июл.
- 83 просмотра
0

ответов
Python

+1 ещё

Простой
Как торговать фьючерсами через API MEXC?
- 2 подписчика
- 19 июл.
- 419 просмотров
1

ответ
Показать ещё Загружается…

Python разработчик

Bell Integrator • Москва

Разработчик Python

Bell Integrator • Москва

Python разработчик

Bell Integrator • Москва

Если он "недавно перестал работать", возможно, Авито кинул вас в бан

Answer 1 · 2022-03-07 19:01:20

Всем привет, ребят!
Большое спасибо за ваши ответы, решение было очень простым, нужно более детально заполнять шапку, брать готовые куки, их вы можете самостоятельно скачать(много плагинов для гугла). В общем, это все.
Вот код одного из решения этого вопроса

import ssl
import requests

from requests.adapters import HTTPAdapter
from urllib3.poolmanager import PoolManager
from urllib3.util import ssl_

CIPHERS = """ECDHE-RSA-AES256-GCM-SHA384:ECDHE-ECDSA-AES256-GCM-SHA384:ECDHE-RSA-AES256-SHA384:ECDHE-ECDSA-AES256-SHA384:ECDHE-RSA-AES128-GCM-SHA256:ECDHE-RSA-AES128-SHA256:AES256-SHA"""

class TlsAdapter(HTTPAdapter):

    def __init__(self, ssl_options=0, **kwargs):
        self.ssl_options = ssl_options
        super(TlsAdapter, self).__init__(**kwargs)

    def init_poolmanager(self, *pool_args, **pool_kwargs):
        ctx = ssl_.create_urllib3_context(ciphers=CIPHERS, cert_reqs=ssl.CERT_REQUIRED, options=self.ssl_options)
        self.poolmanager = PoolManager(*pool_args, ssl_context=ctx, **pool_kwargs)

session = requests.session()
adapter = TlsAdapter(ssl.OP_NO_TLSv1 | ssl.OP_NO_TLSv1_1)
session.mount("http://", adapter)

try:
    r = session.request('GET', 'http://www.avito.ru')
    print(r.status_code)
except Exception as exception:
    print(exception)

Answer 2 · 2022-04-18 00:51:28

Пример рабочего кода

import requests
from hyper.contrib import HTTP20Adapter
s = requests.Session()
s.mount('https://', HTTP20Adapter())
r = s.get('https://www.avito.ru/', headers = go_headers)
print(r.status_code)

Answer 3 · 2022-03-07 01:19:04

Николай Савельев @AgentSmith

Это мой правильный ответ на твой вопрос

403 - доступ запрещён.
Надо обновить авторизационные куки

Ответ написан более трёх лет назад

5 комментариев

Answer 4 · 2022-03-09 09:27:29

Да, авито палит request запрос парсера последние дни сразу же. Долгое время парсил в многопоточном режиме через тор. Подсовывал и headers и подключение через Sessions() и куки из браузера и через прокси и через мобильную сеть — все равно ошибка 403.
Возможно, когда подключение через браузер обрабатывается какой то java script, а парсер через request запрос его не обрабатывает и палится.

Почему парсер выдает 403 авито?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт