@thereisnonickname

Cookies: urlgen, mid. Как Instagram палит меня под proxy?

Привет!

Написал скрипт на Python для парсинга инста-аккаунтов. Для того, чтобы сбор информации не затягивался надолго, распараллелил запросы, а для каждого потока стал использовать отдельный публичный прокси (подтягиваю их пачками из библиотеки proxy).
И вдруг выяснилось, что инстаграму пофигу на прокси, он всё равно понимает, что я это я.. (разумеется, скрипт работает без авторизации)
В результате исследования удалось обнаружить, что Инстаграм просто-напросто присылает каждому потоку Cookies со следующими интересными параметрами:
1. Cookie mid= (здесь какой-то хэш, абсолютно одинаковый для каждого потока)
2. Cookie urlgen={а вот здесь пара мой_реальный_IP: порт}

Уважаемые знатоки, вопрос:
как, чёрт возьми, Инстаграм понимает, что "вот этот вот запрос из Эфиопии на самом деле - Вася Пупкин из Бибирево"?!
Я ведь не логинюсь! Ожидается, что для инсты это неопознаный запрос от неавторизованного юзера.

Я использую либу requests, создаю объект session и через session.proxies.update докидываю туда свежий прокси, после чего выполняю анонимный (как оказалось - нет) запрос. WTF?! Как такое может быть?
  • Вопрос задан
  • 1420 просмотров
Решения вопроса 1
@thereisnonickname Автор вопроса
Проблема была в неверно заданной http(s)-схеме (подробнее в комментариях к вопросу)
Спасибо AWEme
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 2
Usimov
@Usimov
Интересуюсь маркетингом и программированием
Очевидно, что не все зависит от прокси. Возможно, что он распознает ваше устройство.
ID компьютера — это индивидуальный номер, выраженный в шестнадцатеричной системе счисления и напрямую привязанный к сетевой карте. Именно под этим номером, вне зависимости от того, использует юзер Windows, Linux или macOS, устройство видно в сети — и именно по ID, в отличие от IP, его реально найти.

Так что копайте в этом направлении. Короче, вам нужно менять данные устройства. Одним прокси не обойдешься.
Ответ написан
@born2kill229
urlgen="{\"194.34.***.***\": 35048} мне он присылает прокси, которое использую, только на другом порте. Работает на всех моих прокси, со всеми акками, очевидно твой косяк.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы