Почему можно не заморачиваться?
Есть сценарии в которых IP не годится.
В моем случае возможен такой вариант: реклама на спинках сидений автобусов. Посетитель ее видит и заходит на сайт прям с автобуса. А там вайфай бесплатный… хотя наверное мало кто им пользуется.
Но вот сколько человек за 1 IP может сидеть у оператора в одном регионе, это вопрос. Если сотни, то может получиться что 10% разных людей будут идентифицированы как одинаковые.
В сущности, путем размышлений я понял что не существует надежного способа без учета IP отсеивать фрод. Можно усложнить задачу злоумышленникам, но при желании они подделают все что угодно. Я сам распутывал такие клубки, и это не так уж сложно.
А вот IP надежно идентифицирует юзера, если бы не NAT. Конечно есть прокси, в том числе десятки тысяч бесплатных, но они легко отсеиваются, т.к. их несложно получить из тех же мест из которых их будут получать фродеры.
Таким образом остается актуальным вопрос - сколько за NAT у оператора сидит юзеров. Причем, ситуация осложняется тем что это все в одном городе, то есть общее количество IP-адресов будет не так велико как для РФ вообще.
Дмитрий, Вот например вопрос: "какова вероятность что если 15 мая в приморье вы пойдете в лес, в вас вопьется клещ?" Я могу сказать - 100%, вопьется не менее 10, если ничем не брызгаться. Это реальная инфа, основанная на моем опыте.
А если я не знаю, то мне лучше промолчать. Но если хочется вставить свои 5 копеек, то можно сказать - "эй, чувак, не надо ходить весной в лес!" или "слушай, давно уже придуманы прививки". или - "ну.... может ни одного не впиться, а может тысяча... никто не знает точно". Все эти ответы - бесполезны.
Дмитрий, Мешал. Ну как, довольно просто. Сайт (фронт) может использовать webassembly для вычисления некого хеша, одновременно такой же хеш по тому же алгоритму вычисляется на сервере. Если хеши одинаковы, то все ок, реальный чел (ну или selenium).
Реализовать исполнение webasm трудоемко, то есть приходится использовать реальный браузер. Это сильно замедляет парсинг, хоть и не делает его невозможным. Но эта идея может быть реализована криво - один и тот же хеш можно использовать многократно с разных IP. То есть на сотню потоков обычных реквестов, можно было иметь всего один браузер, который в цикле получает нужный хеш и делится им со всеми потоками парсинга. Как-то так...
Refguser, Вопрос был - сколько может сидеть на 1 IP адресе человек. На практике. То есть не в теории и не расплывчато "много" или "мало", а вот например заходят по рекламной ссылке 1000 человек в течение суток, насколько часто будут совпадать IP адреса при том что юзеры разные.
Я хочу найти человека, который обладает такой информацией хотя бы приблизительно. А так, парсингом я и сам 10 лет занимался, и защиты всякие обходил, вплоть до таких на которых webassembly используется. Все это обойти можно, идеальной защиты не существует, вопрос лишь в цене такого обхода.
Но меня интересует - можно ли использовать IP в качестве идентификатора.
То что прокси можно юзать это меня не сильно парит. Прокси можно детектить, отсекать бОльшую часть, а хорошие прокси стоят столько что цена слива бюджета конкурента сделает затею не выгодной.
Refguser, Задача вроде описана довольно ясно. Есть сервис, в котором, скажем так, рекламодатели, покупают просмотры своих карточек в ленте.
Можно использовать для учета куку. Но ее легко подделать и сливать бюджет конкурента.
Можно IP. Но тогда возможна ситуация, что просмотры карточек разными посетителями будут засчитаны как просмотр одним человеком. Если это будет случаться относительно редко, то и хрен с ним. Этот вопрос и интересует. Каким именно образом создать систему подсчета, тут я думать за меня не прошу, своя голова есть.
Интересует сугубо вопрос - насколько часто будут разные юзеры заходить с одного IP. При этом, вариант с роутером на котором сидит мобильный, можно не учитывать.
Да, еще следует добавить что 90% посетителей будут с одного региона.
При помощи просто кук невозможно организовать надежную защиту от слива бюджета конкурентами.
Надо продумывать какую-то систему, и она все равно будет ненадежна, ее можно будет обойти. Но если сделать ее достаточно хитро, стоимость ее обхода может оказаться чрезмерной.
Авторизация по паролю мне не очень нравится. Юзер должен иметь возможность очень быстро зарегаться на сайте, поэтому у меня одноразовые коды на телефон или емайл, а также авторизация через телеграм-бота, а JWT токен имеет длительный срок хранения. Эту схему считаю оптимальной.
Написано
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Есть сценарии в которых IP не годится.
В моем случае возможен такой вариант: реклама на спинках сидений автобусов. Посетитель ее видит и заходит на сайт прям с автобуса. А там вайфай бесплатный… хотя наверное мало кто им пользуется.
Но вот сколько человек за 1 IP может сидеть у оператора в одном регионе, это вопрос. Если сотни, то может получиться что 10% разных людей будут идентифицированы как одинаковые.
В сущности, путем размышлений я понял что не существует надежного способа без учета IP отсеивать фрод. Можно усложнить задачу злоумышленникам, но при желании они подделают все что угодно. Я сам распутывал такие клубки, и это не так уж сложно.
А вот IP надежно идентифицирует юзера, если бы не NAT. Конечно есть прокси, в том числе десятки тысяч бесплатных, но они легко отсеиваются, т.к. их несложно получить из тех же мест из которых их будут получать фродеры.
Таким образом остается актуальным вопрос - сколько за NAT у оператора сидит юзеров. Причем, ситуация осложняется тем что это все в одном городе, то есть общее количество IP-адресов будет не так велико как для РФ вообще.