Как кластеризовать пользователей в рекомендательных системах для выявления атаки?

Добрый день! Интересуюсь вопросом как выявить подозрительные аккаунты с помощью кластеризации пользователей, чтобы их оценки (заниженные или завышенные) не засчитывались в рекомендательных системах.
Достаточно информации как разделить пользователей по их интересам, но не могу найти как понять это реальные люди или это атака (например, кто-то захотел занизить оценку товара своего конкурента, а свою повысить).
Поделитесь своими мыслями или статьями.
Если не понятен вопрос, могу переформулировать.
Спасибо
  • Вопрос задан
  • 86 просмотров
Пригласить эксперта
Ответы на вопрос 3
dimonchik2013
@dimonchik2013
...а ну-ка пыль сдуй отсюда...
среднеквадратичное отклонение
верхний и нижний квартили
и т.д.

обычные статистические методы, ну и просто обрезка по нереальным параметрам, навроде роста 2,5 метра, коммента через минуту после публикации часового ролика и проч
Ответ написан
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
Проще всего выявить среднее отношение количества лайков к количеству просмотров по каждому унику.
И сделать допуск ширины в медианном "корридоре" в 50% от всех уникальных пользователей.
Все, оказавшиеся вне этого "корридора" - будут накрутчиками.
Ответ написан
@dmshar
Поделитесь своими мыслями или статьями.
Если не понятен вопрос, могу переформулировать.

Да тут вроде как понятливые собрались, так что можно и не переформулировать. Но если хотите - то конечно можете. А пока вы будете переформулировать отвечу кратко, что знаю.
Лично этой задачей не занимаюсь, но знаю людей, которые ей занимаются профессионально, т.е. для серьезных заказчиков. Так вот никто вам в открытую свои результаты не расскажет - как только такая информация становиться открытой - моментально найдутся особо умственно одаренные, которые будут пытаться это защиту обойти. Кому это надо?
А так, анализ проводится обычными методами из области Fraud Detection. Таких методов и инструментов много, книги на этот счет пишут. Но это все "нежное введение" в тему, далекие подступы к реальным кейсам. Ну как в банковских системах все наслышаны о методах ловли мошеннических операций, о которых пишут. Вроде как и вот-она, информация доступная всем - отклонения, поиск аномалий, 3 сигма, пространственные разрывы и пр. - , а как реально это функционирует в реальных банках - увы "know how" и тайна за семью печатями.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
21 сент. 2020, в 22:33
5000 руб./за проект
21 сент. 2020, в 21:56
60000 руб./за проект
21 сент. 2020, в 21:36
200000 руб./за проект