С помощью чего проанализировать данные и построить свою нейронную сеть для бана пользователей?

Question

mitaichik @mitaichik

С помощью чего проанализировать данные и построить свою нейронную сеть для бана пользователей?

Есть проект, что-то типа онлайн магазина.
К нам захаживают пользователи, которые совершают нехорошие действия.
Если сравнивать с интернет-магазином - то добавляют товар в корзину, переходят на страницу оплаты, и спустя время отказываются, либо просто закрывают страницу заказа.

Делают они это специально, нужно им (не с целью навредить нам, но вот им нужно)
Делают это массово, в основном - в ручную, то есть реально тыкают в телефоне, с реальных устройств, с абсолютно разных ip, из разных стран.

Да им волю - они таких заказов насоздают по несколько тысяч в день.

Все бы ничего, но вот только для нас такой цикл (корзина - попытка оплаты - отмена) стоит приличных денег (специфика бизнеса)

Естественно, у нас есть разные бан-фильтры, и мы их баним, баним IP адреса, пользователей, устройства, иногда и подсети. Но:
- не всегда хорошо срабатывает, иногда зацепляет реальных пользователей.
- банит она уже после того, как пользователь совершил некоторое число нехороших действий.

Решили попробовать нейронные сети.
Что провести анализ действий данных персонажей и выявить паттерны поведения, и на основе них банить превентивно.

Есть большая база (десятки миллионов строк) действий пользователей - какой и когда товар просматривали, когда добавляли в корзину, когда нажимали кнопочку оплатить, закрыли ли просто страницу оплаты или отменили заказ, ФИО покупателя (это забавно, но злоумышленники не парятся над именами - Иванов Иван Иванович - имеет довольно существенный вес для бана)
Есть список уже забаненых злоумышленников по нашим текущим алгоритмам.

Вопрос: чем анализировать и с помощью чего строить нейронку?
У нас в команде нет человека с компетенциями в данной области.
По времени не сказать что спешим - либо своего подучим, либо кого-то найдем.

Но нужно понимать в какую сторону копать.
Какую книжку прочитать спецу?
На основе чего делать нейронку?

Я вот сейчас смотрю книгу по TensorFlow - оно?

Вопрос задан 09 сент.
182 просмотра

3 комментария

Подписаться 1 Простой 3 комментария

rPman @rPman

а нет ли у таких пользователей реальной причины так делать? например вы скрываете необходимую информацию (цены, скидки, способы доставки и т.п.) до тех пор пока не начнется оплата?

для нас такой цикл (корзина - попытка оплаты - отмена) стоит приличных денег (специфика бизнеса)
как такое возможно? действительно, как можно такое простое действие сделать для бизнеса платным?

допускаю что если используются банковские карты, то это платно, но я правильно понимаю что у вас до реальных переводов дело не доходит?

Написано 10 сент.
alexalexes @alexalexes

Банально капчу повесить на старт процесса оформления заказа, если частота перехода в него сомнительная.

Написано 10 сент.
shurshur @shurshur

rPman, скорее всего, они товар резервируют при добавлении в корзину. И не могут продать его больше никому.

Написано 11 сент.

Помогут разобраться в теме Все курсы

Яндекс Практикум

Специалист по Data Science плюс

17 месяцев

Далее
Skillbox

Профессия Machine Learning Engineer

12 месяцев

Далее
Центр непрерывного образования ФКН НИУ ВШЭ

Глубинное обучение

10 недель

Далее

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- 26 окт.
- 114 просмотров
1

ответ
Нейронные сети

Простой
Как надиктовывать текст голосом в Cursor?
- 1 подписчик
- 24 окт.
- 92 просмотра
1

ответ
Нейронные сети

Средний
Имеют ли нейросети или надстройки над ними возможность анализа «полноты» вопроса?
- 1 подписчик
- 23 окт.
- 85 просмотров
2

ответа
Нейронные сети

Сложный
Как организовать разбивку по таймкодам текста из 30000 слов?
- 1 подписчик
- 18 окт.
- 67 просмотров
0

ответов
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент.
- 97 просмотров
1

ответ
Нейронные сети

Средний
Каков объём данных, передаваемых между узлами ComfyUI и где они хранятся (RAM/VRAM/...)?
- 1 подписчик
- 28 сент.
- 82 просмотра
1

ответ
Машинное обучение

+1 ещё

Средний
Есть ли готовая архитектура модели, которая принимает на вход подобный формат данных?
- 3 подписчика
- 27 сент.
- 160 просмотров
0

ответов
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 6 подписчиков
- 22 сент.
- 1369 просмотров
5

ответов
Нейронные сети

Простой
Отечественные нейронки для кодинга и не только сентябрь 2025?
- 1 подписчик
- 22 сент.
- 249 просмотров
3

ответа
Нейронные сети

Простой
Какая AI модель дешевле в пересчете на решение задачи в программировании?
- 1 подписчик
- 21 сент.
- 278 просмотров
3

ответа
Показать ещё Загружается…

Frontend Developer/ Vue.js

DevTeam.Space • Москва

от 1 000 до 3 000 $

SRE/DevOps инженер

Сбер • Москва

от 200 000 до 300 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

а нет ли у таких пользователей реальной причины так делать? например вы скрываете необходимую информацию (цены, скидки, способы доставки и т.п.) до тех пор пока не начнется оплата?

для нас такой цикл (корзина - попытка оплаты - отмена) стоит приличных денег (специфика бизнеса)
как такое возможно? действительно, как можно такое простое действие сделать для бизнеса платным?

допускаю что если используются банковские карты, то это платно, но я правильно понимаю что у вас до реальных переводов дело не доходит?
Банально капчу повесить на старт процесса оформления заказа, если частота перехода в него сомнительная.
rPman, скорее всего, они товар резервируют при добавлении в корзину. И не могут продать его больше никому.

Answer 1 · 2025-09-09 23:41:40

1. Размечаешь датасет вся информация о действиях пользователя и метка хороший/нехороший

2. Арендуешь сервер с gpu

3. Разворачиваешь Базу в которой будут хранится размеченные данные. (плюс mlflow и airflow требуют коннекта к бд)

4. Разворачиваешь в докере mlflow для трекинга результатов экспериментов.

5. Разворачиваешь в докере airflow для управления тасками (композиции пайплана тренировки определенной архитектуры нейронной сети и оценки результатов)

6. Возможно понадобится векторная база тоже поднимаешь в докере (в зависимости от архитектуры нейронной сети), ты можешь создать эмбеддинги "плохих пользователей" (портреты так сказать) и потом транслировать поведение пользователей которые заходят на сайт в эмбеддингии искать ближайшие (тех кто похож).

7. Здесь можно и нейронки и классификатор с xgboost/catboost попробовать, что не отменяет необходимость трекировать эксперименты.

8. В целом либо классическая архитектура нейрокна получает на вход информацию в определенном представлении и выдает вероятность пользователя быть "нехорошим" либо вариант с созданием эмбеддинга либо и то другое.

Это если реально интересен результат продакшен уровня, а не просто пойграться с нейронками и их параметрами.

Answer 2 · 2025-09-10 05:14:45

Нейронная сеть в первую очередь это про выбор формы и сбор данных, на основе которых будет приниматься решение. Выбор алгоритмов вторичны. В подавляющем большинстве случаев правильно подобранные данные вообще позволяют обойтись классическими алгоритмами (бывает что для самого сбора данных может понадобиться нейронная сеть но принятие решение может остаться классическим).

Начните с формального описания процесса выявления злонамеренных пользователей, как вы это делаете вручную, в идеале, представьте что вы описываете процесс человеку с улицы, который вообще в вашем бизнесе ничего не понимает.

p.s. кстати атака такого рода - это классический ddos (его почему то все воспринимают как исключительно сетевая атака в виде огромного количества запросов, но это не только так) на вашу платежную систему и возможно красивое решение кроется в изменении бизнеспроцессов. Типовое решение - ввести KYC, нужна какая то относительно надежная система аутентификации пользователей, минимально защищенная от мультиаккаунта (в интернете таковой является авторизация по телефонному номеру, это фактически интернет паспорт). Еще способ - сделать регистрацию 'платной', и платить не обязательно деньгами, помню был месседженер - bitmessage (в нем сообщения требовали вычислений (proof of work), обычный пользователь с небольшим количеством сообщений нагрузку не заметит а вот злоумышленник уже не сможет отсылать сотни сообщений, точнее это станет дорого)

С помощью чего проанализировать данные и построить свою нейронную сеть для бана пользователей?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт