dalv_happy
@dalv_happy

Какой раздел статистики решает задачу идентификации?

Добрый день, занимаюсь задачей идентификации человека в качестве дипломной работы.

Задача: идентифицировать пользователя (анонимного, авторизованного) на сайте
Вводные: я собираю информацию о пользователе, такого рода как: гео позиция, версия ОС, платформа, GMT, хэш сумма канвас области, логин, если пользователь авторизирован, etag, facebook id
Соответственно некоторые параметры могут меняться, некоторые параметры со 100% гарантией говорят нам точно что за пользователь к нам зашёл.
Вопрос: Я имею базу данных уже идентифицированных пользователей с параметрами идентификации. Как мне вычислить, на сайт зашёл новый пользователь, которого мы ещё ни разу не идентифицировали или пользователь, который заходил на сайт?

Какая область статистики поможет мне решить задачу и сказать, какие библиотеки использовать на языке Python?

5ee386a14784c166623166.png
  • Вопрос задан
  • 116 просмотров
Решения вопроса 1
@dmshar
Конечно, статистика этим не занимается. Решение вашей задачи - типичная задача классификации (диагностирования) из области Machine Learning. А уж там "по метсу" -надо подбирать наиболее адекватный подход - Метод ближайших соседей, Деревья решений, нейросети и пр.- на сколько хватит сил, ресурсов и энтузиазма.
Библиотеки Python -Sklearn, Scipy, в первою очередь. Полезете в нейросети - Tensorflow, Keras, Pytorch
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
dimonchik2013
@dimonchik2013
non progredi est regredi
просто ( и примитивно): отпечаток + фильтр Блума
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы