Как проанализировать итоги голосования?

Question

vgray @vgray

Как проанализировать итоги голосования?

Добрый день,

На сайте происходят голосования, за N объектов голосуют M пользователей.

N - где-то около 1000
M - где-то около 30000

За месяц набегает около 30-40 тыс голосований.

Каждый может за один объект голосовать только один раз (положительно или отрицательно), по результатам голосования раздаются плюшки. Есть подозрение, что пользователи формируют негласные договоренности и организуются в кланы, которые голосуют положительно за своих и отрицательно за чужих.

Как с помощью статистики можно эту теорию проверить?

Вопрос задан более трёх лет назад
195 просмотров

4 комментария

Подписаться 1 Оценить 4 комментария

Zhainar @zhainar

побольше о голосовании можно? что-то непонятно за сколько объектов за раз голосуют, и как за месяц проводятся 30-40к голосований?

Написано более трёх лет назад
vgray @vgray Автор вопроса

Zhainar: например взять хабр. В месяц размещают 1000 (N) топиков, за топики могут голосовать пользователи (их около 30000, M).

за топик можно проголосовать один раз, или нравится или не нравится.

Вот и получается что 30000 пользователей голосуют как хотят за 1000 топиков и в месяц получается около 30-40 тыс голосов.

Написано более трёх лет назад
Zhainar @zhainar

vgray: могу лишь смотреть статистику голосований против, обычно если статься хорошая то голосов против бывает меньше голосов за. То есть стата 1000+/1000- может что-то сказать? Получается многим нравится и многим резко не нравится. Надо проанализировать статистику того же хабра со своими данными (сколько голосуют за хорошие статьи, каков процент за и против у них, много ли постов с большим количеством голосов за и против). Каково среднее количество голосов против? Как они распределяются по всем статьям? Что будет если убрать голоса против?

Написано более трёх лет назад
Zhainar @zhainar

* возможность голоса против.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Data Scientist с нуля

10 месяцев

Далее
Академия Эдюсон

Machine Learning: тариф Базовый

7 месяцев

Далее
ProductStar × РБК

Математика и статистика для аналитика на Python

1 месяц

Далее

Пригласить эксперта

Ответы на вопрос 1

2 комментария

vgray @vgray Автор вопроса

Если продолжить аналогию с хабром, (см мой ответ для Zhainar ) то часть топиков написана пользователями которые входят в свой клан и за них нужно голосовать много и строго положительно. за другие посты (не за все, а только которые угрожают забрать плюшки) нужно голосовать отрицательно.

С какой стороны подступиться к задаче и как опредить есть такие кланы (кластеры) которые голосуют за топики от своих авторов и голосуют против топиков других авторов.

Написано более трёх лет назад
Александр Поляков @MakedonskyLF

Думаю можно начать с чего-то такого: https://habrahabr.ru/company/dca/blog/265077/
как признаки - брать оценку выставленную пользователем объекту.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Математика

Средний
Что такое отношения в предикатной логике?
- 1 подписчик
- 05 июл.
- 141 просмотр
2

ответа
Карьера в IT

+1 ещё

Средний
Хочу попробовать стать системным аналитиком, с чего лучше начать и во сколько попытаться найти работу?
- 5 подписчиков
- 25 июн.
- 956 просмотров
6

ответов
C++

+1 ещё

Простой
Как правильно посчитать UV координаты из локальных нормальных?
- 1 подписчик
- 20 июн.
- 108 просмотров
1

ответ
Информационная безопасность

+3 ещё

Простой
Утечка кейвордов в Телеграм при посещении постороннего сайта?
- 3 подписчика
- 03 июн.
- 316 просмотров
3

ответа
IT-образование

+2 ещё

Средний
Бизнес и системный аналитик: кто это?
- 2 подписчика
- 29 мая
- 409 просмотров
3

ответа
Машинное обучение

+1 ещё

Простой
Какие темы в статистике нужно изучить прежде всего, чтобы начать решать простые задачи машинного обучения?
- 2 подписчика
- 25 мая
- 220 просмотров
2

ответа
Математика

Простой
Биекция в комбинаторике на конечных множествах?
- 1 подписчик
- 30 апр.
- 134 просмотра
1

ответ
Аналитика

Средний
DAX \ Power BI как сделать меру через промежуточную таблицу?
- 2 подписчика
- 08 апр.
- 72 просмотра
1

ответ
Математика

Простой
Расчет формулы метода Фулмера. Что делать если при расчете логарифма на входе получается отрицательное число?
- 2 подписчика
- 30 мар.
- 265 просмотров
3

ответа
Программирование

+1 ещё

Простой
Стоит ли поступать в вуз на программу по математике, если в будущем хочешь иметь профессию, связанную с программированием?
- 4 подписчика
- 07 мар.
- 3562 просмотра
7

ответов
Показать ещё Загружается…

побольше о голосовании можно? что-то непонятно за сколько объектов за раз голосуют, и как за месяц проводятся 30-40к голосований?
Zhainar: например взять хабр. В месяц размещают 1000 (N) топиков, за топики могут голосовать пользователи (их около 30000, M).

за топик можно проголосовать один раз, или нравится или не нравится.

Вот и получается что 30000 пользователей голосуют как хотят за 1000 топиков и в месяц получается около 30-40 тыс голосов.
vgray: могу лишь смотреть статистику голосований против, обычно если статься хорошая то голосов против бывает меньше голосов за. То есть стата 1000+/1000- может что-то сказать? Получается многим нравится и многим резко не нравится. Надо проанализировать статистику того же хабра со своими данными (сколько голосуют за хорошие статьи, каков процент за и против у них, много ли постов с большим количеством голосов за и против). Каково среднее количество голосов против? Как они распределяются по всем статьям? Что будет если убрать голоса против?

Answer 1 · 2016-06-13 14:15:58

Для начала нужно определиться с пространством признаков. Что значит что объект "свой" или "чужой". ну а далее можно начать с разбиения на кластеры и анализ полученных классификаторов.

Как проанализировать итоги голосования?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт