У пользователя есть статьи, у каждой статьи лайки. Нужно вычислить среднее количество лайков, учитывая, что отдельные посты могут иметь на порядок больше лайков. Среднее арифметическое не подходит из-за таких постов, медиана тоже не подходит. По какой формуле можно адекватно вывести среднее значение? С примером, если можно.
Может упорядочить числа по убыванию и сумму первой половины чисел разделить на сумму второй половины.
Я не силен в математике, подскажите, пожалуйста.
В большинстве случаев вроде бы и подходит, но один конкретный случай такой:
10, 11, 15, 16, 19, 119, 277, 280, 301
В этом случае медиана - 19. Не совсем среднее. Медиана идеально подходит, если все числа более-менее одинаковы и есть несколько "скачков". Может быть есть какая-нибудь формула, вычитания среднего арифметического с учетом этих самых "скачков"?
Какой-то универсальной формулы нет, конечно. Но вы можете придумать такую под себя - только вы же знаете, что такое "скачки" в ваших данных. Можете верхнюю границу взять и отбрасывать всё, что больше неё, можете, как я писал выше, искать медиану для перцентили (но в приведённом примере она всё равно не даст меньше 19, если отбрасывать сверху и снизу).
Судя по формулировке вопроса Вам нужно посмотреть на поведение людей, сделавших лайки.
Для таких задач больше подходит когортный анализ, в котором средние отсутствуют в большинстве случаев.
Ну а уж если брать среднюю, то лучше уже средневзвешенную, которая учитывает вес (количество прочтений) того или иного поста.