Как узнать, что диапазон находится в пределах нормы отклонений?
Друзья, всем привет. Контекст.
С сервиса получаем временные диапазоны.
Могут быть такими: 20 сек, 22 сек, 19 сек, 18 сек, 23 сек, 24 сек.
Таких диапазонов можем получить, например, 100. Задача
Нам надо проверить, что 60% диапазонов находятся в пределах колебаний +-3 секунды.
Никак не пойму как это сделать. Помогите плиз.
В науке и мат-статистике это называется процентиль (percentile).
Многие математические пакеты и SQL диалекты имеют встроенную функцию
для расчета П. Медиана и квартиль - это просто частные случаи процентиля.
В твоем случае 60-й процентиль не более чем какая-то величина. Но тебе надо мерять
не сверху а сверху и снизу. И тут надо немного подумать.
По поводу колебаний. Если я правильно понимаю то 20 сек, 22 сек, 19 сек, 18 сек, 23 сек, 24 сек
это выборка, а колебания - это разности между соседями. Тоесть
1. Вычислить среднее, определяем границы совпадений, проверяем значение, все ли попадают в диапазон. True
2. Если этого недостаточно (смещения и т.д.) - разница между первым 25 и третьи 75 квартилями. Вычисляйте первый и третий квартиль, определяйте разницу, проверьте, рассчитайте. Это будет более точно.
Колебаний относительно чего? пусть будет некое число x0. pandas псевдокод будет такой
s - Series с временными диапазонами
x0 - относительно чего колебания ((x0 - s).abs() <= 3).mean() * 100 Это количество в процентом отношении значений которые отклоняются от x0 в пределах +-3 секунд
1. Вычислить среднее, определяем границы совпадений, проверяем значение, все ли попадают в диапазон. True
2. Если этого недостаточно (смещения и т.д.) - разница между первым 25 и третьи 75 квартилями. Вычисляйте первый и третий квартиль, определяйте разницу, проверьте, рассчитайте. Это будет более точно.