@Bioinformator
Biological scientist

Как вычислить дисперсию (генерировать псевдовыборки нельзя)?

Есть 100 наблюдений.
Для каждого из наблюдений может произойти
одно из четырех событий:
событие A - 15.9%
событие B - 13.0%
событие C - 31.0%
событие D - 40.1%
(вместе - 100%)
В суме получаем 100 значений (напремер A случилось 16 раз, B - 13,C - 31,D - 40)
Нужно найти SD (сигма) для каждого события, чтобы узнать, например будет ли значительным отклонением от нормы, если событие С произошло 37 раз а не 31.
(генерировать псевдовыборки нельзя)
  • Вопрос задан
  • 240 просмотров
Решения вопроса 1
Rsa97
@Rsa97
Для правильного вопроса надо знать половину ответа
ЕМНИП, дисперсия случайной величины - это матожидание квадрата отклонения случайной величины от её матожидания
D(X) = M((X-M(X))2)
То есть к вашей задаче понятие "дисперсия" неприменимо.

Здесь у вас речь идёт, скорее о проверке статистической гипотезы.
k = 100 - количество испытаний
m = 37 - количество событий C
p = 0.31 - гипотетическая вероятность события C
ε = |m/k-p| = |0.37-0.31| = 0.06
Вероятность того, что такое произошло оценивается как
P{|m/k-p| ≥ ε} ≤ p∙(1-p)/ε2/k = 0.31∙0.69/0.062/100 ≈ 0.59
Так что такой результат достаточно вероятен.

Если же предположить, что был 1000000 испытаний и 370000 раз выпало C, то вероятность такого результата уже будет ≤ 0.000059, что крайне маловероятно.
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы