Как вычислить дисперсию (генерировать псевдовыборки нельзя)?

Question

Serhii Silov @Bioinformator

Biological scientist

Как вычислить дисперсию (генерировать псевдовыборки нельзя)?

Есть 100 наблюдений.
Для каждого из наблюдений может произойти
одно из четырех событий:
событие A - 15.9%
событие B - 13.0%
событие C - 31.0%
событие D - 40.1%
(вместе - 100%)
В суме получаем 100 значений (напремер A случилось 16 раз, B - 13,C - 31,D - 40)
Нужно найти SD (сигма) для каждого события, чтобы узнать, например будет ли значительным отклонением от нормы, если событие С произошло 37 раз а не 31.
(генерировать псевдовыборки нельзя)

Вопрос задан более трёх лет назад
246 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Профессия Графический дизайнер PRO

15 месяцев

Далее
Нетология

Фронтенд-разработчик

11 месяцев

Далее

Решения вопроса 1

7 комментариев

Андрей @OLS

;-) Вероятность того, что С выпадет строго 310.000 раз в 1.000.000 испытаний будет тоже чрезвычайно мала.

Написано более трёх лет назад
Rsa97 @Rsa97

Андрей: В этом случае ε = 0 и вероятность такого результата ≤ ∞, то есть если такой результат был получен, то он полностью соответствует первоначальной гипотезе.

Написано более трёх лет назад
Андрей @OLS

Понял свою ошибку - неверно прочитал Вашу формулу. Хотя она мне все равно не очень понятна. При отклонении от моды например на 1 испытание из 1.000.000 (m/k=0.310001) значение получается значительно больше 1, почему тогда оно обозначено у Вас как "вероятность" ?

Написано более трёх лет назад
Rsa97 @Rsa97

Андрей: А там не зря стоит знак "меньше или равно", это оценка сверху. Понятно, что любая вероятность P будет меньше или равна единице, но условие P ≤ 1000 при этом тоже будет истинным.
Обычно вводится некая величина уровня значимости α, например α = 0.05, по которой проводят границу P. При P < α считается, что гипотеза неверна.

Написано более трёх лет назад
Rsa97 @Rsa97

Андрей: Для данного примера при ста испытаниях и α = 0.05 гипотеза не пройдёт при ε ≥ 0.207, то есть при получении менее 11 или более 52 событий C.
При миллионе испытаний и том же уровне значимости гипотезу нарушают менее 307932 или более 312068 событий C.

Написано более трёх лет назад
Андрей @OLS

Rsa97: А как называется конкретно этот критерий ?

Написано более трёх лет назад
Rsa97 @Rsa97

Андрей: Какой? α - уровень значимости, а сама формула оценки P - теорема Бернулли.

Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Математика

+3 ещё

Средний
Как выбрать размеры интервалов для неравно интервального вариационного ряда?
- 1 подписчик
- 24 июн.
- 181 просмотр
2

ответа
Теория вероятностей

Средний
Какой бонус лучше выбрать при броске 20-гранной кости?
- 1 подписчик
- 31 мар.
- 116 просмотров
1

ответ
Теория вероятностей

+1 ещё

Средний
Как посчитать вероятность по формуле Байеса в экспертной системе?
- нет подписчиков
- 25 янв.
- 97 просмотров
1

ответ
Математическая статистика

Средний
Как интерпретировать возникновение точки перегиба на графике дисперсии?
- 2 подписчика
- более года назад
- 170 просмотров
0

ответов
Теория вероятностей

Простой
Моя ошибка или ошибка системы?
- 1 подписчик
- более года назад
- 116 просмотров
1

ответ
Теория вероятностей

Простой
Почему моё решение неправильное?
- 1 подписчик
- более года назад
- 113 просмотров
3

ответа
Нейронные сети

+2 ещё

Сложный
Как можно спрогнозировать событие, основываясь на существующие данные и исходы?
- 2 подписчика
- более года назад
- 227 просмотров
1

ответ
Теория вероятностей

Средний
Как найти вероятность извлечения шара одного цвета, если до этого был другого?
- 1 подписчик
- более года назад
- 179 просмотров
1

ответ
Машинное обучение

+1 ещё

Сложный
Как задетекировать изменение вероятности успеха в испытаниях Бернулли?
- 2 подписчика
- более года назад
- 739 просмотров
1

ответ
Программирование

+4 ещё

Простой
Какая отрасль программирования занимается анализом видео и картинок машин с дорог(штрафы ставит)?
- 2 подписчика
- более года назад
- 314 просмотров
2

ответа
Показать ещё Загружается…

Ведущий Project Manager Middle+/Senior (Web-разработка)

AIR Production • Москва

от 150 000 до 200 000 ₽

React разработчик

ITK academy • Нижний Новгород

от 50 000 до 90 000 ₽

C# WinForms .Net разработчик

Ляпунов и Резниченко • Санкт-Петербург

от 350 000 ₽

Answer 1 · 2017-01-14 00:45:30

ЕМНИП, дисперсия случайной величины - это матожидание квадрата отклонения случайной величины от её матожидания
D(X) = M((X-M(X))²)
То есть к вашей задаче понятие "дисперсия" неприменимо.

Здесь у вас речь идёт, скорее о проверке статистической гипотезы.
k = 100 - количество испытаний
m = 37 - количество событий C
p = 0.31 - гипотетическая вероятность события C
ε = |m/k-p| = |0.37-0.31| = 0.06
Вероятность того, что такое произошло оценивается как
P{|m/k-p| ≥ ε} ≤ p∙(1-p)/ε²/k = 0.31∙0.69/0.06²/100 ≈ 0.59
Так что такой результат достаточно вероятен.

Если же предположить, что был 1000000 испытаний и 370000 раз выпало C, то вероятность такого результата уже будет ≤ 0.000059, что крайне маловероятно.

Как вычислить дисперсию (генерировать псевдовыборки нельзя)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт