Задать вопрос
@Hkey

Господа, в чем моя ошибка?

Нужно сравнить вероятности успеха в двух биномиальных распределениях, имея некоторую выборку испытаний для обоих вариантов. Назовем вариант у которого больше выборочное среднее вариантом А, второй вариантом Б.
Pa — вероятность успеха в варианте А., Pb в варианте B. Pa>Pb обозначим как A>B.

Строим доверительные интервалы для обоих вариантов. Подбираем альфу (доверительную вероятность) так, чтобы нижняя граница доверительного интервала варианта А была строго больше верхней границы варианта Б. Получаем два независимых события с вероятность альфа. Если они оба наступают, то вероятность того, что А>Б 100%. Следовательно, вероятность А>Б не меньше альфы в квадрате.

Когда выборочные средние не равны и число успехов больше нуля в обоих случаях, то мы получаем что альфа ненулевое. Т.е. вероятность строго больше нуля.

Однако, мы не знаем как распределяется вероятность успеха среди вариантов. И мы можем подобрать такое распределение, что вероятность А>Б равна нулю. Например, вероятность успеха всегда равна 0.5. Тогда мы получаем, что вероятность того, А > B = 0. Хотя до этого мы ее оценили, как строго большую нуля.

В чем моя ошибка?

— update: Изложу на примере.

Нам нужно потестировать форму регистрации на сайте. Какой из этих вариантов лучше в плане вероятности того, что пользователь ее заполнит. Мы создаем два варианта и направляем на них трафик случайным образом. Через месяц мы смотрим что на варианте А зарегистрировалось 105 пользователей. На варианте Б 99 пользователей. На оба варианта зашло по 1000 пользователей. И считаем доверительный интервал. Подбираем параметр альфа так чтобы интервалы не пересекались. Нас конкретные значения мало интересуют главное чтобы минимум интервала А был больше максимума Б, а альфа не равна нулю.
Вариант А лежит в своем диапазоне с вероятностью альфа. Вариант Б тоже в своем диапазоне с вероятностью альфа.
Вероятность того, что что оба варианта лежат в своих диапозонах одновременно равна альфа в квадрате. Если они лежат в своих диапазонах, то вариант А 100% лучше. Т.е. вероятность что вариант А действительно лучше больше альфы в квадрате.

Допустим альфа у нас получилась 0.5. В итоге мы получаем, что вероятность того что А лучше Б как минимум 0.25.
Мы возвращаемся на сайт чтобы прекратить эксперимент и оказывается, что мы допустили глупую ошибку в коде и пользователям вместо варианта Б показывался вариант А. Т.е. два одинаковых варианта. И А=B. Хотя до этого мы получили не нулевую вероятность того, что А строго больше Б.

В чем моя ошибка?
  • Вопрос задан
  • 2810 просмотров
Подписаться 2 Оценить Комментировать
Пригласить эксперта
Ответы на вопрос 1
может я конечно не правильно понял все описанное выше, но все же. Чтобы оценить два неизвестных параметра биномиального распределения случайной величины, задаетесь уровнем альфа, выбираете статистику с помощью которой будете оценивать неизвестный параметр и строите гамма-довереьтльный интервал для обейх случайных величин. построенные интервалы и будут оценкой неизвестных параметров распределения, в конкретном случае вероятности успеха в серии независимых испытаний бернулли. откуда вы берете что у вас два события с заданной вероятностью и тем более независимы? вы пытаетесь оценить вероятности не из вашего комплекса условий вовсе.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы