Задача: оценить размер выборки перед проведением A/B-теста ->
N
Дано:
- значимость (альфа) -> alpha
- мощность (1 - бета) -> power
- частота (базовая конверсия) -> P
- минимальная дельта частоты (минимальное различие в конверсии) -> delta
Как я расчитываю размер выборки:
N = (Z
alpha + Z
power)
2 * ( 2 * P * (1 - P) ) / delta
2,
где Z-значения вычисляются из значимости и мощности.
Но я наткнулся на одну статью, в которой сказано, что эта формула даёт довольно точные результаты при 0.25 < P < 0.75. В остальных случаях вводится поправка:
phi = 2 * arcsin(P
1/2)
N = 2 * (Z
alpha + Z
power)
2 / (phi
1 – phi
2)
2
Ссылка на источник:
medstatistic.ru/articles/sample_size.pdf
Отсюда у меня три вопроса:
- Действительно ли при конверсиях ниже 25% нужно вводить эту поправку?
- Если поправку нужно вводить, то верна ли формула поправки для данной задачи:
N = 2 * (Zalpha + Zpower)2 / (2 * (arcsin(P1/2) –arcsin((P – delta)1/2)))2 - И на всякий случай: верна ли первая формула, по которой я считаю выборку?