Задался теоретическим вопросом игры в подбрасывание монетки.
Суть игры наверное всем уже понятна. Допустим у нас есть набор из разных монет, мы можем каждую из них отличать. Мы приходим к организатору игры, он дает нам выбрать монету. Для упрощения мы можем ставить только на выпадение орла и организатор дает коэффициент на выигрыш всегда только 2 (т.е. в случае выпадения орла мы удваиваем).
Допустим мы знаем, что монеты вполне возможно могут быть намагниченные, несимметричные и т.п., т.е. вероятности могут ощутимо отклоняться от 50/50 в одну из сторон, но мы не знаем для какой монеты и в какую сторону.
Как понять определить вероятность, что определенная монета будет "кривая" (допустим орел выпадает чаще, т.е. ставя на эту монету постоянно, мы получим положительное мат.ожидание), если мы имеем историю из N подбрасываний для монеты?
UPD: У нас есть тренировочные попытки подбрасывания каждой монеты, как найти вероятность, того что монета несимметричная?
from scipy.stats import beta
import pandas as pd
import numpy as np
p = 0.6
monet = pd.DataFrame([np.random.binomial(1,p) for i in range(100)])[0]
print(f'Выборочная вероятность орла: {monet.mean()}')
a = monet.sum()
b = len(monet) - monet.sum()
apost = beta(a,b)
x = np.linspace(0,1,10000)
fig, ax = plt.subplots(figsize=(18,10))
mean = apost.mean()
std = apost.std()
ax.plot(x, apost.pdf(x), linewidth=2)
ax.grid()
ax.fill_between([mean - 3*std, mean + 3*std], 0, apost.pdf(x).max(), alpha = 0.3)
ax.fill_between([mean - 2*std, mean + 2*std], 0, apost.pdf(x).max(), alpha = 0.3)
ax.fill_between([mean - std, mean + std], 0, apost.pdf(x).max(), alpha = 0.3)
plt.xlim([mean - 4*std,mean + 4*std])
ax.vlines(1/2, 0, apost.pdf(x).max(), color = 'r', linewidth=2)
ax.vlines(monet.mean(), 0, apost.pdf(x).max(), color = 'black', linewidth=2)
Я тут набросал код на python, строящий beta распределение для эксперимента с подбрасыванием монеты 100 раз, при этом если сторона 1 (орел) будет выпадать с вероятностью 60%. Закрашенные области это 1,2,3 сигмы (по сути доверительные интервалы с определенными вероятностями, я точно не помню какими). Красная линия это по сути вероятность организатора, если он дает всегда коэффициент 2, черная - это выборочная вероятность (~63% при истинной в 60%).
По сути если взять площадь справа от красной линии, то мы измерим вероятность того, что вероятность выпадения орла больше 50%, так ли это? И вообще насколько это корректно?