Как выиграть подбрасывая монетку, зная что монета может быть несимметричной, но не зная какая именно и в какую сторону?

Question

Elick @Elick

Как выиграть подбрасывая монетку, зная что монета может быть несимметричной, но не зная какая именно и в какую сторону?

Задался теоретическим вопросом игры в подбрасывание монетки.
Суть игры наверное всем уже понятна. Допустим у нас есть набор из разных монет, мы можем каждую из них отличать. Мы приходим к организатору игры, он дает нам выбрать монету. Для упрощения мы можем ставить только на выпадение орла и организатор дает коэффициент на выигрыш всегда только 2 (т.е. в случае выпадения орла мы удваиваем).
Допустим мы знаем, что монеты вполне возможно могут быть намагниченные, несимметричные и т.п., т.е. вероятности могут ощутимо отклоняться от 50/50 в одну из сторон, но мы не знаем для какой монеты и в какую сторону.
Как понять определить вероятность, что определенная монета будет "кривая" (допустим орел выпадает чаще, т.е. ставя на эту монету постоянно, мы получим положительное мат.ожидание), если мы имеем историю из N подбрасываний для монеты?

UPD: У нас есть тренировочные попытки подбрасывания каждой монеты, как найти вероятность, того что монета несимметричная?

from scipy.stats import beta
import pandas as pd
import numpy as np

p = 0.6

monet = pd.DataFrame([np.random.binomial(1,p) for i in range(100)])[0]
print(f'Выборочная вероятность орла: {monet.mean()}')

a = monet.sum() 
b = len(monet) - monet.sum()
apost = beta(a,b)
x = np.linspace(0,1,10000)

fig, ax = plt.subplots(figsize=(18,10)) 
mean = apost.mean()
std = apost.std()
ax.plot(x, apost.pdf(x), linewidth=2)
ax.grid()
ax.fill_between([mean - 3*std, mean + 3*std], 0, apost.pdf(x).max(), alpha = 0.3)
ax.fill_between([mean - 2*std, mean + 2*std], 0, apost.pdf(x).max(), alpha = 0.3)
ax.fill_between([mean - std, mean + std], 0, apost.pdf(x).max(), alpha = 0.3)
plt.xlim([mean - 4*std,mean + 4*std])
ax.vlines(1/2, 0, apost.pdf(x).max(), color = 'r', linewidth=2) 
ax.vlines(monet.mean(), 0, apost.pdf(x).max(), color = 'black', linewidth=2)

Я тут набросал код на python, строящий beta распределение для эксперимента с подбрасыванием монеты 100 раз, при этом если сторона 1 (орел) будет выпадать с вероятностью 60%. Закрашенные области это 1,2,3 сигмы (по сути доверительные интервалы с определенными вероятностями, я точно не помню какими). Красная линия это по сути вероятность организатора, если он дает всегда коэффициент 2, черная - это выборочная вероятность (~63% при истинной в 60%).
По сути если взять площадь справа от красной линии, то мы измерим вероятность того, что вероятность выпадения орла больше 50%, так ли это? И вообще насколько это корректно?

Вопрос задан более трёх лет назад
1524 просмотра

2 комментария

Подписаться 1 Простой 2 комментария

Elick @Elick Автор вопроса

Может быть строить бета распределение и смотреть площадь распределения от 50% до 100% в сторону орла. Если нижняя граница доверительного интервала будет больше 50% процентов, то монета "кривая"

Написано более трёх лет назад

Elick @Elick Автор вопроса

Либо аналогично построить распределение средних, которое по определению близко к нормальному ~N(m, ss/sqrt(n)), где m - это выборочная вероятность орла, n - количество наблюдений, ss - выборочное стандартное отклонение

p = 0.6

monet = pd.DataFrame([np.random.binomial(1,p) for i in range(100)])[0]
print(f'Выборочная вероятность орла: {monet.mean()}')

mm = monet.mean()
ss = monet.std()
apost = norm(mm,ss/len(monet)**(1/2))
x = np.linspace(0,1,10000)

fig, ax = plt.subplots(figsize=(18,10)) 
mean = apost.mean()
std = apost.std()
ax.plot(x, apost.pdf(x), linewidth=2)
ax.grid()
ax.fill_between([mean - 3*std, mean + 3*std], 0, apost.pdf(x).max(), alpha = 0.3)
ax.fill_between([mean - 2*std, mean + 2*std], 0, apost.pdf(x).max(), alpha = 0.3)
ax.fill_between([mean - std, mean + std], 0, apost.pdf(x).max(), alpha = 0.3)
plt.xlim([mean - 4*std,mean + 4*std])
ax.vlines(1/2, 0, apost.pdf(x).max(), color = 'r', linewidth=2) 
ax.vlines(monet.mean(), 0, apost.pdf(x).max(), color = 'black', linewidth=2)

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Фронтенд-разработчик

11 месяцев

Далее
Skillfactory

DevOps-инженер

6 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

3 комментария

Elick @Elick Автор вопроса

Это не упрощение, а усложнение. Может быть все монеты чаще падают решкой, тогда ваши шансы на выигрыш в короткой серии бросков будут малы, а в длинной серии будут стремиться к нулю.

Подразумевается, что мы не обращаем внимание на монеты, где распределение дает нам отрицательное матожидание. Т.е. вместо двух кнопок "орел" "решка" у нас только одна "орел" и мы уже решаем играть на него или нет, это по идее упрощение.

Если не ставить такое ограничение, то можно предложить простейшую стратегию: делать ставку на сторону, которая выпала в прошлом броске.

Я так понимаю в данном случае предыдущая монетка будет как бы генератором выбора. При этом, если монета кривая, то она чаще будет генерировать правильную сторону.
Хотя если выбирать случайным образом 50/50 сторону, то все-равно будет плюс.
Т.е. суть не найти стратегию, а определить, что мат.ожидание на ставку на орла будет положительное имея историю из N подбрасываний, тогда уже плюс на дистанции обеспечен.

Написано более трёх лет назад
hint000 @hint000

Elick,
Подразумевается, что мы не обращаем внимание на монеты, где распределение дает нам отрицательное матожидание.
Не начав игру, вы не можете узнать матожидание. Так что вам придётся потратить некоторую сумму просто на то, чтобы решить, что с этой монетой вы не хотите играть. Тогда как без ограничения стороны вы гарантируете себе выигрыш с любой кривой монетой.

Хотя если выбирать случайным образом 50/50 сторону, то все-равно будет плюс.
Нет, при случайном выборе на длинной серии бросков будете выходить вничью с любой монетой.

Написано более трёх лет назад
Elick @Elick Автор вопроса

hint000,

Не начав игру, вы не можете узнать матожидание
Понял вас, я был некорректен, необратив внимание на то, что можно в холостую погонять монеты, т.е. без ставок

Нет, при случайном выборе на длинной серии бросков будете выходить вничью с любой монетой.
Да, кажется я поторопился с выводами. Хотя в случае равных вероятностей стратегия ставки на то, что выпало предыдущее, также не даст плодов. Это все имеет смысл, пока не вводится маржа организатора и коэффициенты не занижаются (т.е. можно быть как минимум в нуле). Иначе, необходимо будет как можно с большей вероятностью определять кривая ли монета, при этом используя наименьшее количество тренировочных подбросов.

Написано более трёх лет назад

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Математика

+3 ещё

Средний
Как выбрать размеры интервалов для неравно интервального вариационного ряда?
- 1 подписчик
- 24 июн.
- 180 просмотров
2

ответа
Теория вероятностей

Средний
Какой бонус лучше выбрать при броске 20-гранной кости?
- 1 подписчик
- 31 мар.
- 116 просмотров
1

ответ
Теория вероятностей

+1 ещё

Средний
Как посчитать вероятность по формуле Байеса в экспертной системе?
- нет подписчиков
- 25 янв.
- 97 просмотров
1

ответ
Математическая статистика

Средний
Как интерпретировать возникновение точки перегиба на графике дисперсии?
- 2 подписчика
- более года назад
- 170 просмотров
0

ответов
Теория вероятностей

Простой
Моя ошибка или ошибка системы?
- 1 подписчик
- более года назад
- 116 просмотров
1

ответ
Теория вероятностей

Простой
Почему моё решение неправильное?
- 1 подписчик
- более года назад
- 113 просмотров
3

ответа
Нейронные сети

+2 ещё

Сложный
Как можно спрогнозировать событие, основываясь на существующие данные и исходы?
- 2 подписчика
- более года назад
- 227 просмотров
1

ответ
Теория вероятностей

Средний
Как найти вероятность извлечения шара одного цвета, если до этого был другого?
- 1 подписчик
- более года назад
- 179 просмотров
1

ответ
Машинное обучение

+1 ещё

Сложный
Как задетекировать изменение вероятности успеха в испытаниях Бернулли?
- 2 подписчика
- более года назад
- 739 просмотров
1

ответ
Программирование

+4 ещё

Простой
Какая отрасль программирования занимается анализом видео и картинок машин с дорог(штрафы ставит)?
- 2 подписчика
- более года назад
- 314 просмотров
2

ответа
Показать ещё Загружается…

PHP-разработчик (Symfony)

еКапуста

от 250 000 до 450 000 ₽

Разработчик WebRTC-сервисов на Go в видеоплатформу

Яндекс • Москва

от 300 000 до 490 000 ₽

Старший инженер

Гринатом • Петрозаводск

До 80 000 ₽

Может быть строить бета распределение и смотреть площадь распределения от 50% до 100% в сторону орла. Если нижняя граница доверительного интервала будет больше 50% процентов, то монета "кривая"
Либо аналогично построить распределение средних, которое по определению близко к нормальному ~N(m, ss/sqrt(n)), где m - это выборочная вероятность орла, n - количество наблюдений, ss - выборочное стандартное отклонение

p = 0.6 monet = pd.DataFrame([np.random.binomial(1,p) for i in range(100)])[0] print(f'Выборочная вероятность орла: {monet.mean()}') mm = monet.mean() ss = monet.std() apost = norm(mm,ss/len(monet)**(1/2)) x = np.linspace(0,1,10000) fig, ax = plt.subplots(figsize=(18,10)) mean = apost.mean() std = apost.std() ax.plot(x, apost.pdf(x), linewidth=2) ax.grid() ax.fill_between([mean - 3*std, mean + 3*std], 0, apost.pdf(x).max(), alpha = 0.3) ax.fill_between([mean - 2*std, mean + 2*std], 0, apost.pdf(x).max(), alpha = 0.3) ax.fill_between([mean - std, mean + std], 0, apost.pdf(x).max(), alpha = 0.3) plt.xlim([mean - 4*std,mean + 4*std]) ax.vlines(1/2, 0, apost.pdf(x).max(), color = 'r', linewidth=2) ax.vlines(monet.mean(), 0, apost.pdf(x).max(), color = 'black', linewidth=2)

Answer 1 · 2022-02-07 06:18:13

Для упрощения мы можем ставить только на выпадение орла

Это не упрощение, а усложнение. Может быть все монеты чаще падают решкой, тогда ваши шансы на выигрыш в короткой серии бросков будут малы, а в длинной серии будут стремиться к нулю.

Если не ставить такое ограничение, то можно предложить простейшую стратегию: делать ставку на сторону, которая выпала в прошлом броске.
Более сложная стратегия - перед началом игры зафиксировать нечётное N, и после N бросков вычислять следующую ставку, как моду по N предыдущим броскам (или округлённое скользящее среднее, суть та же). В частном случае N=1 имеем выше упомянутую простейшую стратегию.

Answer 2 · 2022-02-07 02:45:10

Это уже статистика. Берете выборку для каждой монеты, считаете "хи-квадрат", получаете с заданным уровнем достоверности ответ: случайно это она так падает или есть отклонение от равномерного распределения. Если отклонение есть - то смотрите в какую сторону перекос вам дает выборка. Собственно на эту сторону и нужно делать ставки, удваивая каждый раз при проигрыше.

Например: с вероятность 60% орел, 40% решка. Ставлю рубль на орла. Проиграл. Ставлю 2 рубля. Проиграл. Ставлю 4 рубля. Проиграл. Ставлю 8 рублей. Выиграл. Итого прибыль 1 рубль. Так как вероятность выпадения орла больше, то в конечном итоге игрок больше выиграет чем проиграет.

Как выиграть подбрасывая монетку, зная что монета может быть несимметричной, но не зная какая именно и в какую сторону?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт