Как задетекировать изменение вероятности успеха в испытаниях Бернулли?

Question

Иван Мельников @immelnikoff

Изучаю БД

Как задетекировать изменение вероятности успеха в испытаниях Бернулли?

В онлайне непрерывно происходят испытания Бернулли (показ рекламы – ипытание, клик – успех). Цель – как можно раньше задетектировать изменение (факт и величину) вероятности успеха p (CTR). p ∼ 0.001.
Вижу 2 случая (сильно упрщённых, но хотя бы с ними разобраться для начала):
1) p может меняться непрерывно и достаточно медленно;
2) p кусочно-постоянна, то есть от последнего изменения до последющего p неизменна. Про "время жизни" p нам ничего не известно.

Вопрос такой. Имеются ли какие-то уже разработанные методы для решения данной задачи?
Мои размышления относительно случая 2 такие (мне кажется, этот случай проще).
Давайте строить 2 доверетиельных интервала для p: один на показах с последнего задетектированного изменения p; второй на поседних N показах (N подбирается исходя из уровня значимости и |∆p|, который мы хотим детектировать). Но тут сразу видна проблема. Если |∆p| слишком большое, то это станет понятно задолго до N показов. Значит, нужно считать доверительные интервалы для p для последних 10, 11, ..., N испытаний. То есть доверительных интервалов у нас получается много. И вот тут возникает проблема как интерпертировать набор этих интервалов. Они могут иметь всевозможные паттерны перекрытий. И вот с этим проблема.
Из доверительных интервалов для вероятности успеха думаю использовать Wilson Score interval. Его рекомендуют использовать в этой статье – Confidence Intervals for the Binomial Proportion: ....

Вопрос задан более года назад
739 просмотров

Комментировать

Подписаться 2 Сложный Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Инженер машинного обучения

4 месяца

Далее
Skillbox

Профессия Machine Learning Engineer

12 месяцев

Далее
Stepik

Машинное обучение: Кросс-валидация и оптимизация гиперпараметров

2 недели

Далее

Решения вопроса 1

1 комментарий

Иван Мельников @immelnikoff Автор вопроса

Спасибо за ответ.
Выяснил, что данная задача имеет самостоятельное название – задача о разладке.
Насколько я понял, основные результаты в задаче о разладке получены академиком Ширеявым и причём относительно недвано.
Монография А.Н.Ширяева "Стохастические задачи о ра...

Что такое ЗАДАЧА О РАЗЛАДКЕ?

Пусть информация о случайном процессе (его измерение) поступает последовательно во времени. Это могут быть данные о динамике изменения какого-нибудь фондового индекса или другого случайного процесса, измерения которого колеблются со временем. Допустим, что в некоторый, заранее неизвестный, момент происходит изменение какой-либо вероятностной характеристики процесса (в общем случае, какой-либо функции распределения) — разладка. Требуется обнаружить произошедшее изменение и подать сигнал тревоги. Случайность мешает, поэтому возможны разные ошибки: 1) не просигналить тревогу при разладке, или 2) объявить тревогу без повода. Задача уточняется так: ложные сигналы тревоги не должны быть слишком частыми, (их частота ограничена заранее), а разладка должна быть обнаружена как можно скорее. Эта задача получила название задачи о скорейшем обнаружении разладки.

Примерами могут служить задачи скорейшего обнаружения случайно появляющихся целей, задачи обнаружения спонтанно возникающих эффектов, задачи скорейшего обнаружения момента появления арбитража (в финансовой математике) и т. п. Для многих информационных систем весьма актуальна разработка методов скорейшего обнаружения нежелательных случайно появляющихся .внедрений и создания методов защиты от кибератак.

Большинство задач скорейшего обнаружения удобно формулировать как задачи об оптимальной остановке, где момент остановки идентифицируется с моментом поднятия тревоги о появлении разладки. Поэтому в книге уделяется значительное внимание как общей теории оптимальных правил остановки, так и методам решения конкретных задач этой теории.

Написано более года назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Машинное обучение

+1 ещё

Средний
Есть ли готовая архитектура модели, которая принимает на вход подобный формат данных?
- 3 подписчика
- 27 сент.
- 164 просмотра
0

ответов
Машинное обучение

+1 ещё

Простой
Поиск по образцу. Как сделать быстрый поиск вхождения картинок-символов на большом чертеже?
- 2 подписчика
- 19 сент.
- 192 просмотра
1

ответ
Нейронные сети

+1 ещё

Простой
С помощью чего проанализировать данные и построить свою нейронную сеть для бана пользователей?
- 1 подписчик
- 09 сент.
- 188 просмотров
2

ответа
Нейронные сети

+1 ещё

Средний
Как повысить macro f1 в задаче классификации изображения?
- 1 подписчик
- 03 сент.
- 61 просмотр
0

ответов
Веб-разработка

+1 ещё

Простой
Какие есть ML-инструменты, которые по структуре или изображению лендинга предсказывают зоны внимания пользователей?
- 1 подписчик
- 28 авг.
- 398 просмотров
3

ответа
Видеокарты

+1 ещё

Средний
Целесообразно ли использование двух RTX 5080 для обучения нейросетей?
- 1 подписчик
- 24 авг.
- 392 просмотра
1

ответ
IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 463 просмотра
3

ответа
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 65 просмотров
0

ответов
Машинное обучение

+1 ещё

Простой
Reverse engineering black box ML-модели?
- 1 подписчик
- 10 июл.
- 147 просмотров
3

ответа
Python

+3 ещё

Простой
Как повысить точность классификации по табличным документам?
- 2 подписчика
- 19 мая
- 307 просмотров
1

ответ
Показать ещё Загружается…

WordPress (PHP, HTML/CSS) разработчик

Epiic

от 90 000 ₽

Tech Lead Vue Frontend

Icons8

от 350 000 ₽

Маркетинговый аналитик

МТС Web Services • Грозный

от 60 000 ₽

Answer 1 · 2024-06-02 21:40:34

Если одним словом то тестирование гипотез:
Например Cumulative Sum (CUSUM) Control Charts.
1. https://www.ncss.com/wp-content/themes/ncss/pdf/Pr...

2. https://www.osti.gov/servlets/purl/1374023 (с vpn)

3. https://en.wikipedia.org/wiki/Sequential_probabili...

4. Чего нибудь байесовое обязательно тоже имеется (погуглить)
5. Огромное семейство Likelihood тестов тоже подойдет, p-это всего лишь параметр (погуглить).

Будешь работать с CUSUM (это моя рекомендация для решения проблемы) там тоже тест статистика для кумулативный суммы и т.д. В конечном счете все сводится к тестированию гипотез.

Как задетекировать изменение вероятности успеха в испытаниях Бернулли?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт