Как оценить работу функции которая рассчитывает вероятность наступления события?

Question

kiling @kiling

Как оценить работу функции которая рассчитывает вероятность наступления события?

Существует функция, которая рассчитывает вероятность наступления события (Да или Нет). Проводим серию вычислений и соотносим их с реальными данными.

Например:
Расчетная вероятность/Наступило событие
0,9/Да
0,4/Да
0,8/Нет
0,1/Нет
0,5/Да
0,8/Да

Как оценить работу функции которая рассчитывает вероятность наступления события?

Вопрос задан более трёх лет назад
233 просмотра

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Инженер по тестированию

8 месяцев

Далее
Skillbox

Профессия 1C-разработчик

8 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 4

5 комментариев

kiling @kiling Автор вопроса

Я работаю с реальными данными. В моей табличке результаты Да или Нет, это реальные события. Провести одно и тоже испытание несколько раз я не могу.

Написано более трёх лет назад
Max Pushkarev @maximpushkarev75

kiling: Можно ведь сделать unit-тест с фейковым событием

Написано более трёх лет назад
Mercury13 @Mercury13

Нет, его задача — прикинуть, насколько хорошо функция моделирует реальные события.

Написано более трёх лет назад
x67 @x67

Mercury13: все работают с реальными данными. Есши у вас накопилась выборка, значит вы можете проверить функцию, нет - нет. Возможно в вашем случае есть какие-то нюансы, которые позволят оценить функцию "без лишних" проверок "реальных" данных, но ни один человек на тостере о них не знает.

Написано более трёх лет назад
Mercury13 @Mercury13

Вот это я и имел в виду — указать, насколько адекватна функция реальным событиям. Без реальных событий её не проверишь никак. :)

Написано более трёх лет назад

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Программирование

Простой
Какие технологии/ИИ есть для клонирования русской речи?
- 11 подписчиков
- 02 дек.
- 583 просмотра
1

ответ
Программирование

+2 ещё

Средний
Возможно ли написать программу, которая будет удалять все данные с дисков?
- 3 подписчика
- 19 нояб.
- 968 просмотров
10

ответов
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 6 подписчиков
- 22 сент.
- 1510 просмотров
5

ответов
JavaScript

+2 ещё

Простой
Можно ли заменить кликанье мышью по веб-интерфейсу cli-командой?
- 3 подписчика
- 13 сент.
- 1167 просмотров
2

ответа
Программирование

Простой
Оператор, операция, функция, процедура — что всё это значит?
- 1 подписчик
- 05 авг.
- 474 просмотра
2

ответа
Программирование

Простой
Какие есть источники, помогающие понять бизнес-логику проекта?
- 3 подписчика
- 30 июл.
- 951 просмотр
2

ответа
Программирование

Простой
Как готовиться к ВСоШ по информатике 9-11 классов/олимпиадам по программированию вообще?
- 1 подписчик
- 20 июл.
- 309 просмотров
3

ответа
Программирование

+1 ещё

Простой
Ответьте на вопрос по информатике?
- 1 подписчик
- 10 июл.
- 826 просмотров
3

ответа
Программирование

+1 ещё

Средний
Редактирование прошивки китайской камеры видеонаблюдения?
- 1 подписчик
- 01 июл.
- 524 просмотра
2

ответа
Программирование

+1 ещё

Простой
Как работает регистрация и аутентификация с помощью ЭЦП?
- 1 подписчик
- 26 июн.
- 337 просмотров
3

ответа
Показать ещё Загружается…

Backend developer

Creative Code

До 190 000 ₽

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽

Backend Developer

Playerok

от 400 000 ₽

Answer 1 · 2017-01-12 15:27:51

Как вариант - провести одно и то же испытание N раз. Результат испытаний - либо событие E выполняется, либо нет.
Фиксировать каждый раз, когда событие наступило. Получим число N'.
Если вероятность наступления события P, то количество срабатываний события при бесконечно большом N равно N*P
Так как N мы все же берем конечным числом, то можно число успехов оценить с допуском T :

N*P - T <= N' <= N*P + T

если после N испытаний неравенство выполнено - функция адекватно посчитала вероятноть элементарного события
Чем больше N, тем меньший допуск T можно применять.

Answer 2 · 2017-01-12 20:12:27

LogLoss тут не очень хорош тем, что ваша модель выдаёт бинарные ответы, а не вероятности наступления события. Посмотрите в сторону ROC-AUC. В отличие от LogLoss, она всегда лежит в отрезке [0.5;1]. Значение 0.5 эквивалентно подбрасыванию монетки.
UPD. Напутал. События - бинарные, а модель даёт вероятности

Answer 3 · 2017-01-12 16:45:06

Если Вы имеете в виду задачу сравнения двух или более различных реализаций функций, то тогда Вам скорее всего нужен LogLoss. Учтите, что если Вы не можете применить разные функции на одних и тех же данных (то есть проверка ведется на разных выборках), то они должны быть достаточно большими и однородными, иначе результаты сравнения будут недостоверными.

Answer 4 · 2017-01-12 16:47:08

Тогда возникает вопрос. Какие могут быть недостатки у функции?

1. Смещение к «да» или смещение к «нет».
Для всех случившихся событий перемножаем вероятности соотв. исхода. То же самое для всех неслучившихся. Одно делим на другое, в идеале должна получиться единица.
Можно работать с логарифмами, даже очень широкая статистика не даст переполнения: на мантиссу в double шесть байтов, а на порядок — и двух нет. Можно проводить сброс порядка: получили, скажем, число меньше 1e−50 — множим на эту цифру, запоминаем: 50 порядков в уме.
Если статистики очень много, стоит кластеризовать входы и для каждого кластера посчитать эту статистику.

2. Излишняя самоуверенность. Функция говорит «0,9», в то время как вероятность максимум 0,7. Думаю, можно решить той самой кластеризацией по выходу функции.

3. Неуверенная работа. Функция не даёт статистических аномалий, но просто неуверенно работает, слишком часто выдавая «а хрѣнъ его знает». Vlad_Fedorenko предлагает площадь под ROC-кривой. Я бы просто предложил произведение вероятностей соответствующих исходов. Например, если у нас 6 пусков, можно сказать: «вероятность всегда 0,5», и получить результат 1/64≈0,016. А можно сказать: для трёх пусков вероятность 2/3, и для трёх — 1/3. Если так и случится, результат — 2⁴/3⁶≈0,022. Какой будет нормирующий коэффициент, сказать пока не могу.
UPD3. А ещё можно попробовать информационную энтропию.
UPD4. Эта конструкция, возможно, справится и с излишней самоуверенностью. Если она скажем этим тройкам 0,9 и 0,1, будет (0,9·0,9·0,1)² < 0,01.
UPD5. Идеал — разумеется, 1 (событию говорит 100%, если оно будет, и 0%, если нет).

UPD. Подкорректировал 1 — я так и имел в виду, но проглючил.
UPD2. Добавил неуверенную работу.

Как оценить работу функции которая рассчитывает вероятность наступления события?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт