@deliri
программист-дилетант

Какя разница в формулах теоремы Байеса?

В разных статьях, пытающихся доходчиво объяснить теорему Байеса формула выглядит по-разному:
P(B:A)×P(A)
P(A:B) = --------------------------------- [1]
(P(B:A)×P(A) + P(B:notA)×P(notA))
#
P(B:A)×P(A)
P(A:B) = ----------- [2]
P(B)
Однако в Теорема Байеса: Святой Грааль Data Science утверждается, что эти формулы идентичны. Зачем существует первая, если пользоваться второй проще? Или тут подводный камень?
Поясните, пожалуйста без математики и формул - для гуманитария.
  • Вопрос задан
  • 122 просмотра
Решения вопроса 1
@Mercury13
Программист на «си с крестами» и не только
В знаменателе — формула полной вероятности. Вот и всё.
p(B) = p(B|A)·p(A) + p(B|¬A)·p(¬A)

Для чего? Да просто p(B) в большинстве случаев хрен поймёшь, и его приходится вычислять непрямо. Например:
A — письмо является спамом
B — в письме есть слово «sex»
Видим в письме слов «sex» — спам ли оно?
Мы можем собрать базу спама со словом «sex», и базу обычной переписки с этим словом, и вычислить p(B|A) и p(B|¬A). А p(A) и p(¬A) вычисляются уже на компе конечного пользователя в зависимости от того, насколько жёстко его спамят.

Пример второй. Каждый тысячный водитель — пьяный. Алкотестер чётко видит алкаша, но останавливает каждого сотого трезвого. Какой процент из приехавших в больницу действительно пьянствуют за рулём?
U — проехавшие через пост водители
A — пьяный
B — алкотестер сработал
Аналогично, p(B) заранее неизвестен, но приходится вычислять по полной вероятности. И вроде бы при таких цифрах один из одиннадцати попавшихся реально пьяный. И это затрудняет антитеррористические меры: если по городу-миллионнику ходит сотня террористов, какая должна быть точность, чтобы не ломать невинные жизни!
UPD: чуть меньше 1/11: p(B|A)=1, p(A)=1/1000, p(B|¬A)=1/100, p(¬A)=999/1000,
итого с сокращением на 1000 будет 1/(1+999/100)=100/1099.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы