一个你会经常用到的公式——贝叶斯公式
在我们的日常生活中,有些事件的原因不好观察或者推测,我们往往会通过结果来倒推原因。常见的应用比如根据收到的邮件内容来判断该邮件是否为垃圾邮件;根据收到的图像数据来判断手写的数字等等。而在这种过程中,贝叶斯定理就会发挥它的作用。
我们就把要求的p(A1丨B)叫做后验概率,而p(A1)叫做先验概率。我们经常做的就是通过先验概率来求解后验概率。
假设X星球上有100万人,其中仅有10个超能力者。我们现在有一个超能力检测仪,它可以检测出一个人是否具有超能力。但是,它并不是很准确,有1%的错误率。也就是说,它有1%的可能把正常人检测为超能力者,也有1%的可能把超能力者检测为正常人。
现在我们想知道,如果这个仪器检测出一个人是超能力者,那么他确实就是超能力人的概率是多大呢?
我们把仪器检测出超能力者的概率记为p(B),把一个人是超能力者的概率记为p(A1),那么我们要求的就是p(A1丨B)。根据贝叶斯公式,我们可以得出:
我们一个一个来看。p(A1)就是先验概率,代表一个人是超能力者的概率,我们有p(A1)=10/1000000=1/100000。
p(B丨A1)表示如果你是超能力者,那么把你检测为超能力者的概率。根据题目,我们有p(B丨A1)=1-1%=99%=0.99。
那么p(A2)是啥?注意到p(A1)和p(A2)互斥,也就是说p(A2)代表一个人不是超能力者的概率,它等于1-p(A1)=1-1/100000=99999/100000。
p(B丨A2)就表示如果一个人是正常人,那么把他检测为超能力者的概率,我们有p(B丨A2)=1%=0.01。
把上述结果代入到公式中,我们就可以得到:
可以看到,最后的结果仅为0.1%。即使我们的检测仪器的精度达到了99%,但因为先验概率极低,因此最后得到的后验概率也是很低的。