福尔摩斯与普通人的差别,在于“思维方式”。
本文将帮您,掌握“侦探级”的推断思维。
神探福尔摩斯(卷福饰)第一次见到华生,就凭借“军人站姿”推断出“华生是军人”。
为什么可以这样推断呢?那么,我看到华生的“格子衫”,推断他是“程序员”,不是也很合理吗?为什么我错了而福尔摩斯对了?
这其中的深层根源就在于一个概率公式;让我们先用1分钟掌握这个公式。
没有概率基础的同学,也没关系,只需要先记住下面这三个符号的意思——
P(A):事件A发生的概率;P(A,B):事件A与B均发生的概率;P(A|B):事件B已经发生的条件下,A发生的概率。
下面咱们一起推导出贝叶斯公式吧~
首先,A与B均发生的概率 = 先发生了B的概率 × 在B的基础上又发生A的条件概率——
由于“A与B是对称的地位”,所以,把A与B的位置对调一下——
因此
这就是贝叶斯公式的雏形了,最终形态需要变个形——
贝叶斯公式就是在讲:本来,我知道一件事A发生的可能性,现在,又多了一项证据B,那么,在证据B的基础上,A发生的可能性 (A|B) 又是多少呢?
即 P(A|B) = 系数 × P(A)
这就是“推断”。
现在可以解释福尔摩斯与我们的区别在哪里了。
福尔摩斯寻找的证据B是“军人站姿”本身出现的概率非常小,即使真的是军人也不一定就要时刻保持军人站姿呀,这就是说 P(B) 很小;另一方面,如果真是军人那么站军姿的概率也很大,即 P(B|A) 很大。从公式上来看,乘号(·)前面的【系数】就很大,也就是说,这项证据很“可靠”,“把我们对于华生是军人的信心提高了”。
反观我们寻找的证据B是“格子衫”,而实际上,穿格子衫的人非常多,也就是 P(B) 很大;另一方面,即使是程序员空格子衫的比例也不大呀,即 P(B|A) 很小,因此,乘号前的【系数】很小,这项证据“不靠谱”。
说明:其实最关键的就是 P(B) 的值,因为它在分母上,只要它稍小一些,整体系数就会很大。
不能用“格子衫”推断出“程序员”
总结一句话:证据的选择决定推断的有效性。
我们应该选择那些“出现的比较少”的事件作为证据,也就是“细节”。
有了以上的基础,我们终于明白了——
比如,研究发现成功的企业家都很'勤奋',所以,勤奋可以让人成功。
问题来了,勤奋的人还少吗?这个事件的概率 P(B) 很大呀,使得公式中的系数很小,因此不能用来推断成功。
假如说,我们发现,成功的企业家大都“会飞”,而现实中几乎没有人会飞,那我们可以推断,会飞的人,基本上是成功企业家。
其实,贝叶斯公式是在告诉我们——对于小概率事件,要格外重视。
卡尔·萨根有一句名言——
“Extraordinary claims require extraordinary evidence.”
即“超凡的主张,需要有超凡的证据”。
这是在科学界和工程界的圣之一,被称为【萨根标准】。
美国著名天文学家 卡尔·萨根
比如,你有一次感觉自己“飞”了起来,是否就要马上向世界宣布你会飞呢?不行。因为这太反常了。你必须再尝试着飞几次,如果每次都能飞,才可以证明。
一个别墅,它发生盗窃的概率 P(盗窃) = 0.001
别墅里有一只狗,它叫的概率为 P(狗叫) = 0.4
如果发生盗窃,这只狗会叫的概率为 P(狗叫 | 盗窃) = 0.9
今天,这只狗叫了,请问盗窃发生的概率 P(盗窃 | 狗叫) 是多大呢?
这就是最典型的贝叶斯推断了,我们知道了“新的证据”——狗叫,那么盗窃的概率提升到多少呢?
P(盗窃 | 狗叫) = P(狗叫 | 盗窃) × P(盗窃) / P(狗叫) = 0.9 × 0.001 / 0.4 = 0.00225
比原来大了一倍,但还是很小。
也就是说,我们听到了狗叫,但并不能说明什么问题,因为这只狗太爱叫了(概率0.4)。
咱们再回看这个公式——
翻译一下——
有证据后的概率 = 证据的靠谱程度 × 没证据之前的概率
用专有名词就是——
后验概率 = 似然比 × 先验概率
有了上面的例子,是不是一下就理解了?
假如有一种病毒,目前感染的概率为 P(病毒) = 0.001
我们知道,如果真的感染了病毒,那么试纸检测为阳性的概率为 P(阳性 | 病毒) = 0.99
而还存在一定的误诊率,也就是没有感染病毒也被检测出阳性,P(阳性 | 无病) = 0.01
现在请问,如果 一个人测试出阳性,那么他真的感染病毒的概率 P(病毒 | 阳性) 是多少?
这个问题稍复杂一点,因为并没有给出 P(阳性) ,需要我们先计算一步——
P(阳性) = P(阳性 | 病毒) × P(病毒) + P(阳性 | 无病) × P(无病) = 0.99 × 0.001 + 0.01 × (1-0.001) = 0.01098
然后,跟前面一样,代入公式——
P(病毒 | 阳性) = P(阳性 | 病毒) × P(病毒) / P(阳性) = 0.99 × 0.001 / 0.01098 ≈ 0.09
所以,由于这种病毒是非常罕见的(0.001),所以,即使检测出了阳性,也无法证明就一定感染了病毒。
这就是“事出反常”。必须多做几次检测,用“超凡的证据”来证明这个“超凡的结论”。
贝叶斯推断思维,通过衡量“证据的效力”,更新我们对事物的认知。
科技千里眼头条号,长期致力于用最易懂的讲解诠释科技,创作系列科普专栏,与中国所有自我教育者一同理解科技、认识世界。
联系客服