福尔摩斯与普通人的差别，在于“思维方式”。
本文将帮您，掌握“侦探级”的推断思维。

一眼识人

神探福尔摩斯（卷福饰）第一次见到华生，就凭借“军人站姿”推断出“华生是军人”。

为什么可以这样推断呢？那么，我看到华生的“格子衫”，推断他是“程序员”，不是也很合理吗？为什么我错了而福尔摩斯对了？

这其中的深层根源就在于一个概率公式；让我们先用1分钟掌握这个公式。

贝叶斯公式

没有概率基础的同学，也没关系，只需要先记住下面这三个符号的意思——

P(A)：事件A发生的概率；P(A,B)：事件A与B均发生的概率；P(A|B)：事件B已经发生的条件下，A发生的概率。

下面咱们一起推导出贝叶斯公式吧~

首先，A与B均发生的概率 = 先发生了B的概率 × 在B的基础上又发生A的条件概率——

由于“A与B是对称的地位”，所以，把A与B的位置对调一下——

因此

这就是贝叶斯公式的雏形了，最终形态需要变个形——

公式有什么涵义？

贝叶斯公式就是在讲：本来，我知道一件事A发生的可能性，现在，又多了一项证据B，那么，在证据B的基础上，A发生的可能性 (A|B) 又是多少呢？

即 P(A|B) = 系数 × P(A)

这就是“推断”。

现在可以解释福尔摩斯与我们的区别在哪里了。

福尔摩斯寻找的证据B是“军人站姿”本身出现的概率非常小，即使真的是军人也不一定就要时刻保持军人站姿呀，这就是说 P(B) 很小；另一方面，如果真是军人那么站军姿的概率也很大，即 P(B|A) 很大。从公式上来看，乘号（·）前面的【系数】就很大，也就是说，这项证据很“可靠”，“把我们对于华生是军人的信心提高了”。

反观我们寻找的证据B是“格子衫”，而实际上，穿格子衫的人非常多，也就是 P(B) 很大；另一方面，即使是程序员空格子衫的比例也不大呀，即 P(B|A) 很小，因此，乘号前的【系数】很小，这项证据“不靠谱”。

说明：其实最关键的就是 P(B) 的值，因为它在分母上，只要它稍小一些，整体系数就会很大。

不能用“格子衫”推断出“程序员”

总结一句话：证据的选择决定推断的有效性。

我们应该选择那些“出现的比较少”的事件作为证据，也就是“细节”。

有了以上的基础，我们终于明白了——

为什么成功学不靠谱？

比如，研究发现成功的企业家都很'勤奋'，所以，勤奋可以让人成功。

问题来了，勤奋的人还少吗？这个事件的概率 P(B) 很大呀，使得公式中的系数很小，因此不能用来推断成功。

假如说，我们发现，成功的企业家大都“会飞”，而现实中几乎没有人会飞，那我们可以推断，会飞的人，基本上是成功企业家。

事出反常必有妖

其实，贝叶斯公式是在告诉我们——对于小概率事件，要格外重视。

卡尔·萨根有一句名言——

“Extraordinary claims require extraordinary evidence.”

即“超凡的主张，需要有超凡的证据”。

这是在科学界和工程界的圣之一，被称为【萨根标准】。

美国著名天文学家卡尔·萨根

比如，你有一次感觉自己“飞”了起来，是否就要马上向世界宣布你会飞呢？不行。因为这太反常了。你必须再尝试着飞几次，如果每次都能飞，才可以证明。

来个案例实际计算一下吧

一个别墅，它发生盗窃的概率 P(盗窃) = 0.001

别墅里有一只狗，它叫的概率为 P(狗叫) = 0.4

如果发生盗窃，这只狗会叫的概率为 P(狗叫 | 盗窃) = 0.9

今天，这只狗叫了，请问盗窃发生的概率 P(盗窃 | 狗叫) 是多大呢？

这就是最典型的贝叶斯推断了，我们知道了“新的证据”——狗叫，那么盗窃的概率提升到多少呢？

P(盗窃 | 狗叫)   = P(狗叫 | 盗窃) × P(盗窃)  / P(狗叫)   = 0.9 × 0.001 / 0.4   = 0.00225

比原来大了一倍，但还是很小。

也就是说，我们听到了狗叫，但并不能说明什么问题，因为这只狗太爱叫了（概率0.4）。

精华总结

咱们再回看这个公式——

翻译一下——

有证据后的概率 = 证据的靠谱程度 × 没证据之前的概率

用专有名词就是——

后验概率 = 似然比 × 先验概率

有了上面的例子，是不是一下就理解了？

最后来一个升级版

假如有一种病毒，目前感染的概率为 P(病毒) = 0.001

我们知道，如果真的感染了病毒，那么试纸检测为阳性的概率为 P(阳性 | 病毒) = 0.99

而还存在一定的误诊率，也就是没有感染病毒也被检测出阳性，P(阳性 | 无病) = 0.01

现在请问，如果一个人测试出阳性，那么他真的感染病毒的概率 P(病毒 | 阳性) 是多少？

这个问题稍复杂一点，因为并没有给出 P(阳性) ，需要我们先计算一步——

P(阳性) = P(阳性 | 病毒) × P(病毒) + P(阳性 | 无病) × P(无病) = 0.99 × 0.001 + 0.01 × (1-0.001) = 0.01098

然后，跟前面一样，代入公式——

P(病毒 | 阳性)  = P(阳性 | 病毒) × P(病毒) / P(阳性)  = 0.99 × 0.001 / 0.01098  ≈ 0.09

所以，由于这种病毒是非常罕见的（0.001），所以，即使检测出了阳性，也无法证明就一定感染了病毒。

这就是“事出反常”。必须多做几次检测，用“超凡的证据”来证明这个“超凡的结论”。

结语

贝叶斯推断思维，通过衡量“证据的效力”，更新我们对事物的认知。

科技千里眼头条号，长期致力于用最易懂的讲解诠释科技，创作系列科普专栏，与中国所有自我教育者一同理解科技、认识世界。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。