打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
人人都能懂的“侦探基本法”——贝叶斯推断

福尔摩斯与普通人的差别,在于“思维方式”。

本文将帮您,掌握“侦探级”的推断思维。

一眼识人

神探福尔摩斯卷福饰)第一次见到华生,就凭借“军人站姿”推断出“华生是军人”

为什么可以这样推断呢?那么,我看到华生的“格子衫”,推断他是“程序员”,不是也很合理吗?为什么我错了而福尔摩斯对了?

这其中的深层根源就在于一个概率公式;让我们先用1分钟掌握这个公式。

贝叶斯公式

没有概率基础的同学,也没关系,只需要先记住下面这三个符号的意思——

P(A):事件A发生的概率;P(A,B):事件AB均发生的概率;P(A|B):事件B已经发生的条件下,A发生的概率。

下面咱们一起推导出贝叶斯公式吧~

首先,A与B均发生的概率 = 先发生了B的概率 × 在B的基础上又发生A的条件概率——

由于“A与B是对称的地位”,所以,把A与B的位置对调一下——

因此

这就是贝叶斯公式的雏形了,最终形态需要变个形——

公式有什么涵义?

贝叶斯公式就是在讲:本来,我知道一件事A发生的可能性,现在,又多了一项证据B,那么,在证据B的基础上,A发生的可能性 (A|B) 又是多少呢?

P(A|B) = 系数 × P(A)

这就是“推断”。

现在可以解释福尔摩斯与我们的区别在哪里了。

福尔摩斯寻找的证据B是“军人站姿”本身出现的概率非常小,即使真的是军人也不一定就要时刻保持军人站姿呀,这就是说 P(B) 很小;另一方面,如果真是军人那么站军姿的概率也很大,即 P(B|A) 很大。从公式上来看,乘号(·)前面的【系数】就很大,也就是说,这项证据很“可靠”,“把我们对于华生是军人的信心提高了”。

反观我们寻找的证据B是“格子衫”,而实际上,穿格子衫的人非常多,也就是 P(B) 很大;另一方面,即使是程序员空格子衫的比例也不大呀,即 P(B|A) 很小,因此,乘号前的【系数】很小,这项证据“不靠谱”。

说明:其实最关键的就是 P(B) 的值,因为它在分母上,只要它稍小一些,整体系数就会很大。

不能用“格子衫”推断出“程序员”

总结一句话:证据的选择决定推断的有效性。

我们应该选择那些“出现的比较少”的事件作为证据,也就是“细节”。

有了以上的基础,我们终于明白了——

为什么成功学不靠谱?

比如,研究发现成功的企业家都很'勤奋',所以,勤奋可以让人成功。

问题来了,勤奋的人还少吗?这个事件的概率 P(B) 很大呀,使得公式中的系数很小,因此不能用来推断成功。

假如说,我们发现,成功的企业家大都“会飞”,而现实中几乎没有人会飞,那我们可以推断,会飞的人,基本上是成功企业家。

事出反常必有妖

其实,贝叶斯公式是在告诉我们——对于小概率事件,要格外重视

卡尔·萨根有一句名言——

“Extraordinary claims require extraordinary evidence.”

“超凡的主张,需要有超凡的证据”

这是在科学界和工程界的圣之一,被称为【萨根标准】。

美国著名天文学家 卡尔·萨根

比如,你有一次感觉自己“飞”了起来,是否就要马上向世界宣布你会飞呢?不行。因为这太反常了。你必须再尝试着飞几次,如果每次都能飞,才可以证明。

来个案例实际计算一下吧

一个别墅,它发生盗窃的概率 P(盗窃) = 0.001

别墅里有一只狗,它叫的概率为 P(狗叫) = 0.4

如果发生盗窃,这只狗会叫的概率为 P(狗叫 | 盗窃) = 0.9

今天,这只狗叫了,请问盗窃发生的概率 P(盗窃 | 狗叫) 是多大呢?

这就是最典型的贝叶斯推断了,我们知道了“新的证据”——狗叫,那么盗窃的概率提升到多少呢?

P(盗窃 | 狗叫)   = P(狗叫 | 盗窃) × P(盗窃)  / P(狗叫)   = 0.9 × 0.001 / 0.4   = 0.00225

比原来大了一倍,但还是很小。

也就是说,我们听到了狗叫,但并不能说明什么问题,因为这只狗太爱叫了(概率0.4)

精华总结

咱们再回看这个公式——

翻译一下——

有证据后的概率 = 证据的靠谱程度 × 没证据之前的概率

用专有名词就是——

后验概率 = 似然比 × 先验概率

有了上面的例子,是不是一下就理解了?

最后来一个升级版

假如有一种病毒,目前感染的概率为 P(病毒) = 0.001

我们知道,如果真的感染了病毒,那么试纸检测为阳性的概率为 P(阳性 | 病毒) = 0.99

而还存在一定的误诊率,也就是没有感染病毒也被检测出阳性,P(阳性 | 无病) = 0.01

现在请问,如果 一个人测试出阳性,那么他真的感染病毒的概率 P(病毒 | 阳性) 是多少?

这个问题稍复杂一点,因为并没有给出 P(阳性) ,需要我们先计算一步——

P(阳性) = P(阳性 | 病毒) × P(病毒) + P(阳性 | 无病) × P(无病) = 0.99 × 0.001 + 0.01 × (1-0.001) = 0.01098

然后,跟前面一样,代入公式——

P(病毒 | 阳性)  = P(阳性 | 病毒) × P(病毒) / P(阳性)  = 0.99 × 0.001 / 0.01098   0.09

所以,由于这种病毒是非常罕见的(0.001),所以,即使检测出了阳性,也无法证明就一定感染了病毒

这就是“事出反常”。必须多做几次检测,用“超凡的证据”来证明这个“超凡的结论”

结语

贝叶斯推断思维,通过衡量“证据的效力”,更新我们对事物的认知。

科技千里眼头条号,长期致力于用最易懂的讲解诠释科技,创作系列科普专栏,与中国所有自我教育者一同理解科技、认识世界。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
一个简单例子理解贝叶斯公式
贝叶斯学习法--我们几乎每天都在使用的数学工具
今天,你贝叶斯了吗?
数学思维的妙处(15):如何透彻理解贝叶斯公式,本篇给你讲清楚
华语|【辩心雕龙】辩行记--贝叶斯定理的意义
算概率?你会吗?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服