打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
具有模型思维的人,是如何避免资产损失,获得成功?

本文将以两种模型思维,去告诉大家如何避免资产损失,获得成功。内容非常干,可以直接划到最后学习案例经验,直接吸收!





什么是正态分布



正态分布又称高斯分布,是一个常见的连续概率分布,它的样子类似于寺庙里的大钟,因此人们又经常称之为钟形曲线。正态分布是典型的连续概率分布。

高斯分布或正态分布是最为重要的分布之一,它广泛应用于整个机器学习的模型中。

高斯分布(亦称“正态分布”)是在自然界中广泛存在的一个概率分布模型,许多自然现象都符合高斯分布,比如人类的身高、学生的学习成绩、随机误差等等。这种情况是由于二项分布是离散数据分布,其分布曲线不是连续的,而正态分布曲线则是连续的。正态分布曲线的样子就像下图,说名字可能不清楚,但很多同学一看到图就恍然大悟,原来这就是正态分布啊。看正态分布是好的,就让随机误差就服从了正态分布。

正态分布的特点:像自然对数e一样,神奇的正态分布随处可见。取样数越大,样本之和就接近正态分布。













什么是幂律分布



幂律分布,是说节点具有的连线数和这样的节点数目乘积是一个定值,在对数坐标上画出来会得到一条斜向下的直线。幂律分布的数学模型是幂函数。

幂律分布是一条没有峰, 且不断递减的曲线, 它最突出的特征是大量微小事件和少数非常重大的事件并存. 假设某星球上居民的身高遵循幂律分布, 那么, 大多数人都非常矮, 但偶尔看到一个几百米高的巨人走在大街上, 人们也不会觉得吃惊.在大多数真实网络中, 绝大多数节点仅有少数几个链接, 而这些数量众多的小节点和为数不多的大枢纽节点并存, 每个枢纽节点拥有非常多的链接.网络的连通性由少数枢纽节点保证, 是它们让真实网络免于瓦解。

后者等价于先将数据取对数,再拿进来处理前者则是其他处理优先,最后作图时再取对数。做个小实验你就知道幂律分布长什么样了。它强调了重要的少数与琐碎的多数,比如20%的人口拥有80%的财富,80%的利润来自20%的顾客等。

在现实中,财富是幂律分布的,即最具备赚钱能力的人拥有这个社会绝大部分财富。

2019年1月21日,国际慈善机构乐施会在达沃斯世界经济论坛前夕发布的一则报告中,提出了一个令人震惊的全球财富不平等现象:截止2018年末,全球最富有26位富翁所拥有的财富达到1.4万亿美元,相当于全世界最贫穷的一半人口(38亿人)所拥有的财富总和。

2016年,仅仅是最富有的8个人的财富,就超过了最贫穷的一半人口(36亿)的财富总和。这种不平均也是自然界和社会的一种常态,包括月球陨石坑直径的分布、国家人口的分布、论文的引用次数、财富的分布等。意大利经济学家维尔弗雷多·帕累托(vilfredo pareto)在研究国家的财富分布时,发现了一个很有趣的现象:每个国家的财富都呈现出一种分布方式,少部分人占据了大部分财富,而大部分人拥有少量财富——在坐标轴上,这是一个头部严重向左靠拢,还拖着长长尾巴的分布。













正态分布与幂律分布的差别



在高斯法则生效的领域,平均值可以代表整体。在每次训练之后调用此操作,更新移动平均值。但是基于指数移动平均值的rmsprop和adam却没法保证这一点,当t ∈ [t]时,它们的γt可能大于等于0,也可能小于0。

双移动平均线的用法是:(1)用两个长度不同的窗口,计算价格数据的移动平均值;(2)当短的移动平均值穿过长移动平均值时,一个买入信号就诞生了。

它添加了训练参数的影子副本,并保持了其影子副本中训练参数的移动平均值操作。MACD概述与数值的设置:MACD在应用上应先行计算出快速(常用12日)移动平均值与慢速(常用26日)移动平均值。但是在幂律法则统治的领域,平均值毫无意义。随着时间的推移,当短的移动平均值小于长的移动平均值时,就产生了一个卖出信号。当收市价格升高到移动平均值之上后,就产生了买入信号。

高斯法则和幂律法则的典型代表是分别身高和财富,把姚明放到100个人中,并不会显著改变平均身高,但把比尔·盖茨放到100个人中,就会极大改变平均财富。不过由于遗传 营养状况等因素,并不是所有人都能得偿所愿。最后是遗传因素,山东人自古身高就比较出挑,就拿历史名人孔子来说吧,《史记》中记载“孔子长九尺有六寸,人皆谓之'长人’而异之”。

在高斯法则生效的领域,所有人跟平均值的差距不会很大;但是在幂律法则分布的领域,跟平均值的差距就会大到惊人。也是最常用的时间序列分析是移动平均法,任何周期的预测值都是过去几个周期观测值的平均值。接下来要用的例子相信几乎所有做量化策略的人都写过类似的代码:对时间序列求算术移动平均值。

正态法则和幂律法则,细思极恐。

生活和工作中,希望我们都能把握这两个法则,该平均的时候平均,不平均的时候成为20%













如何通过正态分布和幂律分布,降低自己的损失



那么,搞清这两个分布模型,有什么用呢?简单说,它可以帮我们合理的规划资源,管理风险。在概率论学习中,我们解决的核心问题是:已知总体的分布,求特定事件的概率。下面我将通过一个具体的例子,来简单地展示这句话的含义,并由此引出统计量,点估计,无偏估计的相关概念。可以看出 随着抽样组数的增大,得到的 的分布越来越接近正态分布,而事实上,对于本题总体为正态分布的情形, 的精确分布就是正态分布。

比如,让你设计公共汽车上的扶手高度。考虑到人的身高是正态分布,特别高的和特别矮的都是少数,它的高度就应该是,一个不高不矮的人,伸手恰好能够到的高度。身高特别矮的人,处在第一代正态分布曲线的左侧边缘地带。1是抽样样本过少,很难cover所有情况,所以导致总体是正态分布,但抽样样本不满足正态分布,比如中国13亿人的身高肯定是正态分布,但抽样100个人可能就不会正态分布;2是认知的不一致,事实上正态性是一种数学理论上的分布,实际情况下只要数据分布基本满足“钟形曲线”特征,spssau认为也应该将数据看成是正态分布。自然界中的很多现象都符合正态分布。考虑到计算中数据的倾斜问题,在不影响整体效果的情况下,可根据更加细致的分位点对极端值进行取舍。

但是,假如你在林业部门工作,要维护一整片森林。你就要意识到,森林火灾这件事,是幂律分布。我开始意识到这是一个极其普通而又常见的问题。除了常见的正态分布,还有一种极其重要却极易被忽略的分布-幂律分布。

幂律分布和正态分布给我们展示了两个非常不同的世界。但是还有一类现象,就像我们刚才讲的点击量、关注度还有城市人口甚至包括人脉财富、声望这些都遵循的是幂律分布。在日常的数据分析中,订单数据和浏览数据常呈现近似幂律分布。也就是,火灾的发生率虽然很低,但是,它造成的损失非常大。

那么如果我们在日常生活中发现某个变量服从正态分布,而另外一个变量 可以表示成多项式的形式 ,那么如何计算 的期望也就是一件清晰而又明确的事情了。第一个为幂率分布命名的是经济学家帕累托,他发现在19世纪的意大利极少数的富人赚走了绝大部分的钱,大部分家庭的收入都很低。这时,你就要重视防火抢险工作,为此储备大量的资源。

当然,这些都是事后的观察总结。我们更关心的,是面对一个陌生的系统时,怎么判断,它到底是遵循正态分布,还是幂律分布?这个标准其实很简单,那就是看,样本之间,会不会相互影响。

我们从理论上分析一下,小球们会基于新的起点,在下面形成一个个小的正态分布,然后这些小正态分布的结果,叠加成一个大的正态分布,并且区域会更加广阔,形状会更加扁平。假如样本之间是独立的,比如身高,张三的身高,影响不到李四的身高。如此说来,第二代身高的边界,应该比第一代更宽才对。那么身高的遗传是不是能遵循高尔顿板2.0的演示结果呢?

我们对着这个板儿想象一下:假设现在有一批身高特别高的人,他们处在第一代正态分布曲线的右侧边缘地带。世界上的人群的身高应该会变得越来越悬殊。在这个例子中,人的身高可能受到先天基因的因素、也可能受到后天营养等诸多不特定的因素,但不管是什么因素,也不管这些因素有多少,一个人的身高肯定是这所有因素合在一起在这个人身上的表现。那么你就可以判断,身高遵循的是正态分布。

假如样本之间相互关联,彼此影响,这个系统就遵循幂律分布。比如森林大火,一棵树着火,十有八九会点着周围的树。再比如财富,越有钱的人,就越能获得赚钱的机会,财富之间存在关联交易,它就会呈现出幂律分布。

在面对一个具体的项目时,假如在正态分布和幂律分布这件事上,你判断错了,就很可能会导致失控。这篇文章的写作来自于开始尝试在知乎上回答一些关于正态分布的问题,发现有很多关于如何在正态分布下计算期望的问题。比如,波士顿的中央隧道工程,是美国有史以来最昂贵的公路项目,从1991年盖到2006年,一共花了140亿美元,是当初预算的三倍。这就是因为,用错了概率模型。

一开始,人们认为,隧道工程遵循着正态分布,也就是,各个环节之间相互独立,不会彼此影响。从理论上讲,很多研究方法需要满足正态分布特质,但现实情况下,很难满足正态分布性。像挖掘地沟、设计墙壁、建造顶盖,大家各顾各的,谁也不妨碍谁。所以,在初期规划时,每个步骤的成本都是固定的,并没有留出太多的余地。由此我们可以大概总结出运用点估计(样本推断)的核心步骤:。

但是,真到了施工,你就会发现,事情没那么简单。在中心极限定理的指引下,我们发现我们日常生活中许多的统计概率都是符合正态分布的。比如,制作顶盖的时候,出了一些问题,你就得拆除原有的顶盖。这篇是这个探索过程的第一篇,主要写 是多项式函数的时候,如何求解 的期望。这就意味着你要破坏墙壁,回头墙壁也得跟着重做。墙壁里的线管,也得重新铺

每个环节环环相扣,最终,一个小问题,演变成了一组相互制约的大问题。但是,这些其实是可以在前期规划时避免的。假如你意识到,这是一个幂律分布的系统,就会在前期加大沟通成本,并且为风险控制,留出更多的余地。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
认识幂定律,成就学霸思维
幂律分布
统计原理 | 在正态分布之外的生活
《模型思考者》3:三种分布模型
数学模型告诉你,为什么你总遇不到合适的人?
117思维模型:幂律分布一强者恒强 弱者愈弱
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服