打开APP
未登录
开通VIP,畅享免费电子书等14项超值服
开通VIP
首页
好书
留言交流
下载APP
联系客服
Excel应用大全 | 离散趋势
hercules028
>《excel》
2022.02.23
关注
集中趋势只是数据组特征的一方面,而另一方面是离散趋势,也就是围绕中心点(平均值)的变动幅度。例如,图
7-24
所示的这些学生的体重都是
45kg
,均值是
45kg
,每个人的体重都没有变动趋势,直方图就是一个窄长条,如图
7-25
所示。
图
7-24
体重相同的学生
图
7-25
体重相同的直方图
如果这些学生的体重是图
7-26
所示的情况,直方图就会变成图
7-27
所示的形态。
图
7-26
体重差异大的学生
图
7-27
体重差异大的直方图
量化描述数据这种分散状态的是方差和标准差。
假设有如图
7-28
所示的
3
组数据,这
3
组数据的均值虽然都是
50
,但是
B
组的变动幅度最大,
A
组较小,
C
组完全没有变动幅度。
量化描述这种变动幅度的是极差。
图
7-28 3
组数据
本节重点讨论的是离散趋势的
3
个描述方法,分别是极差、方差和标准差。另外,四分位差也是描述数据离散趋势的常用方法。
极差
极差是
3
个概念中最简单、最笼统的指标,即数据组中最大值和最小值之差,在图
7-28
中,
A
组的极差是
4
,
B
组的极差是
40
,
C
组的极差是
0
,计算方法如图
7-29
所示。
图
7-29
极差计算方法
极差可以直观看到数据组的范围,但是不够精确。
方差和标准差
ENJOY THE SUMMER
1.
方差和标准差的实际意义
方差和标准差如何来度量分散程度呢,现有一组人群的体重数据如图
7-30
所示。
图
7-30
体重数据
这组体重数据的均值是
38.7
,每一个数据相对平均值都有一定的变动幅度。
如图
7-31
所示,图中每个点代表一个人的体重,右边的垂线是平均值所在的平均线,左边的垂线是其中一个数据点所在直线,两条垂线间的距离是数据点到平均线的距离,方差是所有数据点到平均线距离的平方的均值。
图7-31
体重分布图
图
7-32
展示了方差的计算过程:
图
7-32
距离平方的计算步骤
借助这个表中得到的总和,可以求得距离的均值:
1911/21=91
,这个结果就是方差,将
91
开方后得到
9.5
就是标准差。
注意:
由于统计总体和样本的差异
,
计算均值时用的数值个数不是
22
个
,
而是
22-1
,
即
n
-1
个
(
请参阅
10.1.1
节内容
)
方差已经足够描述数值与均值的偏离程度,为什么又要计算标准差呢?虽然方差可以很好地描述数据与均值的变动幅度,但是方差与要描述的数据的单位是不一致的,这样的处理结果并不符合人们的直观思维习惯,而标准差与真实数据的单位是相同的。因此很多场合大家更倾向于使用标准差。
例如一个班级有
50
名学生,经过统计数学平均分是
80
分,标准差是
10
,其实际意义是每个学生的分数与平均分的平均差距是
10
分;方差是
100
,是标准差的平方,没有单位,即每个学生的分数与平均分的平均差距的平方是
100
,这个解释没有任何实际意义,通常使用标准差进行描述更具有实际意义也更容易理解。从这一点来说,方差只是一个中间的计算过程,它的目的是平方运算后去掉负号,再开方得到原单位偏差值。当然,方差的作用绝不仅限于此,在数据分析中它有很多重要的用途。
标准差的性质:
(
1
)
标准差是以均值为中心的变动幅度测量
,
如果是以中位数为中心
,
标准差是无效的
。
(
2
)
如果数据组的所有数据都相等
,
标准差为
0
,
否则必然是大于
0
的数值
,
而且数据越分散标准差越大
,
越集中标准差越小
。
标准差在描述数据中有极其重要的作用,希望每一位读者能深入体会其实际意义。
2.
在 Excel 中计算数据组的方差和标准差
某公司的销售部门在月底统计每个销售人员的业绩,如图
7-33
所示。
图
7-33
某公司销售人员业绩
计算标准差和方差如图
7-34
所示。
图
7-34
计算销售人员业绩的标准差与方差
在
D2
单元格输入以下公式,得到标准差为
10 185
。
=STDEV.P(B2:B12)
在
E2
单元格输入以下公式,得到方差为
103 740 510
。
=POWER(D2,2)
或
=D2^2
注意,
Excel
中的标准差函数有两个,分别是
STDEV.P
和
STDEV.S
。
STDEV.P
计算的是总体标准差,
STDEV.S
计算的是样本标准差(请参阅
8.1.1
节)。计算方法的差别在于,总体标准差用的数值个数是
n
,样本标准差用的数值个数是
n
-
1
。
本例中,全部销售人员是一个总体,所以用
STDEV.P
计算标准差。从计算结果可以知道,每个销售人员的业绩与全体员工业绩均值的平均差距是
10 185
元,均值是
21 692
元,标准差大约是均值的一半,说明整个销售部门的员工销售能力差距较大。
四分位间距
1.
四分位数
标准差是以均值为中心的变动幅度测量,如果以中位数的变动幅度测量需要借助四分位间距。
四分位间距也称为四分位差,基本原理是把数据组内的数值从小到大排序,按照数值个数等分成
4
组,然后再继续观察变动幅度,具体等分方法如下。
(
1
)
图
7-35
中是
23
名学生的语文成绩
,
按从小到大排列
。
首先在中位数处将数据组分成高低分两组
,
由于中位数恰好是其中的一个数值
80
,
而不是某个中间位置
,
目的是将整个数据组等分
,
无论将中位数划分到哪个组都不再相等
,
所以划分原则是将中位数既分配给高分组也分配给低分组
,
这样所有学生的成绩就分成了两组
,
每组数值个数为
12
。
(
2
)
低分组的中位数是
72
,
称作第一四分位数
,
也称为下四分位数
,
通常记作
Q1
。
高分组的中位数是
83
,
称作第三四分位数
,
也称为上四分位数
,
通常记作
Q3
。
原数据组的中位数
80
也称为第二四分位数
,
记作
Q2
。
(
3
)
Q3
与
Q1
距离称为四分位间距
,
记作
IQR
。
在本例中
,
IQR= Q3
-
Q1=83
-
72=11
。
图7-35
确定四分位数
IQR
展示的是中间一半数据的离散程度,数值越大越分散,反之数值越小越集中。同时
IQR
处在数据中段且不受极端值的影响,能在一定程度上表现整体数据的离散程度。
2.
箱形图
箱形图是由著名统计学家
John W. Tukey
发明的,借助箱形图可以更直观地观察四分位数。以图
7-35
中的数据为例来说明。
找出
Q1
、
Q3
和中位数的位置,以
Q1
和
Q3
为两边画一个矩形,以中位数的位置在矩形中画一条直线,如图
7-36
所示。
图7-36
箱形图的主体
从矩形两侧分别延长出两条线,延长线的长度为
1.5
倍的
IQR
,如图
7-37
所示。左端点和右端点分别称作下限和上限,需要注意的是,此处上限和下限并不是数据组的最大值和最小值,而是人为规定的一个界限,在界限以内的值是正常值,超过界限以外的是异常值。图
7-37
中最左侧的点是该组数据中唯一没有落在上下限以内的点,是异常值。
图7-37
箱形图
箱形图不受异常值影响,能够准确描述数据的离散程度,非常适合数据组之间的对比。而且箱形图可以横着画,也可以竖着画,只要保证对比的数据组用统一的刻度即可,如图
7-38
所示。
图
7-38
多组箱形图的对比
3.
用 Excel 计算四分位数和制作箱形图
示例
7-2
计算四分位数和制作箱形图来检验超市
SKU
调整效果
有一家新开业的超市,由于老板经验不足,前
3
个月对商品数量一直在做调整。现在老板希望对这一季度的商品数量进行分析,如图
7-39
所示。
图
7-39
某超市的商品数量
需要给每一个月数据计算四分位数并创建箱形图,并且要求在同一个图表中展示,以方便对比,步骤如下。
计算四分位数的方法如图
7-40
所示。具体方法如下。
在
G2
和
G4
单元格分别输入以下公式,并分别向右复制填充到
G2
:
I2
单元格区域和
G4
:
I4
单元格区域。
=QUARTILE.EXC(B3:B32,1)
=QUARTILE.EXC(B3:B32,3)
计算出三个月的上四分位分别为
29.5
、
56.75
和
72
,下四分位数分别为
73.75
、
89.25
和
83
。
图7-40
计算四分位数
插入
3
组数据的箱形图,步骤如下。
步 骤
1
选中
B2:D32
单元格区域。
步 骤
2
单击【插入】选项卡中的【插入统计图表】→【箱形图】命令,即可生成箱形图,如图
7-41
所示。
图
7-41
使用
Excel
生成箱形图
对箱形图进行美化,如图
7-42
所示。
图
7-42
新开超市前
3
个月的商品数量箱形图
END
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请
点击举报
。
打开APP,阅读全文并永久保存
查看更多类似文章
猜你喜欢
类似文章
【热】
打开小程序,算一算2024你的财运
统计学之描述性统计 | Descriptive Statistics
|积少成多|《管理科学与工程》--统计学(27)数据的描述性指标
第18章 如何表达与描述统计资料
五大工具(四):SPC
【积分求助】非正态分布的数据怎么描述它的特点
CDA level I 数据分析基础
更多类似文章 >>
生活服务
热点新闻
留言交流
回顶部
联系我们
分享
收藏
点击这里,查看已保存的文章
导长图
关注
一键复制
下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!
联系客服
微信登录中...
请勿关闭此页面
先别划走!
送你5元优惠券,购买VIP限时立减!
5
元
优惠券
优惠券还有
10:00
过期
马上使用
×