打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
分析的基础:平均和交叉的思路

本篇内容为数据分析入门方法系列的第3篇,平均和交叉的思路,有需要回顾前两篇方法的,传送门在这里:《分组分析法》《对比分析法

本文大概

1435

读完共需

4

分钟

之前两篇内容提到了对比和分组,这都是实际工作中经常用到的,只是你没有把它好好总结出来,今天要分享的平均分析法和交叉分析法同样是工作中随处可见的分析方法,希望我们能学会并用好。

一、平均分析法

平均分析法顾名思义,就是用平均数来反映数据在某一特征下的水平,平均分析通常和对比分析结合在一起,从时间和空间多个角度衡量差异,找到其中的趋势和规律。

01 不得不提的平均数

平均数用来反映一组数据的集中趋势,表示平均的指标有算术平均数、几何平均数、中位数和众数。

  • 算术平均数

最常用的一个平均数,也就是常说的均值、平均值,就是我们熟悉的那个求平均值的公式,所有的数值相加再除以总个数:

算术平均数受极值的影响较大,当数据集中出现极端值时,所得到的结果将会出现较大的偏差,如计算一个企业员工的平均收入,因为老板的收入太高了,导致平均值被拉高,出现了整体收入的平均值偏高的现象,我们经常说的工资收入被平均,就是这个道理。

在Excel里用AVERAGE()函数来计算

  • 几何平均数

几何平均数在计算增长率、收益率等比率和指数进行平均时应用比较广泛,受极端值的影响较小,几何平均值是所有数值乘积开n次方根,在计算几何平均数的时候,不可以有0和负数,公式为:

在Excel里用GEOMEAN()函数来计算几何平均值

  • 中位数

上面讲算术平均数的时候举了一个收入被平均的例子,如果因异常值的出现而无法用算术平均数来描述数据的话,那应该用什么指标来描述呢?对了,就是中位数和众数。

中位数是将数据按照从小到大的顺序排列,最中间的那个数据即为中位数。

中位数的寻找方法:

当数据个数为奇数时,中位数即最中间的数;当数据个数为偶数时,中位数为中间两个数的平均值。中位数不受极值影响,因此对极值缺乏敏感性。

在Excel里用MEDIAN()函数计算中位数

  • 众数

众数是数据中出现次数最多的数字,即频数最大的数值。在一组数据中众数可能不止一个,众数不仅能用于数值型数据,还可用于非数值型数据,且不受极值影响。众数通常用来反映一组数据的一般水平,如某次考试中学生的集中水平、城镇居民的平均生活水平等。

在Excel里用MODE()函数来计算众数

02 平均分析法的应用

同一行业不同竞争产品之间同一平均指标的对比,可以用来比较事件的整体水平,下图所示为2018年淘宝、拼多多、唯品会人均单日使用次数和人均单日使用时长的对比。

(数据来源见图片右下角,,侵删)

如下某公司员工平均收入的例子

 

通过绘制收入分布直方图我们发现,收入在2000~4000的员工最多,与8203的平均值差距太大,这是因为收入在20000以上的几个异常值导致,因此不能用平均值来说明问题。

 

二、交叉分析法

01 交叉分析的意义

交叉分析就是将两项及多项指标进行交叉,从而找到变量之间的关系,发现数据的特征。如下图所示的一份某连锁店统计的商品销售的数据,原始数据表中有年、月、销售区域、销售数量和售价5个维度,可以进行两两组合,得到一些交叉的关系思路,年&销量,年&售价,区域&销量,区域&售价等等,如果每一个字段我们都进行两两交叉,就可以得到10个交叉关系,需要注意的是,这些交叉关系是要有实际意义的,如年和月的交叉,分析不出什么,也没有意义。

 

【年&销量】

通过对年和销量间的交叉,得到10年销量比09年高。

 

【区域&销量】

通过对区域和销量进行交叉分析,得到沈阳的销量最好,上海最差。

 

【3个维度交叉】

除了两两交叉,还可以多项交叉,如区域&销量&年之间的关系。

 

【多个维度交叉】

区域&销量&年份&售价四个维度的交叉关系

 

02 交叉分析的应用

下图所示的拼多多在不同时间维度上的月活,以及与淘宝、京东用户重合的比例进行分析,可以了解到不同时期与竞品的对比。

(数据来源见图片右下角,侵删)

    小结   

对于交叉分析用到最多的工具就是数据透视表

l  要能甄别有意义的交叉和无意义的交叉

l  要找到交叉的点

这个系列会写一些入门级的分析方法,工具的运用都大同小异,思维的不同决定个体的差异,希望大家能get到其中的奥秘。


提供入门级数据分析的学习路线规划,分享从Excel到统计学的干货。数据分析是一项技能,希望人人都能分析数据。

相关内容:

SQL学习:MySQL入门 | 库/表/记录的增查删改

Excel分析方法:时间序列分析 | 回归分析 | 描述性统计分析 | 相关性分析 

Excel图表:数据地图 | 数据透视表 | 5个基本图 | 13个进阶图 | 直方图 | 控制图 | 排列图

Excel函数:日期文本函数 | 查找引用函数 | if函数 | 统计函数

用Excel进行数据分析:数据获取 | 数据处理 

方法论:如何系统地学习Excel | 数据分析学习 | Excel相见恨晚的技巧 

如果你觉得有用,请点击右下角 在看 

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
麓山国际实验学校2019-2020 九年级(上)开学数学试卷
第8章:指标分析
拿到数据后,你需要掌握哪些数据分析方法
每天一点统计学——数据集中趋势的量度
中位数
小学五年级数学的平均数、中位数和众数的概念知识
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服