打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
练习R:单个连续数据的探索性统计可视化函数EDA
针对连续型数值变量的描述统计,除了给出集中、离散指标外,我们还可以选择统计图形可视化进行展示。

今天要练习的是,方匡南老师《R数据分析》一书中提供的自定义探索性数据分析函数EDA,用EDA直接给出单个连续变量数据的四张统计图形,可视化效果较好,能快速观察该组数据的基本状况。

EDA配合描述统计指标,效果会更佳。

案例数据:雇员数据


分析任务:考察当前工资salary的分布情况。

自定义EDA函数

EDA <- function (x){ par(mfrow=c(2,2)) # 同时做4个图 hist(x) # 直方图 dotchart(x) # 点图 boxplot(x,horizontal=T) # 箱式图 qqnorm(x);qqline(x) # 正态概率图 par(mfrow=c(1,1)) # 恢复单图}

使用EDA

EDA(employee$salary)

结果展示


直方图:右侧有长尾,当前工资数据有一定程度的右偏态现象;

散点图:大多数人处于低中工资水平,有一小部分人工资较高;

箱线图:右偏状态,伴有可疑异常值;

Q-Q图:提示偏态。

本文完
文/图=数据小兵

参考资料:

方匡南, 朱建平, 姜叶飞. R数据分析[M]. 电子工业出版社, 2015.


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
从理论到学习时间表:教你正月30天速成Python
硅谷资深数据科学家教你认清探索性数据分析(EDA)的价值
探索性数据分析
探索式数据分析的重要性与方法研究
Python探索性数据分析,这样才容易掌握
小白学数据 | 28张小抄表大放送:Python,R,大数据,机器学习
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服