2019春招的战火逐渐升级,主页君在浏览各大公司官网JD时发现,很多岗位都会有明确的Excel技能要求:
图/2019 Deloitte春招职位
熟练掌握Excel不仅可以让你的简历获得面试官的青睐,而且在入职之后也可以提高你的工作效率。无论是投行人用到的估值建模,还是咨询公司必会的数据分析,都要用到Excel。
那么,顶级公司员工的Excel技能是如何炼成的呢?今天主页君给大家分享一篇,前麦肯锡面试官总结的Excel必看宝典,读完文章你会发现,想成为Excel大神,要从耐得住寂寞清洗数据开始。
今日重磅活动推荐
本文授权转载自清醒贪心计(ID:qtnotes)
作者:Autumu,现居北京,七年麦肯锡咨询,三年互联网运营
- 1 -
为什么要学点数据分析?
这年头,没人会怀疑数据的重要性,但有人会问,“为什么要自己做数据,不是有专业的数据团队吗?”。是的,大部分公司会配备专职岗位,埋点取数、储存清洗、制作报表、开发可视化后台,还可建立专业模型,做出深度分析。
随着数据变得海量、工具变得专门,我们似乎没有必要也没有能力自己去碰数据了。但有点数据分析的常识,首先能让你跟数据团队更好地沟通,拿到的原始数据或者分析结果更能满足实际需要。
或者,人手不够时,能挽起袖子自己上。分析经常是个边想边做的过程,数据天生“脏乱差”,很容易被歪曲、被误读,常识能帮助你善加分辨。
- 2 -
第一步,定义需求
学习Excel技能,若不带着“解决问题”的思路,把快捷键敲得快如闪电,也只是耍帅罢了。数据分析,从定义需求、数据搜集开始,来源包括外部的报告、内部的记录,日常的报表、定制的调研等。
小伙伴们提出的数据需求,经常有3个层级:
高屋建瓴地说,我想看看这个产品、这个市场——这需要数据提供者非常清楚,到底“看什么,怎么看”。
相对清晰地说,我要这些数据——例如,我想要这些商品过去一年每月的销售金额。
给出完整的表格和描述——规定具体指标、时间跨度、数量单位、呈现方式等。
前期思考得细致,能避免反复折腾、做无用功。要义是,“以终为始”、“结果导向”地思考,我究竟要解决什么问题。分析并没有那么简单,需要先想明白,我到底想证实或者证伪什么、发现或者解答什么,才决定用什么样的数据可以支撑。
这和Excel能力无关,却是一切分析的逻辑起点。
图/PEXELS
- 3 -
第二步,提出需求
提数据需求一定要跟数据提供者约时间,“过一遍需求”。
交代背景,让对方理解目标,这样能够发挥他们的经验,帮助修正需求。
解释指标,让大家的理解在同一层面上。
了解数据的可得性,以及需要付出的代价。这一步非常重要,因为找数据也要“二八法则”。
在刚刚做完的一个分析中,同事告知,2016年8月进行过一次系统升级,如果要此前的数据,就得大费周章,花一个星期导出整理;如果要此后的数据,几小时就可以搞定。
这时,我们就可以问问自己,是否一定需要此前的数据,还是过去16个月的趋势已经基本满足需求,当场做个决定。
- 4 -
第三步,原始数据整合标注
没有定义、来源、时间、单位的数据分析,都是耍流氓。所以呢,拿到原始数据后,通常应该做以下动作:
将多项数据导入同一张Excel大表。
给每一个数据Sheet编号、命名,注明来源日期单位等信息。
接着,在第一列添加当前行号。如果后面要排序、修改,也容易重新排回原顺序。
确认单位,调整格式(例如日期不要有乱码)。
检查一下是否有外部链接与公式。
有个快捷键,“Ctrl”键+“~”键,摁住可以暴露单元格的隐藏信息。
正常看到Excel表格是这样的:
按住“Ctrl+~”看到是这样的,暴露里面的公式链接等。
如无特殊情况,避免引用外部数据与公式,容易出错。
- 5 -
第四部,检查异常,清洗数据
如果不重视数据清洗的重要性,那么后面的分析都会建立在流沙上。下面的动作,应该耐心对数据一列列地做完。
看数据全貌
在Excel底部右侧,可以看到选中那列数据的基本信息,例如计数、平均、最大、最小等,如下图:
判断一下,是否符合常识,有没有问题。那我怎么知道对不对呢?——你不需要知道精确数值,只需要想想这个数量级是否正确。
是否有“=0”或者干脆空白的数据,正常吗?
选中整张表格数据,在菜单栏上选择“数据”,“筛选”,然后可用每栏的筛选下拉菜单,看看这栏包含哪些数值。
我特别注意“0”或者“空白”的数据。它有可能是正常的,例如某天真是没有人登录或者注册(服务器宕机),也可能数据发生缺失错漏。如果有大量的“0”或者“空白”,需要思考对我们分析的影响。
统一数值口径
这是个无聊而必要的脏活,大家肯定遇到过。问HR要个员工名单,发现部门那一栏五花八门,营销部也会写成“营销中心”、“营销”、“市场营销”...必须要先把这些收拾干净,否则无法愉快地进行统计了。
相关数据交叉检验
有时候,同样的数值会在不同数据源中多次出现。例如,一张Sheet是当天在售每种商品的销售件数,另一张Sheet是当天每个用户各自买了几件商品。
两张Sheet分别加总的值,应该相同。误差也许难免,个把商品或者用户统计不精确时有发生;但若相差太大,Again,数据又出错了。
用“格式条件”看数据波动,发现异常
Excel的“条件格式”功能,可以根据数值大小,给单元格画上彩色柱状图。下图左边,可以发现A栏数据在2016年11月出现断崖式下降;右边B栏,则在2017年12月底出现峰值。
在这个真实案例中,前者是当时发生统计口径变化(不是真实波动),而后者是促销带来的波动。
比起导成图表,这个功能快速简便,可以发现错误,或者让我们留下总体印象,指导后续的分析。这5个步骤做完,明显的数据错误应该可以抓出来。
最后,总结一下:
定义需求——我到底要做什么
提出需求——不能把要求简单写写,邮件一发就算完
整合标注——没有时间日期单位来源的数据都是耍流氓,原始数据神圣不可侵犯
检查异常——世界比想象中错误百出
数据分析,听起来是非常炫酷的事,但是,和所有其他事一样,许多基本的工作,既不炫酷,也不轻松。于是,也和所有其他事一样,做得好的人,是能接受其中不够炫酷的部分的人。安心趟过千万个坑,一步一步向前走。
“See it through,and do it right”,所谓Professional,就是这个意思。
读完文章,相信大家对如何
从Excel小白升级为大神有了一定的认知
想练就神级操作只靠以上干货还不够
想知道如何才能在短时间内极速提升Excel技能吗?
那就一定要关注4天Excel极速提升班
世界领先IT咨询公司导师带队
4天行业知识沉浸式学习
为了帮助同学们更好的掌握讲座知识
更快的练就Excel神技能
DBC还为大家准备了讲座配套福利
赶紧领取福利练起来!
35G Excel技能提升资料包 完整版Excel shortcuts 快捷键汇总 Corporate Financial Analysis Excel报告 Excel进阶视频技巧 Excel公式强化视频 *以上福利在讲座结束后由小编在群里统一发放
联系客服