打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
2019年度互联网数据分析术语大全
彼得.德鲁克曾经很认真地说过:”如果一个事情,你不能衡量它,那么你就不能增长它“。先来看看下图:
这是一副令人思考的图,或许这就是不懂统计学,没有能力做好数据分析后的产品体验,更糟糕的是我们经常见到一些”互联网大牛“在头头是道地分享经验时,并不能从数据上给出任何方法来验证其做法的科学性。
当我们并没有能够理解并掌握数据分析的基本方法时,估计都没有办法去判断如何通过语文、数学、英语成绩判断学生的学习能力这件事。
而这道题目的数学等价问题可以是如何通过不同用户的特征来判断其购物/内容/兴趣偏好。
但往往大部分产品和运营团队的负责人却在天天都要思考如何有效触达用户、转化用户这件事。
在前不久的一次线下的交流活动中,我给现场学员出了几道有关数据驱动和用户画像的题目,结果很有意思,我分享一下几个典型的题目和答案统计如下:
问题1:想要用户增长你会怎么做?
几乎90%的学员都选择了要了解现有用户分层结构。
问题2:  实现千人千面产品最需要的企业能力?
从回答的结果来看:90%以上的学员选择了数据采集,近80%的学员选择了算法建模。
问题3: Profile形成的用户画像可以用在什么领域
从回答的情况来看,近95%的人选择了精准营销,近89%的人选择了个性化服务。其他问题限于今天的篇幅,下次举例给大家。
所以今天大家都想搞用户分层、精准营销和个性化服务,似乎很多企业都在希望可以通过大数据和机器学习技术来实现技术驱动精细化运营,降本增效,但为什么效果都不好呢?
问题就在于基本的统计学基础和数据分析方法都没有掌握,走路还没有学会就想跑得快。
所以有必要我们逐步来正本清源地做一些互联网数据分析的普及教育工作。
下面这个大全列表里包括常见的互联网数据分析用到的术语,我们也会在最近的数据分析及运营课里集中讲授,可分成几个大类。
商业模型
统计基础
数据处理
互联网数据指标体系
进阶数据分析
数据可视化
值得收藏。
正文就是2019互联网数据分析术语列表(大全)- 值得收藏的部分开始
商业模型
术语名称解释
5W2H数据分析中用来确定需求的分析方法
PDCA一种流程化的数据分析操作步骤
五力模型商业上的竞争格局分析方法
统计基础
术语名称解释
辛普森悖论数据集分组呈现的趋势与数据集聚合呈现的趋势相反的现象。
最小平方误差
在无法获得真实值时候的一种处理误差的方法
数据降维一种海量数据的特征处理方法,用来处理较大的数据集,减少计算量
标准差反映一个数据集离散程度的统计学方法
正态分布
一个指出随机变量的服从数理规律的概率分布的统计学概念,在数学、物理及工程等领域都非常重要
极差
最大值与最小值的差最小平方误差
分位点 随机变量概率分布产生的的数值概念
IQR
分位数差距产生的概念
离散系数
在无法获得真实值时候的一种处理误差的方法
异众比率非众数在总数据集中所占的比率
数据处理
术语名称解释
数据清洗
通过对原始获取的数据进行基于数理统计和数据挖掘技术的处理
归一化基于规则和量纲表达式的数据处理
离散化数据的连续属性离散化
缺失值数据缺失的调整处理方法
数据去重2条数据如何去除1条
数据噪音处理数据上如何光滑处理的方法
互联网数据指标体系
术语名称解释
投入期互联网项目的发展阶段定义,主要关注品牌知名度、用户增长量、用户活跃度
成长期互联网项目的发展阶段定义,主要关注增长率、占有率、效率
成熟期互联网项目的发展阶段定义,主要关注ROI
衰退期互联网项目的发展阶段定义,主要关注流失率
到达率营销广告活动中,媒质信息真实送达人群占所有传播对象的百分比(比如邮件、短信等)
转化率在一个有效会话期间的流量和目标的比率(注意会话的定义方式)
PV/UV用来衡量网站页面用户体验的比率
visit访客的计算单位
click点击的计算单位
新老占比用来衡量网站/App用户忠诚度的指标
访问深度用来衡量每次访问质量的指标
停留时间单次访问的总时间长度,并非越长越好
留存率通过在一定期间再次访问网站/APP和总增长访客的比率来计算用户粘性的指标,一般有次日、三日、七日等不同计算方式。不同业务对留存的定义也不同。
访问频次一个唯一标示的访客在一段时间内执行一个动作的次数
跳出率仅对单个页面而言的指标,是访问过该页面就离开的访客数量与总访客数量的比率
用户粘度DAU/MAU,比值越高越好
ARPU平均每个用户产生的收益(需要注意统计时段)
LTV一个用户在生命周期内贡献的总收益
AARRR一个业务增长的闭环模式,覆盖从获客、活跃、留存和收益的全过程
K计算公式一个自传播(病毒传播)用于计算扩散能力的公式
流量分析传统基于cookie技术的网站数据分析,用来衡量外部网址(URL)和内部网址对网站的贡献
转化分析电商等互联网业务中比较重要的分析手段,用来判断外部流量和内部流量对最终目标的完成效果衡量
细分分析网站/APP数据的汇总数据和平均值分析方法
对比分析对相关的指标进行对比分析的方法
聚类分析对网站/APP的页面/用户等按照行为和属性的聚类分析方法
参与度分析用户完成目标过程中的页面数量分析,帮助提高页面的目标相关度和促进度
热力图分析单个页面的点击量分析,主要关注链接分布
产品页面分析用于有大量不同产品/内容放置的页面位置分析,优化布局
路径分析也叫Page Flow,主要用在监控用户访问阻力和判断访问喜好
FAST体系阿里提出的一套衡量人群/消费者从认知、兴趣、购买、忠诚消费者到超级用户的指标体系
进阶数据分析
术语名称解释
RFM衡量当前用户价值和客户潜在价值的重要工具
WOE/IV常用的一种预测分类算法,可以用在用户分组的决策预测领域
决策树一种直观应用概率的图解决策分析法,通过求取净现值的期望值大于等于零的概率,评价风险并判断可行性
SVM一种在监督学习方式下广义线性分类器,广泛用于图像识别和文本分类
随机森林
包含多个决策树的分类器,在机器学习应用中很重要
逻辑回归
常见的一种广义线性回归分析模型,在数据挖掘,疾病自动诊断,经济预测等领域应用广泛
回归树
和分类不同,回归树的核心目的是对数值的回归预测,比如房价和年龄等,输出的是连续值,一般通过连续对数据集划分来完成回归树的构建。
相关性分析
对不同特征或者数据间关系的一种分析方法,有正相关、负相关和不相关,帮助发现业务中关键影响
相关系数
反映变量间关系密切程度的统计指标
协方差数据纬度相关性的分析方法
回归预测通过找到预测目标的各因素,以及这些因素和预测目标之间的函数关系的数学方法,是常用的预测类分析方法
最小二乘法通过最小化误差的平方和寻找数据的最佳函数匹配来解决目标优化的一种方法
梯度下降法一个一阶最优化算法,用来找到目标函数的最小值
多元线性回归
回归预测中的一种模型
Apriori算法数据挖掘中最活跃的研究方法之一 。1993年由Agrawal等为了分析商场购物篮问题提出,核心是为了研究不同交易产品之间的关系规则
FB-tree算法
也是关联规则的一种算法,相比Apriori算法,不需要候选集
协同推荐算法
是利用用户历史偏好数据计算用户间的距离,并利用相邻用户评价等数据来预测目标用户对特定商品的喜好程度,从而实现推荐
AB测试
数据驱动产品和运营策略的实验方法,也是经典的统计学和数据分析方法,多采用三组以上样本进行实验对比,有助于解决方案的分歧并定位问题
T检验一种统计学分析方法,以假设检验为分析基础,在假设成立基础上看样本对各分布的满足程度,用来判断AB测试的方案是否有显著性差异。
方差检验
一种统计学分析方法,用来比较两个或者多个变量数据样本,判断样本的差异到底是随机的,还是由于统计显著差别导致。
聚类分析应用非常广泛的用户分群统计学手段
K-means算法最广泛使用的聚类算法之一,主要依靠迭代求解,特点是简洁和高效
分类算法重要的数据挖掘技术,目的是根据数据集的特点构造一个分类函数或分类模型(也常常称作分类器),用于预测。和回归方法不同的是,分类的输出是离散的类别值。
贝叶斯分类
一种利用概率统计知识进行分类的算法,广泛用于数据挖掘分析、模式识别和人工智能
数据可视化
术语名称解释
直方图用高度不等的纵向条纹或线段表示数据分布的情况的数据统计图表
折线图展示数据有序因为某些变量而变化的数据统计图表
散点图展示数值之间关系,用于判断数据变量之间是否存在关联的的数据统计图表
饼图用于在二维观测情况下,展示数据占比情况的数据统计图表
气泡图展示三个变量之间的关系的数据统计图表,与散点图类似,但气泡图允许额外加入一个表示大小的变量进行对比。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
数据工程师必看:分析数据时常见的 7 类统计陷阱
谁在用大数据?
那些年,曾经被我们误读的大数据
冬天就要来了,你的饭碗端稳了吗?求职者的“金九银十”,这些公司不要轻易错过 | 大数据周聘汇
利用百度数据来做SEO优化系列(一)
超级菜鸟怎么学习数据分析?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服