打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
涨知识|机器学习与统计建模 —— 差异和联系

版权声明:本文为CSDN博主「starter_zheng」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接:

https://blog.csdn.net/starter_____/java/article/details/82081373

相同点

1、相同的目标:从数据中学习,核心都是探讨如何从数据中提取人们需要的信息或规律。

2、相同含义的常见术语:

不同点

1、不同的学派:

  • 机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。

  • 统计建模(Statistical modeling)则完全是数学的分支,以概率论为基础,采用数学统计方法建立模型。

机器学习更多地强调优化和性能,而统计学则更注重推导。

2、不同的数据量:

  • 机器学习应用广泛。在线学习工具可飞速处理数据。这些机器学习工具可学习数以亿计的观测样本,预测和学习同步进行。一些算法如随机森林和梯度助推在处理大数据时速度很快。机器学习处理数据的广度和深度很大。

  • 统计模型一般应用在较小的数据量和较窄的数据属性上。

3、不同的数据分析方式:

  • 机器学习本质上是一种算法,这种算法由数据分析习得,而且不依赖于规则导向的程序设计;

  • 统计建模则是以数据为基础,利用数学方程式来探究变量变化规律的一套规范化流程。

总结来说,机器学习的关键词是预测、监督学习和非监督学习等。而数理统计是关于抽样、统计和假设检验的科学。

4、不同的数据使用方式:

  • 机器学习并不需要对有关变量之间的潜在关系提出先验假设。研究人员只需要将所有的可用数据导入模型,等待算法的分析并输出其中的潜在规律,然后将这一规律应用于新数据进行预测就可以了。对于研究人员来说,机器学习就像一个黑盒子,你只需要会用,但并不清楚其中的具体实现。机器学习通常应用于高维度的数据集,你的可用数据越多,预测通常就越准确。

  • 相比之下,统计学则必须了解数据的收集方式,估计量(包括p值和无偏估计)的统计特征,被研究人群的潜在分布规律,以及多次试验的期望参数的类型。研究人员需要非常清楚自己在做什么,并提出具有预测能力的参数。而且统计建模通常用于较低维度的数据集。

5、不同的着重点:

  • 机器学习着重于探索数据所展现的关系和结构,更关心模型的预测能力,即更注重模型的优化和性能。

  • 统计建模着重于评估小样本数据中所体现的关系和结构在总体中推广,更关心模型的可解释性,即更注重模型的推导。

关于这一点,我们或许可以从下面这两段分别来自统计学家和机器学习研究人员针对同一数据模型的描述上得到更深的体会。

  • 机器学习研究人员:在给定 a、b 和 c 的前提下,该模型准确预测出结果 Y 的概率达到了 85%。

  • 统计学家:在给定 a、b 和 c 的前提下,该模型准确预测出结果 Y 的概率达到了 85%;而且我有九成的把握你也会得到与此相同的结论。

6、不同的数据生成方式:

  • 统计建模认为,数据由某个概率模型生成。统计的目标是找出对应的概率模型

因变量(Y)=f(自变量)+扰动函数因变量(Y)=f(自变量)+扰动函数

统计建模最基本的目标是回答一个问题:哪一种概率模型可以产生我所观察到的数据?因此你必须:

  1. 从一个合理的模型群里挑出候选模型

  2. 预估未知变量(参数,拟合模型到数据中)

  3. 比较拟合模型与其他备选模型

  • 机器学习认为,数据是特征集到Label集的特征映射X→YX→Y所生成的。机器学习的目标是恢复特征映射。

     输出(Y)→输入(X)

结论

总结来说,我们可以认为机器学习和统计建模是预测建模领域的两个不同分支。这两者之间的差距在过去的 10 年中正在不断缩小,而且它们之间存在许多相互学习和借鉴的地方。未来,它们之间的联系将会更加紧密。

对开发者而言,充分了解机器学习和统计建模之间的差异和联系,将有助于他们扩大自己的知识面,甚至将专业领域之外的分析方法引入研发流程之中。这一点也正是数据科学(data science)本身的核心理念,即弥合机器学习和统计建模之间的区别,让二者逐渐趋于归一化。最后需要肯定的是,这两门以数据驱动的学科之间的协作和交流越频繁,我们的生活就会变得越好。


END


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
大数据、统计学与机器学习是怎样的关系
统计学和机器学习到底有什么区别?
机器学习数据挖掘的区别
拒绝跟风,看机器学习、数据科学、AI、深度学习、统计学的区别
十个例子,教你用统计学方法高效完成机器学习项目
关于两种统计模型文化的思考
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服