打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
(1)层次聚类方法
   层次聚类方法对给定的数据集进行层次的分解,直到某种条件满足为止。具体又可分为凝聚的,分裂的两种方案。  1凝聚的层次聚类是一种自底向上的策略,首先将每个对象作为一个簇,然后合并这些原子簇为越来越大的簇,直到所有的对象都在一个簇中,或者某个终结条件被满足,绝大多数层次聚类方法属于这一类,它们只是在簇间相似度的定义上有所不同。  2分裂的层次聚类与凝聚的层次聚类相反,采用自顶向下的策略,它首先将所有对象置于同一个簇中,然后逐渐细分为越来越小的簇,直到每个对象自成一簇,或者达到了某个终止条件。  层次凝聚的代表是AGNES算法,层次分裂的代表是DIANA算法。

工作原理

  给定要聚类的N的对象以及N*N的距离矩阵(或者是相似性矩阵), 层次式聚类方法的基本步骤(参看S.C. Johnson in1967)如下:   1. 将每个对象归为一类, 共得到N类, 每类仅包含一个对象. 类与类之间的距离就是它们所包含的对象之间的距离.  2. 找到最接近的两个类并合并成一类, 于是总的类数少了一个.   3. 重新计算新的类与所有旧类之间的距离.   4.重复第2步和第3步, 直到最后合并成一个类为止(此类包含了N个对象).   根据步骤3的不同, 可将层次式聚类方法分为几类:single-linkage, complete-linkage 以及average-linkage 聚类方法等.  single-linkage 聚类法(也称connectedness 或minimum方法):  类间距离等于两类对象之间的最小距离,若用相似度衡量,则是各类中的任一对象与另一类中任一对象的最大相似度。  complete-linkage聚类法(也称diameter或maximum 方法):  组间距离等于两组对象之间的最大距离。   average-linkage聚类法:  组间距离等于两组对象之间的平均距离。   average-link 聚类的一个变种是R. D'Andrade (1978)的UCLUS方法, 它使用的是median距离, 在受异常数据对象的影响方面, 它要比平均距离表现更佳一些.  这种层次聚类称为“凝聚"法,由于它迭代合并所有分类。也有一种“划分”层次聚类法,与“凝聚”相反,它先将所有对象放在同一类中,并不断划分成更小的类,划分法一般很少使用。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
机器学习算法基础:层 次 聚 类 详 解
层次聚类Hierarchical Clustering解析
机器学习入门笔记(七):聚类(相似度或距离)
r语言聚类分析:k-means和层次聚类
Python中的凝聚层次聚类示例
数据挖掘:基于R语言的实战 | 第5章:聚类分析
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服