所谓k均值聚类方法是一种无监督的学习算法,它能用已知类数的数据聚类和预测。
在k均值算法中
1、首先要手动输入一个聚类的数目K(即你想将数据总共分成多少类)。然后由计算机(随机的)或人工的设定K个聚类中心Z1(1), Z2(1), ..., Zk(1)。
2、计算任意两点之间的距离平方和
3、通过2的计算找到新的聚类中心Z1(j+1),Z2(j+1),...,Zk(j+1)
4、如果新的聚类中心和以前一样,终止,否则,goto 2。
即该算法首先要人为的给定一个聚类的数目k,然后不断的通过计算距离修正聚类中心。
该算法还有一种改进算法叫ISODATA法
你可以参考一下《数据挖掘:概念与技术》,韩家伟著
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请
点击举报。