(5)对于“噪声”和孤立点数据敏感。
精选版课件ppt
8
K-means缺点以及改进 (1)要求用户必须事先给出要生成的簇的数目k。这个k并不是最好的。 解决:肘部算法 肘部算法是一种启发式方法来估计最优聚类数量,称为肘部法则(Elbow Method)。
各个类畸变程度(distortions)之和;每个类的畸变程度等于该类重心与其内 部成员位置距离的平方和;最优解以成本函数最小化为目标,其中uk是第k个 类的重心位置
第一次
第二次
精选版课件ppt
17
八、K-means聚类算法
在第五次迭代时,得到的三个簇与第四迭代结果相同,而且准则函数E收敛,迭代 结束,结果如下表所示:
k为迭代次数
精选版课件ppt
18
此课件下载可自行编辑修改,供参考! 感谢您的支持,我们努力做得更好!
精选版课件ppt
精选版课件ppt
3
八、K-means聚类算法
2. K-means聚类算法原理 K-Means算法的工作框架:
(1)给出 n 个数据样本,令 I 1,随机选择 K 个初始聚类中心 Z j (I) , j 1, 2,3,, K ;
(2)求解每个数据样本与初始聚类中心的距离 D xi , Z j I ,i 1, 2,3,, n
假设A、B、C、D的D(x)如上图所示,当算法取值Sum(D(x))*random 时,该值会以较大的概率落入D(x)较大的区间内,所以对应的点会以 较大的概率被选中作为新的聚类中心。
精选版课件ppt
10
八、K-means聚类算法
3 K-means聚类算法特点及应用 3.2 K-means聚类算法应用
i=1,2
精选版课件ppt