–达到指定迭代次数(maximum iteration),默认10次。 –收敛标准(convergence),默认0.02,即:本次迭代产生的任意新类,各
中心位置变化较小.其中最大的变化率小于2%.
29
K-means快速聚类
(三)基本操作步骤
A.菜单选项:analyze->classify->k means cluster B.选定参加快速聚类分析的变量到variables框 C.确定快速聚类的类数(number of clusters).类数应小
第九章 SPSS的聚类分析
1
聚类分析概述
• 概念:
– 聚类分析是统计学中研究“物以类聚”的一种方法,属多元统计分析方法. – 例如:细分市场、消费行为划分
• 聚类分析是建立一种分类,是将一批样本(或变量)按照在性质上的“亲疏” 程度,在没有先验知识的情况下自动进行分类的方法.其中:类内个体具有 较高的相似性,类间的差异性较大.
•(张三,李四) 2: a=0 b=0 c=1 d=2 J(x,y)=1/1=1 (不相同)
11
聚类分析概述
• 品质型个体间的距离
– Jaccard系数举例:根据临床表现研究病人是否有类似的病
•姓名 性别 发烧 咳嗽 检查1 检查2 检查3 检查4
•张三 男 1 0 1 0 0
0
•李四 女 1 0 1 0 1
•姓名 授课方式 上机时间 选某门课程
•张三
1
1
1
•李四
1
1
0
•王五
0
0
1
•(张三,李四):a=2 b=1 c=0 d=0 d(x,y)=1/(1+2)=1/3
•(张三,王五):a=1 b=2 c=0 d=0 d(x,y)=2/(1+2)=2/3