编号
购物环境
样本
A商厦
73
B商厦
66
C商厦
84
D商厦
91
E商厦
94
服务质量 68 64 82 88 90
• 把商厦分成两类:A、B为一类,C、D、E为一类 • 把商厦分为三类:A、B为一类,C为一类,D、E为一类 • 没有指定分类标准,大家为什么会这么分呢? • 从数据出发,根据性质上的亲疏程度进行分类!
(3) 计算新类G M 与任一G 类J
之间距离的递
推公式为 D M Ji G m M ,ijn G Jdij m ini G m K,ijn G Jdij,i G m L,ijn G Jdij
m inD K J,D L J
-
最短距离法的聚类步骤
在D 0 中G ,K G L 和
所在的行和列合并成一
个新行新G列M ,对应
,该行列上的新距离值由
(6.3.2)式求得,其余行列上的距离值不变,这
样就得到新的距离矩D 阵1 ,记作
。
(4) 对D 1
重复上述D 0对
的D两 2 步得
,
如此下去直至所有元素合并成一类为止。
如果某一步D m 中最小的元素不止一个,则称 此现象为结(tie),对应这些最小元素的类可以任 选一对合并或同时合并。
xiaxjb,a(0) b i, j i, j
cij 1
-
相似系数
c ij 1 cij c ji
xiaxjb,a(0) b i, j i, j
cij 1
-
相似系数
编号 A商厦
B商厦
购物环境 73 66
服务质量 68 64
-
相似系数
参考教材:《应用多元统计分析》高惠璇,北京大学出版社