灰色聚类方法
- 格式:doc
- 大小:38.00 KB
- 文档页数:2
聚类分析的方法一、系统聚类法系统聚类分析法就是利用一定的数学方法将样品或变量(所分析的项目)归并为若干不同的类别(以分类树形图表示),使得每一类别内的所有个体之间具有较密切的关系,而各类别之间的相互关系相对地比较疏远。
系统聚类分析最后得到一个反映个体间亲疏关系的自然谱系,它比较客观地描述了分类对象的各个体之间的差异和联系。
根据分类目的不同,系统聚类分析可分为两类:一类是对变量分类,称为R型分析;另一类是对样品分类,称为Q型分析。
系统聚类分析法基本步骤如下(许志友,1988)。
(一)数据的正规化和标准化由于监测时所得到的数值各变量之间相差较大,或因各变量所取的度量单位不同,使数值差别增大,如果不对原始数据进行变换处理,势必会突出监测数据中数值较大的一些变量的作用,而消弱数值较小的另一些变量的作用,克服这种弊病的办法是对原始数据正规化或标准化,得到的数据均与监测时所取的度量单位无关。
设原始监测数据为Xij (i=1,2,…,n;j=1,2,…,m;n为样品个数,m为变量个数),正规化或标准化处理后的数据为Zij (i=1,2,…,n;j=1,2,…,m)。
1. 正规化计算公式如下:(7-32)(i=1,2,…,n;j=1,2,…,m)2. 标准化计算公式如下:(7-33)(i=1,2,…,n;j=1,2,…,m)其中:(二)数据分类尺度计算为了对数据Zij进行分类,须对该数据进一步处理,以便从中确定出分类的尺度,下列出分类尺度计算的四种方法。
1.相关系数R两两变量间简单相关系数定义为:(7-34)(i,j=1,2,…,m)其中一般用于变量的分类(R型)。
有一1≤≤1且愈接近1时,则此两变量愈亲近,愈接近-1,则关系愈疏远。
2.相似系数相似系数的意义是,把每个样品看做m维空间中的一个向量,n个样品相当于m维空间中的n个向量。
第i个样品与第j个样品之间的相似系数是用两个向量之间的夹角余弦来定义,即:(7-35)(i,j=1,2,…,m)常用于样品间的分类(Q型)。
灰色聚类分析过程:
首先将七种配方的浆纱记为聚类对象,如表2-12所示。
表中的四项指标记为聚类指标,将综合性能分为好、中、差三种,记为k 1、k 2、k 3三个灰类,聚类过程如下:
(1) 将表2-12中的数据按式(2-1)进行均值化无量纲处理,得到聚类白化数矩阵[]m n X ij ⨯其中n 为聚类对象数,m 为聚类指标数;
(2) 将n 个对象关于聚类指标j (j=1, 2,……,m )的取值相应地分为s 个灰类(s=k 1、k 2、k 3 ),称为j 指标子类;
∑
=λ=
n
1
i k
j
ij ij n
1d X (2-1)
(3) 根据灰类的定义规定j 指标k 子类的白化权函数,根据白化权函数,定义λ
j
k 为j 指标k 子类临界值,并按式(2-2)计算j 指标k 子类的权k
j η;
∑=λ
λ=
ηm
1
j
k
j
k
j
k
j (2-2)
(4)对于白化权函数矩阵,根据白化权函数和权值,按式(2-3)i 对象属于k 灰类的灰色聚类函数k i
σ
()η
⋅=σ∑=k j
ij
m
1
j k ij
k i
x f (2-3)
计算聚类系数矩阵()ns k i σ,根据聚类系数矩阵评价对象i 所属的灰类。
2.5.2.10 灰色聚类结果与分析
根据公式(2—1)得均一化值为:
⎪
⎪
⎪
⎪
⎭
⎪
⎪
⎪
⎪
⎬⎫
⎪
⎪⎪
⎪⎩⎪
⎪⎪
⎪
⎨⎧=9336.00228
.16628
.01895
.19544.01986.16839.01075.11302.11187.12672.18680.00737.11347.12310.11075.11930.11027.13056.19446.00225
.15274.01968.17469.06927.08950.06528.00360.1ij
X
根据公式(2-2)得权的值为:
⎪⎪⎭
⎪
⎪
⎬
⎫
⎪⎪⎩
⎪⎪
⎨
⎧=2531.02500
.02475.02452.02500.02540.02460.02500.02533.02557.02500.02453.0k
j
η
对所测数据进行灰色聚类分析,计算得到聚类系数
⎪
⎪
⎪
⎪
⎭
⎪⎪
⎪
⎪
⎬⎫
⎪
⎪⎪
⎪⎩⎪
⎪⎪
⎪
⎨⎧=2434.03722
.03300
.02247.02337.05262.01792.01239.08017.002137.09252.00819.02494.08112.03203
.02290.03292.04148.03315.00695.0k
i
σ
对于k i σ择取最大值者为聚类灰数,上面列出七种绷带的聚类系数值,最大值为下划线所示值。
根据聚类原则,从我们所列的四种指标来评定,可以得出结论:2~6号绷带压力舒适性好,7号绷带的压力舒适性中等,1号绷带的压力舒适性最差,压力舒适性好的绷带在包扎伤口时不会妨碍病人的肢体运动,不会影响血液的循环流动,不会压迫到神经,骨骼,内脏等,有利于伤口的恢复。