计量地理学第7章系统聚类分析ppt课件
- 格式:ppt
- 大小:731.00 KB
- 文档页数:15
第七章地理系统的聚类分析与判别分析§1 地理系统的聚类分析一概述聚类分析又叫群分析,它是研究分类的一种统计方法。
这种方法与判别分析的分类方法不同,它并不要求事先知道划分的类型与数目,而是根据研究对象(标本或变量)的相似程度进行聚合分类。
分类时首先将相互间关系密切的标本(或变量)各自聚合成一个小的分类单位,然后将关系比较疏远的聚合到一个大的分类单位中去。
这样就形成一个由小到大的分类系统。
通常对标本的分类叫做Q型聚类分析。
对变量的分类叫做R型聚类分析,这二种分析的基本作法都是一样的,都是选择一个“分类统计量”来表示标本或变量的相似程度,再按相似程度的大小逐步连结,最后作成一张“分类图”,用以表示标本的亲疏关系。
二、数据的规格化在根据相似程度(相似性统计量)进行聚合分类以前,有时需要对观测数据进行规格化变换。
因为各变量的观测数据,在数值上可能相差很大,当采用不同单位时,各变量的数据可以相差几个数量级。
所以如果直接采用原始数据进行计算。
就会突出那些绝对值大的变量而降低了那些绝对值小的变量的作用。
因此一般在计算前需对变量进行变换,使数据标准化。
此外,标准化的数据也便于计算。
一般在标准化之前,先进行对数变换,以使数据变幅减少且变均匀。
常用的数据标准化方法有如下二种。
1.标准差标准化数据标准化也称做数据的标准差规格化。
设有n 个标本,每个标本观测p 个变量。
得原始数据矩阵:n p ik x X ⨯=][⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡=pn p p n n x x x x x xx x x 212222111211 (1)标准化时,将数据作如下变换:='ik w iiik s x x - ………………………………………………(2) 式中:i x ∑==nk ik x n 11=i s )(111i nk ik x x n --∑= 对标准变量而言,标本的均值为零)0(=μ,标准差为一)1(=s 。