计量地理学第7章系统聚类分析.
- 格式:ppt
- 大小:881.00 KB
- 文档页数:62
1、用最短距离聚类法对35个城市综合实力进行系统聚类分析:首先打来spss软件,导入数据,如下图。
选择Analysize---Classify---Hierarchical Cluster,打开系统聚类的分析的窗口。
然后将要分析的变量选入Variable的框内。
选择Plots,选中复选框Dendrogram,点击Continue。
选择Method按钮,在Cluster Method中选择Nearest Neighbour,即最短距离聚类,在Measure 的Interval中选择Euclidean distance, 选择Continue。
最后点击OK。
在Output的窗口中出现分析的结果,最短距离聚类谱系图如下:* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Single LinkageRescaled Distance Cluster CombineC A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+33 ⇩34 ⇩▫26 ⇩▫5 ⇩▫25 ⇩▫14 ⇩▫17 ⇩▫29 ⇩▫32 ⇩⇳⇩4 ⇩▫⇔35 ⇩⇔22 ⇩✗⇩▫30 ⇩⇔15 ⇩⇔18 ⇩▫⇔8 ⇩⇳⇩▫20 ⇩⇔31 ⇩⇩⇩▫21 ⇩⇩⇩▫3 ⇩⇩⇩⇳⇩28 ⇩⇩⇩▫⇔9 ⇩⇩⇩▫⇔7 ⇩⇩⇩⇔13 ⇩⇩⇩⇔19 ⇩⇩⇩⇳⇩▫11 ⇩⇩⇩▫⇔12 ⇩⇩⇩▫⇩⇩⇩⇩⇩⇩⇩16 ⇩⇩⇩⇩⇩▫▫⇩6 ⇩⇩⇩⇩⇩⇔⇔2 ⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩▫⇔24 ⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩▫⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩23 ⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩▫▫⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩1 ⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇔⇔27 ⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇔10 ⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩2、用最远距离聚类法对35个城市综合实力进行系统聚类分析:前面的步骤和上面一样,在Method的窗口中选择Furthest neighbour,其他不变,点击continue,最后点击OK。
第七章地理系统的聚类分析与判别分析§1 地理系统的聚类分析一概述聚类分析又叫群分析,它是研究分类的一种统计方法。
这种方法与判别分析的分类方法不同,它并不要求事先知道划分的类型与数目,而是根据研究对象(标本或变量)的相似程度进行聚合分类。
分类时首先将相互间关系密切的标本(或变量)各自聚合成一个小的分类单位,然后将关系比较疏远的聚合到一个大的分类单位中去。
这样就形成一个由小到大的分类系统。
通常对标本的分类叫做Q型聚类分析。
对变量的分类叫做R型聚类分析,这二种分析的基本作法都是一样的,都是选择一个“分类统计量”来表示标本或变量的相似程度,再按相似程度的大小逐步连结,最后作成一张“分类图”,用以表示标本的亲疏关系。
二、数据的规格化在根据相似程度(相似性统计量)进行聚合分类以前,有时需要对观测数据进行规格化变换。
因为各变量的观测数据,在数值上可能相差很大,当采用不同单位时,各变量的数据可以相差几个数量级。
所以如果直接采用原始数据进行计算。
就会突出那些绝对值大的变量而降低了那些绝对值小的变量的作用。
因此一般在计算前需对变量进行变换,使数据标准化。
此外,标准化的数据也便于计算。
一般在标准化之前,先进行对数变换,以使数据变幅减少且变均匀。
常用的数据标准化方法有如下二种。
1.标准差标准化数据标准化也称做数据的标准差规格化。
设有n 个标本,每个标本观测p 个变量。
得原始数据矩阵:n p ik x X ⨯=][⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡=pn p p n n x x x x x xx x x 212222111211 (1)标准化时,将数据作如下变换:='ik w iiik s x x - ………………………………………………(2) 式中:i x ∑==nk ik x n 11=i s )(111i nk ik x x n --∑= 对标准变量而言,标本的均值为零)0(=μ,标准差为一)1(=s 。
《计量地理学》课程笔记第一章绪论一、计量地理学的产生1. 背景- 地理学的传统研究方法主要是定性的描述和分析,但随着科学技术的进步,地理学家们开始寻求更精确、更系统的分析方法。
- 第二次世界大战后,计算机技术的迅速发展以及大量地理数据的积累为地理学的定量研究提供了可能。
2. 起源- 20世纪50年代,美国地理学家沃尔德华·克里斯塔勒(Walter Christaller)和威廉·阿瑟·刘易斯(William Arthur Lewis)等人的工作标志着计量地理学的诞生。
- 我国计量地理学的发展始于20世纪70年代末,随着改革开放的推进,引入了西方的计量地理学理论和方法。
3. 产生原因- 地理学研究的内在需求:为了更深入地理解地理现象的规律性和内在联系,需要定量化的研究方法。
- 数学与统计学的发展:为地理学提供了新的工具和方法,如回归分析、聚类分析等。
- 计算机技术的应用:使得复杂的数据处理和模型运算成为可能。
二、计量地理学的研究对象和内容1. 研究对象- 地理空间分布:研究地理现象在空间上的分布特征和规律。
- 地理现象的变化:分析地理现象随时间的变化趋势和周期性。
- 地理要素关系:探讨不同地理要素之间的相互作用和影响。
2. 研究内容- 地理数据的采集与处理:包括数据收集、清洗、转换和存储等。
- 地理现象的定量描述:使用数学模型和统计方法对地理现象进行描述。
- 地理模型的构建与应用:建立地理现象的数学模型,用于预测和决策支持。
- 地理空间分析:研究地理现象的空间格局、空间过程和空间关系。
三、计量地理学的研究方法1. 数学方法- 概率论:用于描述和推断地理现象的不确定性。
- 数理统计:用于数据分析、假设检验和模型建立。
- 线性代数:用于处理地理数据的矩阵运算。
- 微积分:用于分析地理现象的变化率和累积量。
2. 统计方法- 描述性统计:对数据进行总结和可视化。
- 推断性统计:从样本数据推断总体特征。
计量地理学期末第二章1. 地理数据有哪几种类型,各种类型地理数据之间的区别和联系是什么?答:地理数据就是用一定的测度方式描述和衡量地理对象的有关量化指标。
按类型可分为:1)空间数据:点数据,线数据,面数据;2)属性数据:数量标志数据,品质标志数据地理数据之间的区别与联系:数据包括空间数据和属性数据,空间数据的表达可以采用栅格和矢量两种形式。
空间数据表现了地理空间实体的位置、大小、形状、方向以及几何拓扑关系。
属性数据表现了空间实体的空间属性以外的其他属性特征,属性数据主要是对空间数据的说明。
如一个城市点,它的属性数据有人口,GDP,绿化率等等描述指标。
它们有密切的关系,两者互相结合才能将一个地理试题表达清楚。
2. 各种类型的地理数据的测度方法分别是什么?地理数据主要包括空间数据和属性数据:空间数据——对于空间数据的表达,可以将其归纳为点、线、面三种几何实体以及描述它们之间空间联系的拓扑关系;属性数据——对于属性数据的表达,需要从数量标志数据和品质标志数据两方面进行描述。
其测度方法主要有:(1) 数量标志数据①间隔尺度(Interval Scale)数据: 以有量纲的数据形式表示测度对象在某种单位(量纲)下的绝对量。
②比例尺度(Ratio Scale)数据: 以无量纲的数据形式表示测度对象的相对量。
这种数据要求事先规定一个基点,然后将其它同类数据与基点数据相比较,换算为基点数据的比例。
(2) 品质标志数据①有序(Ordinal)数据。
当测度标准不是连续的量,而是只表示其顺序关系的数据,这种数据并不表示量的多少,而只是给出一个等级或次序。
②二元数据。
即用0、1 两个数据表示地理事物、地理现象或地理事件的是非判断问题。
③名义尺度(Nominal Scale)数据。
即用数字表示地理实体、地理要素、地理现象或地理事件的状态类型。
3. 地理数据的基本特征有哪些?1)数量化、形式化与逻辑化2 )不确定性3 )多种时空尺度4 ) 多维性4. 地理数据采集的来源渠道有哪些?1)来自于观测、测量部门的有关专业数据。