当前位置:文档之家› 空间自相关1

空间自相关1

空间自相关1
空间自相关1

空间自相关

全局空间自相关:Join Count算法

空间

虾神daxialu(虾神) ? 2015-11-18 07:38

ArcGIS里面,全局空间自相关只提供了一个Moran's I方法,当然要说一招鲜吃遍天也是可以的,不过关于全局自相关还是有不少其他的方法的,这次给大家介绍一种更加简单并且容易理解的全局空间自相关方法:Join Count 方法。

这个方法最早是英国剑桥大学的著名地理学家Andrew D. Cliff 教授和美国乔治敦大学的J. Keith Ord提出,就是下面的两位老帅哥:

后面这个为J.KeithOrd更是厉害,以前说的 General G 指数也有他的一份。 Join Counts这种算法对比那些公式复杂到抓狂的各种算法来说,简单到让人眼前一亮,下面我们来看看他的原理:

首先从他的名字上来看,就能够猜出是怎么完的了。这个算法,就是对两个要素之间的连接类型进行计数,然后根据这个计数来判定聚类还是离散的。

这种类似一种描述二进制之间关系的方式,如黑/白两种颜色,他们之间的关系就有三种:黑-黑(BB)、白-白(WW)、黑-白(BW)。

如下图:

三种情况的概率,就如下所示:(有数学恐惧症的同学请略过)

算出来之后,他们的预期值是:

算出三种值来之后,就可以进行比较了,比较的结果如下: 如果BW比我们所期望的数值要低,表示正空间自相关。如果BW比我们所期望的数值要高,表示负空间自相关。如果BW比我们所期望的数值均等,表示随机。如下图所示:

最后,我们来看看分布用我们最属性的Moran's I和join Counts两种方法计算出来的全

局空间自相关的结果:

首先是数据,我们选用2004年美国大选中,小布什的得票率来计算,数据如下图:

通过Moran's I方法技术出来的结果如下:

下面逐条解答一下上面的各项内容:

, 数据:data数据集里面的小布什得票数

, 空间权重(空间关系概念化):这里是面数据,用的是共点共边就被认为是近邻,用

的是“Queen's Case”(这点看不懂的,请去看白话空间统计之五:空间关系概念化

(下)里面的描述)

, Moran's I 统计标准偏差:51.731(统计标准偏差:一种量度数据分布的分散程度之标准,

用以衡量数据值偏离算术平均值的程度。标准偏差越小,这些值偏离平均值就越少,

反之亦然。标准偏差的大小可通过标准偏差与平均值的倍率关系来衡量。) , p值:2.2e-16,置信度为99%以上,极高置信度区间,说明这份数据效果非常好。 , alternative hypothesis(备择假设亦称研究假设,统计学的基本概念之一。假设检

验中需要证实的有关总体分布的假设,它包含关于总体分布的一切使原假设不成立的

命题。):极大

, Moran's I 统计指数:0.5565174275

, 期望值:-0.0003219575

, 方差:0.0001158676

因为Moran's I的指数是在-1 ——1 之间,越靠近1的,聚集趋势就越明显,所以根据以上数据,我们可以判定,小布什的得票获胜区域(或者失败区域)有明显的聚集趋势,也就是说,如果他在某个区域获胜,那么在该区域旁边的区域也极有可能获胜,反之亦然。下面是通过Join Count方法进行计算的结果:

因为Join Count只能处理二值化数据,所以第一句就是将值化为二值化,布什获胜的,设置为1,失败的设置为0.

结论解读如下:

, 0:0——失败区域与失败区域关联的计数为130,期望值为54,方差是

6.7,Z值是29.466 , 1:1——获胜区域与获胜区域关联的计数为1111,期望

值为1030,方差是12.6,Z值是

22.596

, 1:0——获胜区域与失败区域关联的计数为311,期望值为472,方差是29.47,Z值是

-29.645

, Jtot——不同颜色的计数值计数为311,期望值为472,方差是29.94,Z

值为-29.413 从上面的数据可以看出,BB和WW都明显出现了计数值远高于期

望值,所以数据呈现聚类模式,其中BB的值方差要小于WW值的方差,所以小布什的获胜选区的聚类程度要略大于失败选区的聚类程度。

而BW的计数小于期望值,可以认为,不存在离散趋势了。

检验统计量表明,BB和WW都是正值,说明我们假设的值比较贴合实际运

算结果,是一份比较可信的运算过程。

最后Jtot 是所谓的“不同颜色”也就是说,离散偏随机的计数,可以看见与BW的值非常贴近,所以这份数据也表明了随机的可能也是比较低的。

白话空间统计十七:聚类和异常值分析

(Anselin Local Moran's I)

空间统计

虾神daxialu(虾神) ? 2015-09-15 17:41

前面我们聊的各种指数,无论是莫兰指数还是P值Z得分,都是整体数据的结论,也就是所谓“全局莫兰指数(Globe Moran's I)”,也就说,不管我给你多少数据,最后你就吐出一个来给我~这算神马~当然,从名字上来看,全局数据嘛,有一个给你就不错了。实际上作为我们玩GIS的人,最喜欢的就是出一张花花绿绿的地图,比如这样的:

或者是这样的:

所以我们更希望的是将我们输入的数据,标示出明显的数值来,比如我输入1000个要素,那么你别就给我1个数据啊,怎么也得吐出1000个数据来吧,甭管什么莫兰指数,P值Z得分啥的,不能给我省了。所以这里就要用到今天我们说的AnselinLocalMoran's I方法了,而它与GlobeMoran's I的区别,如下:

所以,这种算法比较符合我们做GIS的人的思维,那么这种可视为地理信息强迫症的特效药的Anselin Local Moran's I算法,是哪位大爷提出来的呢,下面进入我们的算法科普时间:

上面这个脑门像土豆神一样明亮的老帅哥,就是ASU(美国亚利桑那州立大学)的地理与规划学院院长Luc Anselin教授,也是Anselin Local Moran'I算法的提出者,所以也就用了他的大名来标示这种算法。

如果做地理分析的,一定听说一个叫做GeoDa的软件,这个软件就是Anselin教授领导的ASU的地理空间分析和计算中心弄出来的神器。后来他的这个中心,就一直被人称为“GeoDa Center”

他在2008年的时候,当选为了美国科学院院士,与中国一样,当选院士被认为是美国学术界最高荣誉之一。

好了,起源介绍完了,下面我们来看看这种算法有些啥神奇的地方。

首先,他还是会计算各种常规的指数,比如Moran's I以及P值Z得分啥的,但是他是针对整份数据中,每一个要素都会去记录一个相应的值,算出来就会变成这个样子:

用中国每个省的GDP进行计算,算完对每一个省都会对应有一系列数据,前面三个就是每个省的Moran's I和Z得分以及P值,这个就不解释了,大家有兴趣去看以前的文章,Anselin Local Moran's I最强大的地方,就是他能够用自己身的数据,与周边的数据进行比较,生成COType这样一个字段。

COType是:聚类/异常值类型的简写(clustering / outlier Type),这个东西是啥东东呢,我们来看下面的解释:

首先,正常情况下,聚类我们认为是这样的:

就是相同的类别会被放到一起。但是我们这个工具不但要计算聚类类型,还要计算的是异常

的类型,何谓异常呢,异常自然就是下面这样的情况:

当然,还有一种情况,就是随机了,如下:

抛开随机不谈,我们谈聚类和异常的话,就会出现4种组合,如下: 而因为在地理空间上,不同的要素之间会出现相邻或者包围这种情况,所以就用了如下这种描述:周围一圈都是低值,围绕一个高值,这种情况被表示为HL,反之,周围都是一圈高值,围绕着一个低值,那么就表示为LH。

这种方式,能够明确的发现空间数据以及参与计算字段值中的一些规律,比如采用2008年的各省GDP进行计算的结果如下:

山东、江苏、浙江出现了明显的高值聚类,也就是说,他们的GDP与空间分布,不但自己的GDP处于高位,且旁边省份的GDP也是在高位。

而全国唯一个高值被低值包围的省,就是广东省,HL的意思是他自身的GDP处于高位,但是在空间分布上,它身边的省份都处于低值的情况。

从这里可以看出,采用AnselinLocal Moran's I能够在更细粒度的范围下,对空间关系进行探索,至于如何使用这个工具,我们下次再说。

待续未完。

白话空间统计十七:聚类和异常值分析

(Anselin Local Moran's I)(下)

空间统计

虾神daxialu(虾神) ? 2015-09-18 23:16

前文再续,书接上一回。

Anselin Local Moran's I作为细粒度的空间统计工具神器,在ArcGIS里面自然也是提供了相应的工具的,这个工具就直接叫做“聚类和异常值分

析”(Cluster and Outlie Analysis

(Anselin Local Morans I))。

在后面的括号里面保留了以老帅哥Anselin教授命名的算法的名称,不管中英文都有,说明了大家和虾神一样,对于研究算法的大神们都有顶礼膜拜的情节。

这一章主要讲讲AnselinLocal Moran’s I算法的原理和工具使用方法。其实一直都忘记了补一章,关于空间数据探索的基础,实际上在讲空间概率标准化的时候就应该写的,可有些时候因为想对照着ArcGIS的空间统计模块来写(关键没有其他的参考书,只能参考这个了,话说Esri这个帮助文档,实在是

空间统计学的入门必看经典啊~),结果不小心就把这个内容给漏掉了……真是尽信书不如无书啊~

这个空间数据探索的基础,就是的空间权重矩阵。如下所示:

好吧……权重矩阵,我们看看看这个空间权重矩阵到底是个啥东东: 左边这个东西,叫做无向图,由边那个,就是所谓的距离矩阵了。因为我们以前说过,在空间分析里面,需要进行空间关系的概念化,所以也通常称为空间权重矩阵。当然这个权重矩阵为了简单明了,所以用的直接就是用最短距离作了矩阵里面的元素,比如B和C的距离,直接通过矩阵可以查询到WBC = 2 。

但是实际上情况可能会更复杂,比如我们以前说过,空间关系概念化一共有7种概念,每种概念都能够变化成相应的权重矩阵。比如最简单的,判断是否相邻的空间权重矩阵,可能就只有两个值,如下:

通过这个空间权重矩阵,很容易的看出各个面要素之间的关系,比如D要素,与A\E\G三个要素有相邻关系。

关于啥是Rook's case的不记得请去看空间统计之五:空间关系的概念化这篇文章,我这里就不复习了。

这个权重矩阵与后面我们要进行的计算,是非常相关的。当然,因为现在的各种工具里面,在计算Anselin Local Moran's I的时候,都会依照你给定的空间关系概念化(也就是所谓的距离计算方式),来生成这个权重矩阵,但是如果不预先生成,使用不同的软件去计算的话,都会出现不同的结果。但是如果你用了同样的权重矩阵的话,计算出来的结果就是一样的。如果说,全局莫兰指数是按照所有的数据配合空间权重矩阵计算出来的一个综合的数值,那么局部莫兰指数的计算方法与全局莫兰指数大致是一样,所不同的是没有了权重矩阵和数据值平均数的聚合计算过程。所以在每一个要素上面都会计算出一个属于自己的莫兰指数。如下:

当然,做为空间相关性的算法,算完之后P值Z得分肯定是跑不掉的,正因为有了莫兰指数和Z值的组合,才会有HH,LL,HL和LH四种可能。他们的具体在四个象限的分布如下:

从上面的分布可以看出,只要Z值得分是正数,就表示了聚类,Z得分是负数,就表示了异常。在Z得分被确定的情况下,才使用莫兰指数来确定不同的性质。

再来看看我们昨天计算出来的那张地图:

然后在看看看数据:

把这个表格通过我们上面列出的象限方式标出来,如下(把Z得分显著性临界值区域以内的

名称都隐藏了):

对比一下上面的表格,发现青海和西藏也出现在了1.65临界值以外,但是确没有被标识出

来,这是为什么呢,来看看他们的其他值,关键看这个值可靠不可靠,所以P值出现了:

好吧,既然他们是不可靠的,自然就被pass掉了,所以,最终的图形,应该是这样的:

最后,贴出数学公式,有数学恐惧症的同学慎入:

浅析空间自相关的内容及意义摘要:本文主要介绍了空间自相关的含义、测度指标及研究空间自相关的意义。首先,明确空间自相关是检验某一要素的属性值是否显著地与其相邻空间点上的属性值相关联的重要指标,揭示空间参考单元与其邻近的空间单元属性特征值之间的相似性或相关性。其次,介绍用来测度空间自相关性的指标,可以分为全局指标和局部指标,常用的指标有:Moran’s I、Geary’s C和Getis-Ord G。最后,进一步阐述了空间自相关的研究意义。关键字:空间自相关;全局指标;局部指标The content and research significance of spatial autocorrelation analysisAbstract: In this paper, the content, the index and the research significance of spatial autocorrelation were analyzed. Firstly, the content of spatial autocorrelation is discussed. Spatial autocorrelation is related to the correlation of the same variables, and also can be used to measure the degree of concentration of the attribute value, in order to reveal the correlation between the space reference unit and its near unit, including global spatial autocorrelation and local spatial autocorrelation. Secondly, it analyzes the index of spatial autocorrelation, the main index included Moran’s I, Geary’s C and Getis-Ord G. Thirdly, this paper discussed the research signification of spatial autocorrelation analysis. Key words: spatial autocorrelation; global index; local index 引言空间

空间自相关分析 1.1 自相关分析 空间自相关分析是指邻近空间区域单位上某变量的同一属性值之间的相关程度,主要用空间自相关系数进行度量并检验区域单位的这一属性值在空间区域上是否具有高高相邻、低低相邻或者高低间错分布,即有无聚集性。若相邻区域间同一属性值表现出相同或相似的相关程度,即属性值在空间区域上呈现高(低)的地方邻近区域也高(低),则称为空间正相关;若相邻区域间同一属性值表现出不同的相关程度,即属性值在空间区域上呈现高(低)的地方邻近区域低(高),则称为空间负相关;若相邻区域间同一属性值不表现任何依赖关系,即呈随机分布,则称为空间不相关。 空间自相关分析分为全局空间自相关分析和局部空间自相关分析,全局自相关分析是从整个研究区域内探测变量在空间分布上的聚集性;局域空间自相关分析是从特定局部区域内探测变量在空间分布上的聚集性,并能够得出具体的聚集类型及聚集区域位置,常用的方法有Moran's I 、Gear's C 、Getis 、Morans 散点图等。 1.1.1 全局空间自相关分析 全局空间自相关分析主要用Moran's I 系数来反映属性变量在整个研究区域范围内的空间聚集程度。首先,全局Moran's I 统计法假定研究对象之间不存在任何空间相关性,然后通过Z-score 得分检验来验证假设是否成立。 Moran's I 系数公式如下: 11 2 11 1 ()()I ()()n n ij i j i j n n n ij i i j i n w x x x x w x x =====--= -∑∑∑∑∑(式 错误!文档中没有指定样式的文字。-1) 其中,n 表示研究对象空间的区域数;i x 表示第i 个区域内的属性值,j x 表示第j 个区域内的属性值,x 表示所研究区域的属性值的平均值;ij w 表示空间权重矩阵,一般为对称矩阵。 Moran's I 的Z-score 得分检验为:

空间自相关的测度指标 1全局空间自相关 全局空间自相关是对属性值在整个区域的空间特征的描述。表示全局空间自相关的指标和方法很多,主要有全局Moran ’sI 、全局Geary ’sC 和全局Getis-OrdG [3,5]都是通过比较邻近空间位置观察值的相似程度来测量全局空间自相关的。 全局Moran ’sI 全局Moran 指数I 的计算公式为: 其中,n 为样本量,即空间位置的个数。x i 、x j 是空间位置i 和j 的观察值,w ij 表示空间位置i 和j 的邻近关系,当i 和j 为邻近的空间位置时,w ij =1;反之,w ij =0。全局Moran 指数I 的取值范围为[-1,1]。 对于Moran 指数,可以用标准化统计量Z 来检验n 个区域是否存在空间自相关关系,Z 的计算公式为: )()(I VAR I E I Z -==i n w n w S x x d w i i i n i j i j ij ≠----∑≠j )2/()1())(( E(I i )和VAR(I i )是其理论期望和理论方差。数学期望EI=-1/(n-1)。 当Z 值为正且显着时,表明存在正的空间自相关,也就是说相似的观测值(高值或低值)趋于空间集聚;当Z 值为负且显着时,表明存在负的空间自相关,相似的观测值趋于分散分布;当Z 值为零时,观测值呈独立随机分布。 全局Geary ’sC 全局Geary ’sC 测量空间自相关的方法与全局Moran ’sI 相似,其分子的交叉乘积项不同,即测量邻近空间位置观察值近似程度的方法不同,其计算公式为: 全局Moran ’sI 的交叉乘积项比较的是邻近空间位置的观察值与均值偏差的乘积,而全局Geary ’sC 比较的是邻近空间位置的观察值之差,由于并不关心x i 是否大于x j ,只关心x i 和x j 之间差异的程度,因此对其取平方值。全局Geary ’sC 的取值范围为[0,2],数学期望恒为1。当全局Geary ’sC 的观察值<1,并且有统计学意义时,提示存在正空间自相关;当全局Geary ’sC 的观察值>1时,存在负空间自相关;全局Geary ’sC 的观察值=1时,无空间自相关。其假设检验的方法同全局Moran ’sI 。值得注意的是,全局Geary ’sC 的数学期望不受空间权重、观察值和样本量的影响,恒为1,导致了全局Geary ’sC 的统计性能比全局Moran ’sI 要差,这可能是全局Moran ’sI 比全局Geary ’sC 应用更加广

重庆各区县乡村人口所占比例的空间自相关分析 选题: 在ArcGIS中分别计算全局Moran’I 指数和局部Moran’I指数,分析重庆各区县乡村人口所占比例的空间关联程度。 实验目的: 根据重庆市各区县之间的邻接关系,采用二进制邻近权重矩阵,选取各区县2008年的重庆各区县的总人口及乡村人口,计算出重庆各区县乡村人口所占的比例,在ArcGIS里面分别计算全局Moran’I 指数和局部Moran’I指数,分析空间关联程度。 实验数据: 1.重庆统计年鉴中2008年重庆市各区县的总人口及乡村人口数量(excel表格) 2.重庆市各区县的矢量图(shp.文件) 软件: ArcGIS10.2 操作过程与结果分析: 第一步:导入Excel数据文件和重庆市各区县的矢量图,并建立关联 1. Catalog——Folder Connections,在对应的文件夹下打开重庆市各区县城镇化率的EXCEL表格及重庆市各区县shp文件

为关联字段,将两个文件关联起来

3.右键单击关联后的重庆区县界shp.文件,导出为Export_Output文件,新文件的属性表如下: 第二步:计算全局Morans I 1.打开ArcToolbox,选择Spatial Statistics Tools——Analying Patterns——Spatial Autocorrelation(Morans I)选择二进制邻接矩阵方法来确定空间权重矩阵(即当区域i和具有公共边或公共点时,两区域的距离矩阵设为1,若不相邻接,其距离矩阵设为0),选择欧式距离作为计算距离的方法,对数据进行标准化处理后计算全局Moran’I指数度量空间自相关

空间自相关得测度指标 1全局空间自相关 全局空间自相关就是对属性值在整个区域得空间特征得描述[8]。表示全局空间自相关得指标与方法很多,主要有全局Moran ’s I 、全局Geary ’s C 与全局Getis-Ord G [3,5]都就是通过比较邻近空间位置观察值得相似程度来测量全局空间自相关得。 全局Moran ’s I 全局Moran 指数I 得计算公式为: ()() ()∑∑∑∑∑=====---=n i n j n i i ij n i n j j i ij x x w x x x x w n I 111211 ∑∑∑∑=≠=≠--=n i n i j ij n i n i j j i ij w S x x x x w 121))(( 其中,n 为样本量,即空间位置得个数。 x i 、x j 就是空间位置i 与j 得观察值,w ij 表示空间位置i 与j 得邻近关系,当i 与j 为邻近得空间位置时,w ij =1;反之,w ij =0。全局Moran 指数I 得取值范围为[-1,1]。 对于Moran 指数,可以用标准化统计量Z 来检验n 个区域就是否存在空间自相关关系,Z 得计算公式为: )()(I VAR I E I Z -==i n w n w S x x d w i i i n i j i j ij ≠----∑≠j )2/()1())(( E(I i )与VAR(I i )就是其理论期望与理论方差。数学期望EI=-1/(n-1)。 当Z 值为正且显著时,表明存在正得空间自相关,也就就是说相似得观测值(高值或低值)趋于空间集聚;当Z 值为负且显著时,表明存在负得空间自相关,相似得观测值趋于分散分布;当Z 值为零时,观测值呈独立随机分布。 全局Geary ’s C 全局Geary ’s C 测量空间自相关得方法与全局Moran ’s I 相似,其分子得

万方数据

万方数据

第6期魏晓峰等:基于AtcGIS的空间自相关分析模块的开发与应用 圈1建立权值矩阵对话枢 F毡.1Thedialogofcreilt吨WdghtMatrix 心。基于多边形邻接方式只对面状图层有效,因为点状图层不存在边相邻的概念。. 用户可以在“保存文件”文本框中选择一个指定路径下的文件夹用以保存所创建的权值矩阵文件,该文件将以文本形式保存。 在基于距离的权值矩阵建立中,为分析不同距离间空间自相关程度,可设鬣不同的距离带,用于找出自相关程度最显著的空间距离,界面设计如图2所示。 图2基于距离的空间权值矩阵建立对话框 Fig.2ThedialogofcreatingWeight Matrix based∞distance 界面分为2个部分,上半部分显示了各对象两两问的相关距离统计信息,用以设置距离带时的参考;下半部分主要用于设置距离带以建立相应的权值矩阵。距离带设置有2种方式。选择“系统方案”时需确定划分等级,系统将根据选择的划分数量自动生成相应的距离带。添加到下方的“距离带”列表框中;选择“自定义”按钮,用户可以手工输入距离带。距离单位均为地图单位。 2,1.2全局空间自相关分析 全局空间自相关分析对话框主要有2个参数:参与计算的权值矩阵和分析字段。权值矩阵可以选择由以上2种方式建立的权值矩阵文件。若分析的是基于距离的方式,则可以添加多个权值矩阵进行分析,以方便比较不同空间距离下的自相关程度(如图3所示)。 2.1.3局部空间自相关分析 局部空间自相关分析对话框与全局空间自相关分析 对话框类似,多了一个可选参数。该对话框设计为只能输入一个权值矩阵文件,其中Ⅲ标识字段用于标识各分析对象。若分析图层的每个对象具有NAME属性,则我们可以用其标识每个对象;若不选择此项,系统默认用数字标识(如图4所示)。 围3全局空间自相关分析对话柱 Fig.3Thedlatogdglobalspatial autocorrelaflonaDltlysi¥ 国4局部空间自相关分析对话框 Fig.4The蛳el'localspatial autocorrelaltonm鼬 2.2模块开发 模块采用ArcObjects组件技术在VB环境下进行开发。ArcObjects(简称AO)是Esm公司开发的一套基于COM技术的面向地理数据模型的大型组件库。AO的开发既可以选择应用程序内嵌的VBA,也可以选择支持COM标准的开发工具。 许多AO对象内建立了基本的数据管理和地图显示等GIS功能。由于AO是基于微软的COM技术构建的,所以,我们可以利用它来搭建出更高级的AO组件,从而开发出更加强大、灵活的应用系统。 利用AO组件开发出来的模块可以实现与ArcCI¥的无缝集成。通过ArcGLS提供的Customize对话框,这些应用模块可以像ArcGIS自身模块一样方便地载人和卸载。3应用实例 3.1分析数据 分析数据取自1980年美国俄亥俄州哥伦比亚区内49个区域统计信息,其中包含各子区域的犯罪率信息,犯 罪率为每千人所含犯罪数。 万方数据

浅析空间自相关的内容及意义 摘要:本文主要介绍了空间自相关的含义、测度指标及研究空间自相关的意义。首先,明确空间自相关是检验某一要素的属性值是否显著地与其相邻空间点上的属性值相关联的重要指标,揭示空间参考单元与其邻近的空间单元属性特征值之间的相似性或相关性。其次,介绍用来测度空间自相关性的指标,可以分为全局指标和局部指标,常用的指标有:Moran’s I、Geary’s C和Getis-Ord G。最后,进一步阐述了空间自相关的研究意义。 关键字:空间自相关;全局指标;局部指标 The content and research significance of spatial autocorrelation analysis Abstract: In this paper, the content, the index and the research significance of spatial autocorrelation were analyzed. Firstly, the content of spatial autocorrelation is discussed. Spatial autocorrelation is related to the correlation of the same variables, and also can be used to measure the degree of concentration of the attribute value, in order to reveal the correlation between the space reference unit and its near unit, including global spatial autocorrelation and local spatial autocorrelation. Secondly, it analyzes the index of spatial autocorrelation, the main index included Moran’s I, Geary’s C and Getis-Ord G. Thirdly, this paper discussed the research signification of spatial autocorrelation analysis. Key words: spatial autocorrelation; global index; local index 0引言 空间自相关是研究空间中某位置的观察值与其相邻位置的观察值是否相关以及相关程度的一种空间数据分析方法[1]。即空间自相关是检验某一要素的属性值是否显著地与其相邻空间点上的属性值相关联的重要指标,可以分为正相关和负相关,正相关表明某单元的属性值变化与其邻近空间单元具有相同变化趋势,负相关则相反[2]。在地学邻域,地统计学数据主要来源于研究对象在空间区域上的抽样,进而分析各种自然现象的空间变异规律和空间格局,并且已被证明是研究空间分异和空间格局的有效方法。 在国外,20 世纪60年代就有学者开始运用空间自相关方法研究生态学、遗传学等问题, 目前已应用于数字图像处理、流行病学、生物学、区域经济与社会

实习序号和题目空间分布模式与空间相关分析 实习人专业及编号 实习目的: 熟悉和掌握 Spatial Statistics Tools里的基本工具,对所给数据进行空间分析。 实习内容: 1.参考文献《多尺度人口增长的空间统计分析》,练习多距离 L(d) 、全局 Moran’ I 与 G*统计量分析,显著性检验的置信区间定义为90%; 2.对 adabg00 数据进行全局与局部的 moran I 与 G统计量分析; 3. 对 deer 数据进行基于距离的最近邻分析与L(d) 分析; 实习数据: 1.省区 .shp :中国各省分布图 2.各省第 5 次和第 6 次人口普查:各省人口普查数据 deer.shp :鹿场点分布图 3.adabg00.shp: 爱达荷州阿达各街区2000 年人口普查数据 基本原理: 空间分布的模式一般来说,有三种,分别是离散、随机、和聚合。离散的概 念就是指观测的每个数据之间的差异程度,离散程度越大,差异性就越大。聚合与离散正好相反,表示在一定区域内的相关程度,就是聚合程度越大,相关性就越大。随机是纯粹的无模式,既不能从随机数据中获取结论,也发现不了规律和模式。 1.零假设( null hypothesis ):指进行统计检验时预先建立的假设。在空间统计中,零假设指的就是空间位置在一定区域里面呈现完全随机(均匀)分布。在检 验结果之前,先对这些结果假设一个数值区间,这个区间一般是符合某种概率分布的情况,如果真实结果偏离了设定的区间,就表示发生了小概率事件。这样原来 的假设就不成立了。

如果计算结果落在-2 到2 之间,就表示假设是可以接受,但是不在这个范围内, 就说明发生小概率事件了。有两种可能: 1,假设有错误; 2,出现了异常值。 2.z 得分( Z scores )表示标准差的倍数 标准差:总体各单位标准值与其平均数离差平方的算术平均数的平方根” 也就是“标准差能反映一个数据集的离散程度” 。比如z 得分是+2.5 ,得到的结果是标准差的正 2.5 倍,表示数据已经高度聚集。反之,如果是 -2.5, 那么就表示标准差的负 2.5 倍,就是高度离散的数据。 置信度:数据落在期望区间的可能性 在统计学中,一个概率样本的置信区间( Confidence interval )是对这个样本的某 个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量 结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度。这个概率 被称为置信水平。置信水平是指总体参数值落在样本统计值某一区内的概率;而置 信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。 3.在空间统计分析中,通过相关分析可以检测两种现象(统计量)的变化是否 存在相关性,若所分析的统计量为不同观察对象的同一属性变量,则称之为自相关。而空间自相关反映的是一个区域单元上的某种地理现象或某一属性值与邻近 区域单元上同一现象或属性值的相关程度,是一种检测与量化从多个标定点中取 样值变异的空间依赖性的空间统计方法。当变量在空间上表现出一定的规律性,即 不是随机分布则存在着空间自相关,空间自相关理论认为彼此之间距离越近的事 物越相像。也就是说,空间自相关是针对同一个属性变量而言的。 4.空间自相关方法按功能大致分为两类:全域型自相关和区域型自相关。全域型自相关的功能在于描述某现象的整体分布状况,判断此现象在空间是否有聚集特性 存在,但其并不能确切得指出聚集在哪些地区,若将全域型不同空间间隔的空间自 相关统计量依序排列,可进一步得到空间自相关系数图,用于分析该现象在空间 上是否有阶层性分布。区域型自相关能够推算出聚集地的范围。 5.最近邻分析 是根据每个要素与其最近邻要素之间的平均距离计算其最近邻指数。最近邻指数 是平均观测距离和平均期望距离之比。如果小于1,则要素呈现空间聚集式;如果 大于1,则要素呈现空间离散模式或竞争模式。最近邻分析并没有考虑到属性特征,只是根据空间位置。 6.Moran ’s I法 高的自相关性代表了空间现象聚集性的存在,空间自相关分析的主要功能在于同时 可以处理数据的区位和属性。全域型 Moran ’s I 计算方式是基于统计学相关系数的协方差关系推算出来的。 I 值一定介于 -1 到 1 之间,大于 0 为正相关,且值越大表 示空间分布的相关性越大,即空间上聚集分布的现象越明显,反之, 值越小代表空间分布相关性小,而当值趋于 0 时,代表此时空间分布呈现随机分布 的情形。若 I 值大于 0 ,说明相邻地区拥有相似的数据属性,属性值高或低的地区都有聚集现象;若 I 小于 0 ,说明相邻地区属性差异大,数据空间分布呈现高地间隔分布的状态;若 I 趋近于 0 ,则相邻空间单元间相关低,某空间现象的高值或低值呈无规律的随机分布状态。若 I 值显著大于 I 的期望值(I值为正值且显著),说明两 点存在相似关系,若 I 值显著小于 I 的期望值(I 值为负值且显著),说明两点存在不相似关系。区域空间自相关值累加之和即全域空间自相关 Moran ’s I 值。

空间统计分析实验报告 一、空间点格局的识别 1、平均最邻近分析 平均最邻近距离指点间最邻近距离均值。该分析方法通过比较计算最邻近点对的平均距离与随机分布模式中最邻近点对的平均距离,来判断其空间格局,分析结果如图1所示。 图1 平均最邻近分析结果图最邻近比率小于1,聚集分布,Z值为-7.007176,P值为0,即这种情况是随机分布的概率为0

计算结果共有5个参数,平均观测距离,预期平均距离,最邻近比率,Z 得分,P值。 P值就是概率值,它表示观测到的空间模式是由某随机过程创建而成的概率,P 值越小,也就是观测到的空间模式是随机空间模式的可能性越小,也就是我们越可以拒绝开始的零假设。最邻近比率值表示要素是否有聚集分布的趋势,对于趋势如何,要根据Z值和P值来判断。 本实验中的最邻近比率小于1 ,聚集分布,Z值为-7.007176,P值为0,即这种情况是随机分布的概率为0,该结果说明省详细居民点的分布是聚集分布的,不存在随机分布。 2、多距离空间聚类分析 基于Ripley's K 函数的多距离空间聚类分析工具是另外一种分析事件点数据的空间模式的方法。该方法不同于此工具集中其他方法(空间自相关和热点分析)的特征是可汇总一定距离围的空间相关性(要素聚类或要素扩散)。 本实验中第一次将距离段数设为10,距离增量设为1,第二次将距离段数设为5,距离增量同样为1,得到如图2和图3所示的结果。 从图中可以看出,小于3千米的距离,观测值大于预测值,居民点聚集,大于3千米,观测值小于预测值,居民点离散。且聚集具有统计意义上的聚集,离散并未具有统计意义上的显著性。 图2 K函数聚类分析结果1

空间自相关 一、发展历程 1.1950年前后,Moran基于生物现象的空间分析将一维空间概念的相关系数推广到二维 空间,从而定义了Moran指数; 2.此后不久,Geary类比于回归分析的Durbin-Watson统计量提出了Geary系数的概念。 于是,空间自相关分析方法雏形形成。在地理学的计量运动期间,空间自相关分析方法被引入地理学领域。 3.此后数十年,经过广大地理学家的努力,特别是Cliff和Ord的有关工作,空间自相关 逐渐发展成为地理空间分析的重要主题之一,另一个突出的主题是Wilson的空间相互作用理论和模型。 4.在Moran指数和Geary系数的基础上,Anselin发展了空间自相关的局部分析方法,Getis 等提出了基于距离统计的空间联系指数。特别是Moran散点图分析方法的创生,代表着空间自相关分析的一个显著进步。 二、基本理论 空间自相关是空间依赖的重要形式,是指研究对象的空间位置之间存在的相关性,也是检验某一要素属性值与其相邻空间要素上的属性值是否相关的重要指标,通常分为全局空间自相关与局部空间自相关两大类。运用空间自相关技术时,首先生成空间权重矩阵,确定各空间单元的权重,再根据各单元的属性信息进行空间自相关分析。 在地理统计学科中应用较多,现已有多种指数可以使用,但最主要的有两种指数,即Moran的I指数和Geary的C指数。在统计上,透过相关分析(correlation analysis)可以检测两种现象(统计量)的变化是否存在相关性,例如:稻米的产量,往往与其所处的土壤肥沃程度相关。如果这个分析统计量是不同观察对象的同一属性变量,就称之为「自相关」(autocorrelation)。因此,所谓的空间自相关(spatial autocorrelation)就是研究「空间中,某空间单元与其周围单元间,就某种特征值,透过统计方法,进行空间自相关性程度的计算,以分析这些空间单元在空间上分布现象的特性」。 基于自相关分析法的基本原理,若某一变量在空间上不属于随机分布,呈现一定的规律性,那么该变量就存在空间自相关。局部自相关可以用来测算区域内地理单元产业集聚与扩散状态、分析区域经济集聚区具体地理分布,符合产业集群在空间聚集方面的条件及功能区域划定的思路。 三、理论模型重构 (一)空间权重矩阵:确定采用邻接规则和距离规则2种; (二)全局空间自相关分析: 全局空间自相关主要探索属性数据值在整个区域的空间分布特征,通过对Global Moran’s I值的全局空间自相关统计量的计算,分析区域总体的空间关联度和空间差异程度,计算公式如下:

重点生态功能区域土地利用结构特征研究 ——以万安县为例1研究意义 论文研究区域万安县属于重点生态功能区,针对这一主体功能定位,研究其土地利用现状、结构特征,诊断存在的问题,探讨推进形成主体功能区的合理土地利用方式,将有助于土地资源更好地保护与节约、集约利用,同时为进一步厘清重点生态功能区土地利用特征及方向提供可供参考的案例,因而本论文的研究具有极其重要的理论意义和实践价值。 2国内外研究现状及问题 虽然国内外不同学者从不同角度对土地利用结构的理论、方法进行了研究,在相关研究理论和方法方面均取得了很大的突破。但大多数学者对土地利用结构特征研究主要集中在全国、省级、市和地区级以及城市等几个区域尺度层次,县级尺度研究成果相对较少,并且国家重点生态功能区是最近才提出的概念,所以在这方面的研究更少。近年来,随着3S技术的不断革新,为区域土地利用结构特征的定量研究提供了很好的借鉴。但是土地利用结构是一个复杂的人工耦合系统,其形成过程不仅受到自然因素的影响,在很大程度上还受到各种人文因素的影响。因此,不能仅以某一种手段、方法对复杂区域的土地利用结构特征进行研究,而应从区域的土地利用数量结构特征、空间结构特征以及影响因素出发,结合一定的计量地理模型和数量统计分析方法对其进行综合研究,总结出区域土地利用结构特征的研究方法和技术体系。 3研究思路 本文以重点生态功能区万安县为例,基于该县2012年的土地利用变更数据、土地利用现状图及其相关社会经济统计数据,建立以行政村为研究单元的土地利用数据库,在此基础上,首先运用数据分析、统计分析等定量工具考察就万安县土地利用结构的基本特征,结合ArcGIS等空间分析工具,SPSS、DEA等数据处理软件,剖析万安县土地利用的数量结构特征、空间结构特征及其成因。主要内容如下: (1)绪论 介绍论文所研究问题的背景、目的和意义,简要地叙述国内外相关领域的研究概况,并概括论文的主要研究内容、技术路线、研究方法和数据来源等。对土地利用、土地利用分类与类型以及土地利用结构等相关概念进行界定。 (2)研究区概况

空间分析的概念空间分析:是基于地理对象的位置和形态特征的空间数据分析技术,其目的在于提取和传输空间信息。包括空间数据操作、空间数据分析、空间统计分析、空间建模。 空间数据的类型空间点数据、空间线数据、空间面数据、地统计数据 属性数据的类型名义量、次序量、间隔量、比率量 属性:与空间数据库中一个独立对象(记录)关联的数据项。属性已成为描述一个位置任何可记录特征或性质的术语。 空间统计分析陷阱1)空间自相关:“地理学第一定律”—任何事物都是空间相关的,距离近的空间相关性大。空间自相关破坏了经典统计当中的样本独立性假设。避免空间自相关所用的方法称为空间回归模型。2)可变面元问题MAUP:随面积单元定义的不同而变化的问题,就是可变面元问题。其类型分为:①尺度效应:当空间数据经聚合而改变其单元面积的大小、形状和方向时,分析结果也随之变化的现象。②区划效应:给定尺度下不同的单元组合方式导致分析结果产生变化的现象。3)边界效应:边界效应指分析中由于实体向一个或多个边界近似时出现的误差。 生态谬误在同一粒度或聚合水平上,由于聚合方式的不同或划区方案的不同导致的分析结果的变化。(给定尺度下不同的单元组合方式) 空间数据的性质空间数据与一般的属性数据相比具有特殊的性质如空间相关性,空间异质性,以及有尺度变化等引起的MAUP效应等。一阶效应:大尺度的趋势,描述某个参数的总体变化性;二阶效应:局部效应,描述空间上邻近位置上的数值相互趋同的倾向。 空间依赖性:空间上距离相近的地理事物的相似性比距离远的事物的相似性大。 空间异质性:也叫空间非稳定性,意味着功能形式和参数在所研究的区域的不同地方是不一样的,但是在区域的局部,其变化是一致的。 ESDA是在一组数据中寻求重要信息的过程,利用EDA技术,分析人员无须借助于先验理论或假设,直接探索隐藏在数据中的关系、模式和趋势等,获得对问题的理解和相关知识。 常见EDA方法:直方图、茎叶图、箱线图、散点图、平行坐标图 主题地图的数据分类问题等间隔分类;分位数分类:自然分割分类。 空间点模式:根据地理实体或者时间的空间位置研究其分布模式的方法。 茎叶图:单变量、小数据集数据分布的图示方法。 优点是容易制作,让阅览者能很快抓住变量分布形状。缺点是无法指定图形组距,对大型资料不适用。茎叶图制作方法:①选择适当的数字为茎,通常是起首数字,茎之间的间距相等;②每列标出所有可能叶的数字,叶子按数值大小依次排列;③由第一行数据,在对应的茎之列,顺序记录茎后的一位数字为叶,直到最后一行数据,需排列整齐(叶之间的间隔相等)。 箱线图&五数总结 箱线图也称箱须图需要五个数,称为五数总结:①最小值②下四分位数:Q1③中位数④上四分位数:Q3⑤最大值。分位数差:IQR = Q3 - Q1 3密度估计是一个随机变量概率密度函数的非参数方法。 应用不同带宽生成的100个服从正态分布随机数的核密度估计。 空间点模式:一般来说,点模式分析可以用来描述任何类型的事件数据。因为每一事件都可以抽象化为空间上的一个位置点。 空间模式的三种基本分布:1)随机分布:任何一点在任何一个位置发生的概率相同,某点的存在不影响其它点的分布。又称泊松分布 2)均匀分布:个体间保持一定的距离,每一个点尽量地远离其周围的邻近点。在单位(样方)中个体出现与不出现的概率完全或几乎相等。

空间自相关统计量 集团文件版本号:(M928-T898-M248-WU2669-I2896-DQ586-M1988)

空间自相关的测度指标 1全局空间自相关 全局空间自相关是对属性值在整个区域的空间特征的描述[8]。表示全局空间自相关的指标和方法很多,主要有全局Moran ’s I 、全局 Geary ’s C 和全局Getis-Ord G [3,5]都是通过比较邻近空间位置观察值的相似程度来测量全局空间自相关的。 全局Moran ’s I 全局Moran 指数I 的计算公式为: 其中,n 为样本量,即空间位置的个数。 x i 、x j 是空间位置i 和j 的观察值,w ij 表示空间位置i 和j 的邻近关系,当i 和j 为邻近的空间位置时,w ij =1;反之,w ij =0。全局Moran 指数I 的取值范围为[-1,1]。 对于Moran 指数,可以用标准化统计量Z 来检验n 个区域是否存在空间自相关关系,Z 的计算公式为: )()(I VAR I E I Z -==i n w n w S x x d w i i i n i j i j ij ≠----∑≠j )2/()1())(( E(I i )和VAR(I i )是其理论期望和理论方差。数学期望EI=-1/(n-1)。 当Z 值为正且显着时,表明存在正的空间自相关,也就是说相似的观测值(高值或低值)趋于空间集聚;当Z 值为负且显着时,表明存在负的空间自相关,相似的观测值趋于分散分布;当Z 值为零时,观测值呈独立随机分布。 全局Geary ’s C

全局Geary’s C测量空间自相关的方法与全局Moran’s I相似,其分子的交叉乘积项不同,即测量邻近空间位置观察值近似程度的方法不同,其计算公式为: 全局Moran’s I的交叉乘积项比较的是邻近空间位置的观察值与均值偏差的乘积,而全局Geary’s C比较的是邻近空间位置的观察值之差,由于并不关心x i是否大于x j,只关心x i和x j之间差异的程度,因此对其取平方值。全局Geary’s C的取值范围为[0,2],数学期望恒为1。当全局Geary’s C的观察值<1,并且有统计学意义时,提示存在正 空间自相关;当全局Geary’s C的观察值>1时,存在负空间自相关;全局Geary’s C的观察值=1时,无空间自相关。其假设检验的方法同全局Moran’s I。值得注意的是,全局Geary’s C的数学期望不受空间权重、观察值和样本量的影响,恒为1,导致了全局Geary’s C的统计性能比全局Moran’s I要差,这可能是全局Moran’s I比全局Geary’s C应用更加广泛的原因。 全局Geti-Ord G 全局Getis-Ord G与全局Moran’s I和全局Geary’s C测量空间自相关的方法相似,其分子的交叉乘积项不同,即测量邻近空间位置观察 值近似程度的方法不同,其计算公式为: 全局Getis-Ord G直接采用邻近空间位置的观察值之积来测量其近似程度,与全局Moran’s I和全局Geary’s C不同的是,全局Getis-Ord G定义空间邻近的方法只能是距离权重矩阵w ij(d),是通过距离d定义的,认为在距离d内的空间位置是邻近的,如果空间位置j在空间位置i

空間自相關聚集分析1 陳慈仁、林峰田、何燦群 一、概述 在統計上,透過相關分析(correlation analysis)可以檢測兩種現象(統計量)的變化是否存在相關性,例如:稻米的產量,往往與其所處的土壤肥沃程度相關。若其分析之統計量係為不同觀察對象之同一屬性變量,則稱之為「自相關」(autocorrelation)。是故,所謂的空間自相關(spatial autocorrelation)乃是研究「空間中,某空間單元與其周圍單元間,就某種特徵值,透過統計方法,進行空間自相關性程度的計算,以分析這些空間單元在空間上分佈現象的特性」。 計算空間自相關的方法有許多種,然最為知名也最為常用的有:Moran’s I、Geary’s C、Getis、Join count等等。但這些方法各有其功用,同時亦有其適用範疇與限制,當然自有其優缺點。一般來說,方法在功用上可大致分為兩大類:一為全域型(Global Spatial Autocorrelation),另一則為區域型(Local Spatial Autocorrelation)兩種。 全域型的功能在於描述某現象的整體分佈狀況,判斷此現象在空間是否有聚集特性存在,但其並不能確切地指出聚集在哪些地區。且若將全域型不同的空間間隔(spatial lag)的空間自相關統計量依序排列,還可進一步作空間自相關係數圖(spatial autocorrelation coefficient correlogram),分析該現象在空間上是否有階層性分佈。而依據Anselin(1995)提出LISA(Local Indicators of Spatial Association)方法論說法,區域型之所以能夠推算出聚集地(spatial hot spot)的範圍,主要有兩種:一是藉由統計顯著性檢定的方法,檢定聚集空間單元相對於整體研究範圍而言,其空間自相關是否夠顯著,若顯著性大,即是該現象空間聚集的地區,如:Getis和Ord(1992)發展的Getis統計方法;另外,則是度量空間單元對整個研究範圍空間自相關的影響程度,影響程度大的往往是區域內的「特例」(outliers),也就表示這些「特例」點往往是空間現象的聚集點,例如:Anselin’s Moran Scatterplot。 在許多研究案例中,Moran’s I 和Getis是最被經常使用的方法。下文將分別介紹之。 1改寫自「陳慈仁(2001) 台北市資訊軟體業與網際網路服務業區位分佈之研究(第三章)」 國立台灣大學建築城鄉研究所碩士論文。

ArcGIS教程:检查空间自相关和方向变化听语音 ?浏览:1791 ?| ?更新:2014-12-08 12:28 ?| ?标签:教程 通过探索数据,您将能够更好地了解测量值之间的空间自相关。这种了解有助于在选择空间预测模型时做出更好的决策。 工具/原料 ?计算机 ?ArcGIS 方法/步骤 1.空间自相关 可通过检查不同的采样位置对来探索数据的空间自相关。通过测量两个位置间的距离并绘制这些位置上的值之间的差值平方,可创建半变异函数云。x 轴表示各位置间的距离,y 轴表示这些位置上的值的差值平方。半变异函数中的每个点都表示一个位置对,而不是地图上的单个位置。 如果存在空间相关性,则距离较近的点对(在x 轴的最左侧)应具有较小的差值(在y 轴上的值较小)。随着各个点之间的距离越来越大(点在x 轴上向右移动),通常,差值的平方也应随之增大(在y 轴上向上移动)。通常,平方差超过某个距离后就会保持不变。超过这个距离的位置对被视为不相关。

地统计方法的基本假设是,对于任意两个彼此间的距离和方向都相近的位置,其差值的平方也应相近。这种关系称为平稳性。 空间自相关可能仅依赖于两个位置之间的距离,这被称为各向同性。不过,考虑不同的方向时,对于不同的距离,可能出现相同的自相关值。其另一种理解是,对于较长的距离,事物在某些方向上比在其他方向上更相似。半变异函数和协方差中都存在这种方向性影响,它被称为各向异性。 查找各向异性很重要,这是因为如果在自相关中检测到方向上的差异,就可以在半变异函数或协方差模型中考虑这些差异。这反过来又会对地统计预测产生影响。 2.利用“半变异函数/协方差云”工具探索空间结构 半变异函数/协方差云工具可用于研究数据集的自相关。接下来,让我们考虑一下臭氧数据集。注意:在下图中,您可以选择相隔一定距离的所有位置对,方法是在半变异函数云中擦除在那个距离上的所有点。

实习序号和题目空间分布模式与空间相关分析专业及编号实习人

实习目的:Spatial Statistics Tools熟悉和掌握里的基本工具,对所给数据进行空间分析。 实习内容: 1.参考文献《多尺度人口增长的空间统计分析》,练习多距离L(d) 、全局Moran' I 与G*统计量分析,显著性检验的置信区间定义为90%; 2.对adabg00 数据进行全局与局部的moran I 与G统计量分析;分析;L(d) deer 数据进行基于距离的最近邻分析与 3. 对 实习数据::中国各省分布图1.省区 .shp 5 次和第 6 次人口普查:各省人口普查数据各省第2. deer.shp :鹿场点分布图爱达荷州阿达各街区3.adabg00.shp: 年人口普查数据2000 基本原理:空间分布的模式一般来说,有三种,分别是离散、随机、和聚合。离散的概聚合离散程度越大,差异性就越大。念就是指观测的每个数据之间的差异程度,表示在一定区域内的相关程度,与离散正好相反,相关性就就是聚合程度

越大,既不能从随机数据中获取结论,越大。随机是纯粹的无模式,也发现不了规律和模式。 ):指进行统计检验时预先建立的假设。在空间统 计null hypothesis 1.零假设(中,零假设指的 就是空间位置在一定区域里面呈现完全随机(均匀)分布。在检 这个区间一般是符合某种概率分布验结果之前,先对这些结果假设一个数值区间, 这样原来的情况,如果真实结果偏离了设定的区间,就表示发生了小概率事件。的假设就不成立了。

如果计算结果落在-2 到 2 之间,就表示假设是可以接受,但是不在这个范围内,就说明发生小概率事件了。有两种可能:1,假设有错误;2,出现了异常值。2.z 得分(Z scores )表示标准差

一、空间自相关 <一>权重 计算权重的方法有很多种~ ARC/NOF 可以自动生成拓扑关系,可以自动生成多边形地图的连接矩阵(空间权重矩阵的生成方法分析与实验①) 倒数法 1 二进制矩阵算法 2 3

<二>全局空间自相关还有多种表现方式 二 通过建设中的散点图中的直线的斜率等于莫兰的I系数(全局空间自相关)。 <三>局部空间自相关何谓属性值标准化形式

1局部自相关系数专题图2局部自相关聚类分析图 如何转换 转换方法~

图的右上方的第1象限,表示高集聚增长的地区被高集聚的其他地区所包围(HH),代表正的空间自相关关系的集群;左上方的第2象限,表示低集聚增长的地区被高集聚增长的其他地区所包围(LH),代表负的空间自相关关系的集群;左下方的第3象限,表示低集聚增长的地区被低集聚增长的其他地区所包围(LL),代表正的空间自相关关系的集群;右下方的第4象限,表示高集聚增长的地区被低集聚增长的其他地区所包围(HL),代表负的空间自相关关系的集群。第1、第3象限正的空间自相关关系揭示了区域的集聚和相似性,而第2、第4象限负的空间自相关关系揭示区域的异质性。如果观测值均匀地分布在4个象限则表明地区之间不存在空间自相关性。 邻近值的加权平均值为Y轴!!!!! 二空间操作 <一>普通的空间操作 包括:放大、缩小、全幅显示、漫游、自由缩放、鹰眼 <二>地图信息的多风格显示 直方图 分级图

<三>数据操作 数据编辑(主要是针对属性表,包括删除、修改、新数据的生成) 数据导出:选定一定区域(用不同的工具,多边形,圆,折线等)导出对应区域的属性表。 空间关联分析平台 必胜!!! 关于全局聚类系数的算法

相关主题
文本预览
相关文档 最新文档