GIS算法基础lecture4_空间自相关
- 格式:ppt
- 大小:854.50 KB
- 文档页数:40
空间局部自相关测度及ArcGIS中的实现空间自相关是用来测度地利实体的空间分布状况的,具体而言,就是看看它们是有规律的(集聚式或是间隔式),还是随机的(就像在方盘里随意投下一把细针)。
这里说的局部自相关,就是可以用来测度以每个地理单元为中心的一小片区域的聚集或离散效应。
理论上解释起来,的确有点枯燥。
倘若换一个视角,利用我们学习过的经济地理的知识来关联的看,就比较容易些。
若将城、镇、村都看作这样的空间单元,那么这种局部自相关的测度就可以判别出以城市为中心的这片区域内,城市对于农村的经济总量或劳动力是呈离心带动效应还是向心吸引作用,即区域上的发展是均衡式的,还是极化型的。
最常用的局部自相关的测度指数为Local Moran I,它是由全局自相关指数Moran I发展而来的。
(关于Moran I的公式与含义,图书馆里有若干本书提到,譬如北大邬伦的那本、黄皮的城市地理信息系统、还有邬建国写的那本景观书:其实质就是在时间序列的自相关系数上,也就是对不同时间的变量数值所做的相关系数上,添加了对空间邻接矩阵的考虑)。
所有Local Moran I之和即为Moran I。
I的值从1到-1之变化,反映了由空间相邻相似的正相关向空间相邻相异的负相关的过渡。
关于理论,就是收住。
主要讲讲实现步骤。
A rcGIS9加强了其ArcToolBox的空间统计分析功能,一下子多出了好多的内容。
由ArcGIS Desktop进入,选择toolbox,最后一类菜单功能即为spatial statistics,其中分有诸多子功能。
这里要用的Local Moran I,为第二类中的第一项,即mapping cluster里的Cluster and Outlier Analysis (Anselin Local Morans I)。
下面要做的是一些填空,input feature class打开你所需要研究的图层。
input field是你所需要研究的属性列。
空间局部自相关测度及ArcGIS中的实现空间自相关是用来测度地利实体的空间分布状况的,具体而言,就是看看它们是有规律的(集聚式或是间隔式),还是随机的(就像在方盘里随意投下一把细针)。
这里说的局部自相关,就是可以用来测度以每个地理单元为中心的一小片区域的聚集或离散效应。
理论上解释起来,的确有点枯燥。
倘若换一个视角,利用我们学习过的经济地理的知识来关联的看,就比较容易些。
若将城、镇、村都看作这样的空间单元,那么这种局部自相关的测度就可以判别出以城市为中心的这片区域内,城市对于农村的经济总量或劳动力是呈离心带动效应还是向心吸引作用,即区域上的发展是均衡式的,还是极化型的。
最常用的局部自相关的测度指数为Local Moran I,它是由全局自相关指数Moran I发展而来的。
(关于Moran I的公式与含义,图书馆里有若干本书提到,譬如北大邬伦的那本、黄皮的城市地理信息系统、还有邬建国写的那本景观书:其实质就是在时间序列的自相关系数上,也就是对不同时间的变量数值所做的相关系数上,添加了对空间邻接矩阵的考虑)。
所有Local Moran I之和即为Moran I。
I的值从1到-1之变化,反映了由空间相邻相似的正相关向空间相邻相异的负相关的过渡。
关于理论,就是收住。
主要讲讲实现步骤。
A rcGIS9加强了其ArcToolBox的空间统计分析功能,一下子多出了好多的内容。
由ArcGIS Desktop进入,选择toolbox,最后一类菜单功能即为spatial statistics,其中分有诸多子功能。
这里要用的Local Moran I,为第二类中的第一项,即mapping cluster里的Cluster and Outlier Analysis (Anselin Local Morans I)。
下面要做的是一些填空,input feature class打开你所需要研究的图层。
input field是你所需要研究的属性列。
空间自相关统计量空间自相关的测度指标1全局空间自相关全局空间自相关是对属性值在整个区域的空间特征的描述[8]。
表示全局空间自相关的指标和方法很多,主要有全局Moran ’s I 、全局Geary ’s C 和全局Getis-Ord G [3,5]都是通过比较邻近空间位置观察值的相似程度来测量全局空间自相关的。
全局Moran ’s I全局Moran 指数I 的计算公式为:()()()∑∑∑∑∑=====---=n i n j n i iij n i n j j i ij x x w x x x x w n I 111211∑∑∑∑=≠=≠--=n i n i j ij n i n i j j i ij w S x x x x w 121))((其中,n 为样本量,即空间位置的个数。
x i 、x j 是空间位置i 和j 的观察值,w ij 表示空间位置i 和j 的邻近关系,当i 和j 为邻近的空间位置时,w ij =1;反之,w ij =0。
全局Moran 指数I 的取值范围为[-1,1]。
对于Moran 指数,可以用标准化统计量Z 来检验n 个区域是否存在空间自相关关系,Z 的计算公式为:)()(I VAR I E I Z -==in w n w S x x d w i i i n i j i j ij≠----∑≠j )2/()1())((E(I i )和VAR(I i )是其理论期望和理论方差。
数学期望EI=-1/(n-1)。
当Z 值为正且显著时,表明存在正的空间自相关,也就是说相似的观测值(高值或低值)Z 关,相似的观测值趋于分散分布;当Z 值为零时,观测值呈独立随机分布。
全局Geary ’s C全局Geary ’s C 测量空间自相关的方法与全局Moran ’s I 相似,其分子的交叉乘积项不同,即测量邻近空间位置观察值近似程度的方法不同,其计算公式为:()()()∑∑∑∑∑=====---=n i n j n i i ij n i n j j i ij x x w x x w n C 111211221差的乘积,而全局Geary ’s C 比较的是邻近空间位置的观察值之差,由于并不关心x i 是否大于x j ,只关心x i 和x j 之间差异的程度,因此对其取平方值。
空间自相关分析1.1 自相关分析空间自相关分析是指邻近空间区域单位上某变量的同一属性值之间的相关程度,主要用空间自相关系数进行度量并检验区域单位的这一属性值在空间区域上是否具有高高相邻、低低相邻或者高低间错分布,即有无聚集性。
若相邻区域间同一属性值表现出相同或相似的相关程度,即属性值在空间区域上呈现高(低)的地方邻近区域也高(低),则称为空间正相关;若相邻区域间同一属性值表现出不同的相关程度,即属性值在空间区域上呈现高(低)的地方邻近区域低(高),则称为空间负相关;若相邻区域间同一属性值不表现任何依赖关系,即呈随机分布,则称为空间不相关。
空间自相关分析分为全局空间自相关分析和局部空间自相关分析,全局自相关分析是从整个研究区域内探测变量在空间分布上的聚集性;局域空间自相关分析是从特定局部区域内探测变量在空间分布上的聚集性,并能够得出具体的聚集类型及聚集区域位置,常用的方法有Moran's I 、Gear's C 、Getis 、Morans 散点图等。
1.1.1 全局空间自相关分析全局空间自相关分析主要用Moran's I 系数来反映属性变量在整个研究区域范围内的空间聚集程度。
首先,全局Moran's I 统计法假定研究对象之间不存在任何空间相关性,然后通过Z-score 得分检验来验证假设是否成立。
Moran's I 系数公式如下:112111()()I ()()n nij i j i j n nnij i i j i n w x x x x w x x =====--=-∑∑∑∑∑(式 错误!文档中没有指定样式的文字。
-1)其中,n 表示研究对象空间的区域数;i x 表示第i 个区域内的属性值,j x 表示第j 个区域内的属性值,x 表示所研究区域的属性值的平均值;ij w 表示空间权重矩阵,一般为对称矩阵。
Moran's I 的Z-score 得分检验为:Z =式 错误!文档中没有指定样式的文字。
地理信息系统中的空间分析算法地理信息系统(Geographic Information System,GIS)是一种将地理空间信息与数据库技术相结合的信息系统。
GIS 可以将地理空间信息进行存储、管理、处理、分析、查询与表达,帮助我们更好地理解地理现象,从而更好地进行空间规划和决策。
GIS的其中一个重要组成部分就是空间分析算法,通过空间分析算法,我们可以对空间数据进行统计、分析与挖掘,提取出空间数据中的特征和规律,进一步支持市政管理、环保监测、自然资源管理、交通规划等领域的工作。
本篇文章将探讨一些常用的空间分析算法。
一、空间统计分析空间统计分析通常是通过 GIS 软件中的空间分析工具或 R 语言中的 spatial 统计包来实现的,目的是通过建模、统计和分析空间数据集,了解数据的分布规律及其空间自相关性,进而挖掘数据中的潜在信息。
在空间统计分析中,空间自相关性是重要的概念之一。
空间自相关性指的是空间邻近地区的相似性。
其通常用半方差函数(Semi-Variogram)来描述。
半方差函数对于空间数据的变异属性及其自相关情况进行了刻画。
空间统计分析通常包括以下步骤:1. 数据预处理:对原始数据进行清理、去除异常值,将其转换为空间数据集。
2. 空间数据可视化:通过 GIS 软件中的空间图表和地图进行可视化展示,直观了解数据的分布情况。
3. 空间自相关性检验:通过计算半方差函数、空间权重矩阵及空间自相关指数等进行检验,判断空间数据的自相关性。
其中,空间权重矩阵通常包括近邻、距离加权、kernel 加权等。
4. 模型拟合:选择合适的空间统计模型,使用最小二乘法等拟合方法来求解模型参数。
5. 空间插值:对于未知位置的点,通过空间插值方法来估算其值。
空间插值方法包括IDW 方法、Kriging 方法、样条插值法等。
二、空间数据挖掘空间数据挖掘是指对空间数据集进行关联规则、分类、聚类、预测等操作,发现空间数据中的模式和规律,进而支持决策和规划。
利用ARCGIS进行空间统计分析空间统计分析是利用GIS(地理信息系统)软件进行的一种分析方法,可以帮助我们理解和解释地理数据的空间模式和关联性。
ARCGIS是一款功能强大的GIS软件,在进行空间统计分析方面有着广泛的应用。
ARCGIS提供了多种空间统计分析的工具和函数,如空间自相关、聚类分析、热点分析、插值分析等。
下面将分别介绍这些分析方法的应用。
一、空间自相关空间自相关分析用于研究地理数据的空间相关性。
通过计算地理单位之间的空间相关性指数,可以帮助我们发现和理解空间数据的空间分布模式。
ARCGIS提供了Moran's I指数和Geary's C指数等空间自相关分析方法。
Moran’s I指数是一种常用的空间自相关指数,用于测量地理单位之间的空间相关性。
通过计算每个地理单位与其邻近单位之间的相似性,并与总体平均值进行比较,得出Moran's I指数的值。
该值介于-1和1之间,正值表示正相关,负值表示负相关,0表示无相关。
通过观察Moran’s I指数的空间模式图和Z分布图,我们可以确定地理数据的空间分布模式(聚集、随机或分离)。
Geary's C指数与Moran’s I指数类似,用于测量地理单位之间的空间相关性。
计算方法也类似,通过比较每个地理单位与其邻近单位之间的相似性,得出Geary's C指数的值。
Geary's C指数的值介于0和2之间,接近0表示正相关,接近2表示负相关,1表示无相关。
二、聚类分析聚类分析用于发现地理数据的空间聚集模式。
通过计算地理单位之间的相似性,将相似的单位聚集在一起,形成空间聚类区域。
ARCGIS提供了多种聚类分析方法,如基于密度的聚类和基于距离的聚类。
基于密度的聚类方法将地理单位划分为多个密度相似的集群,形成高密度区域和低密度区域。
这种方法适用于研究人口和资源分布的热点区域。
基于距离的聚类方法将地理单位划分为多个距离相似的集群,形成邻近区域和远离区域。
一、实验背景空间自相关分析是地理信息系统(GIS)和遥感领域中常用的数据分析方法,主要用于研究地理现象的空间分布规律。
通过分析地理现象的空间自相关性,可以揭示地理现象的分布模式、空间集聚性以及空间变异等特征。
本实验旨在通过空间自相关分析,探究某一地理现象的空间分布规律。
二、实验目的1. 理解空间自相关分析的基本原理和方法;2. 掌握使用GIS软件进行空间自相关分析的操作流程;3. 分析地理现象的空间分布规律,为地理决策提供科学依据。
三、实验材料1. 实验数据:某地区土地利用类型数据(如土地利用类型图、植被覆盖度等);2. GIS软件:ArcGIS、GRASS、QGIS等;3. 空间自相关分析工具:Moran's I、Getis-Ord Gi等。
四、实验步骤1. 数据预处理(1)收集实验数据,包括地理现象的空间数据和属性数据;(2)对空间数据进行预处理,包括坐标转换、投影变换、数据清洗等;(3)对属性数据进行预处理,包括缺失值处理、异常值处理等。
2. 空间自相关分析(1)使用GIS软件中的空间自相关分析工具,如Moran's I、Getis-Ord Gi等,对地理现象的空间分布进行自相关分析;(2)根据分析结果,绘制自相关图,观察地理现象的空间集聚性;(3)对自相关图进行解读,分析地理现象的空间分布规律。
3. 结果分析(1)分析Moran's I值,判断地理现象的空间集聚性,Moran's I值大于0表示正向自相关,小于0表示负向自相关,等于0表示无自相关;(2)分析Getis-Ord Gi值,判断地理现象的空间集聚性,Gi值大于0表示高值集聚,小于0表示低值集聚;(3)结合地理背景知识,对分析结果进行解读,揭示地理现象的空间分布规律。
五、实验结果1. 数据预处理本实验使用某地区土地利用类型数据,经过坐标转换、投影变换、数据清洗等预处理后,得到可用于空间自相关分析的数据。
虾神daxialu(虾神) · 2015-11-18 07:38 J. Keith Ord提出,就是下面的两位老帅哥:
如下图:
三种情况的概率,就如下所示:(有数学恐惧症的同学请略过)
通过Moran's I方法技术出来的结果如下:
下面是通过Join Count方法进行计算的结果:
空间统计
虾神daxialu(虾神) · 2015-09-15 17:41
为我们玩GIS的人,最喜欢的就是出一张花花绿绿的地图,比如这样的:
而它与GlobeMoran's I的区别,如下:
的类型,何谓异常呢?异常自然就是下面这样的情况:
抛开随机不谈,我们谈聚类和异常的话,就会出现4种组合,如下:
虾神daxialu(虾神) · 2015-09-18 23:16
好吧……权重矩阵,我们看看看这个空间权重矩阵到底是个啥东东:
只有两个值,如下:
下:
再来看看我们昨天计算出来的那张地图:
把这个表格通过我们上面列出的象限方式标出来,如下(把Z得分显著性临界值区域以内的名称都隐藏了):
来,这是为什么呢?来看看他们的其他值,关键看这个值可靠不可靠,所以P值出现了:
最后,贴出数学公式,有数学恐惧症的同学慎入:。
ArcGIS教程:检查空间自相关和方向变化听语音∙浏览:1791∙|∙更新:2014-12-08 12:28∙|∙标签:教程通过探索数据,您将能够更好地了解测量值之间的空间自相关。
这种了解有助于在选择空间预测模型时做出更好的决策。
工具/原料∙计算机∙ArcGIS方法/步骤1.空间自相关可通过检查不同的采样位置对来探索数据的空间自相关。
通过测量两个位置间的距离并绘制这些位置上的值之间的差值平方,可创建半变异函数云。
x 轴表示各位置间的距离,y 轴表示这些位置上的值的差值平方。
半变异函数中的每个点都表示一个位置对,而不是地图上的单个位置。
如果存在空间相关性,则距离较近的点对(在x 轴的最左侧)应具有较小的差值(在y 轴上的值较小)。
随着各个点之间的距离越来越大(点在x 轴上向右移动),通常,差值的平方也应随之增大(在y 轴上向上移动)。
通常,平方差超过某个距离后就会保持不变。
超过这个距离的位置对被视为不相关。
地统计方法的基本假设是,对于任意两个彼此间的距离和方向都相近的位置,其差值的平方也应相近。
这种关系称为平稳性。
空间自相关可能仅依赖于两个位置之间的距离,这被称为各向同性。
不过,考虑不同的方向时,对于不同的距离,可能出现相同的自相关值。
其另一种理解是,对于较长的距离,事物在某些方向上比在其他方向上更相似。
半变异函数和协方差中都存在这种方向性影响,它被称为各向异性。
查找各向异性很重要,这是因为如果在自相关中检测到方向上的差异,就可以在半变异函数或协方差模型中考虑这些差异。
这反过来又会对地统计预测产生影响。
2.利用“半变异函数/协方差云”工具探索空间结构半变异函数/协方差云工具可用于研究数据集的自相关。
接下来,让我们考虑一下臭氧数据集。
注意:在下图中,您可以选择相隔一定距离的所有位置对,方法是在半变异函数云中擦除在那个距离上的所有点。
3.利用“半变异函数/协方差云”工具查找方向影响在前面的示例中,使用了“半变异函数/协方差云”工具来查看数据的全局自相关。
虾神daxialu(虾神) · 2015-11-18 07:38 J. Keith Ord提出,就是下面的两位老帅哥:
如下图:
三种情况的概率,就如下所示:(有数学恐惧症的同学请略过)
通过Moran's I方法技术出来的结果如下:
下面是通过Join Count方法进行计算的结果:
空间统计
虾神daxialu(虾神) · 2015-09-15 17:41
为我们玩GIS的人,最喜欢的就是出一张花花绿绿的地图,比如这样的:
而它与GlobeMoran's I的区别,如下:
的类型,何谓异常呢?异常自然就是下面这样的情况:
抛开随机不谈,我们谈聚类和异常的话,就会出现4种组合,如下:
虾神daxialu(虾神) · 2015-09-18 23:16
好吧……权重矩阵,我们看看看这个空间权重矩阵到底是个啥东东:
只有两个值,如下:
下:
再来看看我们昨天计算出来的那张地图:
把这个表格通过我们上面列出的象限方式标出来,如下(把Z得分显著性临界值区域以内的名称都隐藏了):
来,这是为什么呢?来看看他们的其他值,关键看这个值可靠不可靠,所以P值出现了:
最后,贴出数学公式,有数学恐惧症的同学慎入:。