第4章 空间统计分析初步——第1节 探索性空间统计分析《计量地理学》(华东师大,徐建华)

  • 格式:ppt
  • 大小:391.00 KB
  • 文档页数:25

下载文档原格式

  / 25
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 空间统计分析初步
➢ 探索性空间统计分析 ➢ 地统计分析方法
空间统计分析
➢ 空间统计分析,即空间数据(Spatial Data)的统计分析,是现代计量地理学 中一个快速发展的方向领域。
➢ 空间统计分析,其核心就是认识与地理 位置相关的数据间的空间依赖、空间关 联或空间自相关,通过空间位置建立数 据间的统计关系。
=》
n(xi x) wij (x j x)
I i
j
(xi x)2
i
nzi wij z j

j
zT z
zi wij zj
j
式中:其中zi 和 zj是经过标准差标准化的观测值。
➢ 局部Moran指数检验的标准化统计量为:
Z(Ii )

Ii E(Ii ) VAR(Ii )
Z 4.5035 4.5551 4.5978 4.5532 4.5326
P 0.0000 0.0000 0.0000 0.0000 0.0000
从表中可以看出,在1998-2002年期间,中国大陆31个省 份人均GDP的全局Moran指数均为正值;在正态分布假 设之上,对Moran指数检验的结果也高度显著。这就是 说,在1998-2002年期间,中国大陆31个省份人均GDP存 在着显著的、正的空间自相关,也就是说各省份人均 GDP水平的空间分布并非表现出完全的随机性,而是表 现出相似值之间的空间集聚,其空间联系的特征是:较 高人均GDP水平的省份相对地趋于和较高人均GDP水平 的省份相邻,或者较低人均GDP水平的省份相对地趋于 和较低人均GDP水平的省份相邻。
➢ 全局Moran指数,可以看作是Wz对于z的线性 回 归 系 数 , 对 界 外 值 以 及 对 Moran 指 数 具 有 强烈影响的区域单元,可通过标准回归来诊 断出。
➢ 由于数据对(Wz,z)经过了标准化,因此 界外值可易由2-sigma规则可视化地识别出 来。
➢Moran散点图的四个象限,分别对应于区域单元与其邻居 之间四种类型的局部空间联系形式:
nn
n S0
i 1
wij zi z j
j 1
n
zi 2
n S0
z T Wz zT z
i 1
➢ Moran指数I的取值一般在-1-1之间,小于0表
示负相关,等于0表示不相关,大于0表示正
相关;
➢ Geary系数C的取值一般在0-2之间,大于1表 示负相关,等于1表示不相关,而小于1表示 正相关。
HL:重庆、广西、河北
➢上图进一步显示了各省人均GDP局部集聚的空间结 构。可以看出,从人均GDP水平相对地来看: ➢高值被高值包围的高-高集聚省份有:北京、天津、 河南、安徽、湖北、江西、海南、广东、福建、浙 江、山东、上海、江苏; ➢低值被低值包围的低-低集聚省份有:黑龙江、内 蒙古、新疆、吉林、甘肃、山西、陕西、青海、西 藏、四川、云南、辽宁、贵州; ➢被低值包围的高值省份有:重庆、广西、河北;被 高值包围的低值省份只有湖南。
区域单元趋于空间集聚,而显著的负值表示低观测
值的区域单元趋于空间集聚
➢与Moran指数只能发现相似值(正关联)或非相似 性观测值(负关联)的空间集聚模式相比,具有能够 探测出区域单元属于高值集聚还是低值集聚的空间 分布模式。
3.Moran散点图
➢ 以(Wz,z)为坐标点的Moran散点图,常来 研究局部的空间不稳定性,它对空间滞后因 子Wz和z数据对进行了可视化的二维图示。
wn1 wn2
w1n
w2n


wnn

▪式中:Wij表示区域i与j的临近关系,它可以根
据邻接标准或距离标准来度量。
两种最常用的确定空间权重矩阵的规则:
➢(1)简单的二进制邻接矩阵
1 当区域i和j相邻接
wij 0
其它
➢(2)基于距离的二进制空间权重矩阵
1 当区域i和j的距离小于d时
➢对于Moran指数,可以用标准化统计量Z来检验n
个区域是否存在空间自相关关系,Z的计算公式
为:
Z I E(I) VAR(I )
➢当Z值为正且显著时,表明存在正的空间自相关,
也就是说相似的观测值(高值或低值)趋于空间集
聚;
➢当Z值为负且显著时,表明存在负的空间自相关, 相似的观测值趋于分散分布;
第一象限代表了高观测值的区域单元被同是高值的区 域所包围的空间联系形式;
第二象限代表了低观测值的区域单元被高值的区域所 包围的空间联系形式;
第三象限代表了低观测值的区域单元被同是低值的区 域所包围的空间联系形式;
第四象限代表了高观测值的区域单元被低值的区域所 包围的空间联系形式。
➢ 与局部Moran指数相比,其重要的优势在于能 够进一步具体区分区域单元和其邻居之间属 于高值和高值、低值和低值、高值和低值、 低值和高值之中的哪种空间联系形式。
(2)所有区域单元LISA的总和与全局的空间联系指 标成比例。
➢LISA包括局部Moran指数(Local Moran)和局部 Geary指数(Local Geary),下面重点介绍和讨论局 部Moran指数。
➢ 局部Moran指数被定义为:
I
i
(xi S2
x)
j
wij (x j x)
东部的江苏、上海、浙江三省市的Z值在0.05的显著性 水平下显著,天津的Z值在0.1的显著性水平下显著。而 东部上海、江浙等发达省市趋于为一些相邻经济发展水 平相对较高的省份所包围,东部发达地区的空间集聚分 布特征也显现出来。
➢以(Wz,z)为坐标,进一步绘制Moran散点图
➢可以发现,多数省份位于第一和第三象限内,为正
第1节 探索性空间统计分析
➢ 一、基本原理与方法 (一)空间权重矩阵 (二)全局空间自相关 (三)局部空间自相关
➢ 二、应用实例
一、基本原理与方法
(一)空间权重矩阵
▪通常定义一个二元对称空间权重矩阵W,来表
达n个位置的空间区域的邻近关系,其形式如下:
w11 w12 W w21 w22
➢当Z值为零时,观测值呈独立随机分布。
(三)局部空间自相关
➢ 局部空间自相关分析方法包括三种分析 方法: 1.空间联系的局部指标(LISA) 2.G统计量 3.Moran散点图
1.空间联系的局部指标(LISA)
➢空间联系的局部指标 (Local indicators of spatial association ,缩写为LISA)满足下列两个条件: (1)每个区域单元的LISA,是描述该区域单元周围 显著的相似值区域单元之间空间集聚程度的指标;
wij 0
其它
(二)全局空间自相关
➢ Moran指数和Geary系数是两个用来度 量空间自相关的全局指标。
➢ Moran指数反映的是空间邻接或空间邻 近的区域单元属性值的相似程度,
➢ Geary 系数与Moran指数存在负相关关 系。
➢ 如果是位置(区域)的观测值,则该变量的 全局Moran指数I,用如下公式计算:
➢选取2001年各省份人均GDP数据,计算局 部Gi统计量和局部Gi统计量的检验值Z(Gi), 并绘制统计地图如下。
检验结果表明,贵州、四川、云南西部三省的Z值在 0.05的显著性水平下显著,重庆的Z值在0.1的显著性水 平下显著,该四省市在空间上相连成片分布,而且从统 计学意义上来说,与该区域相邻的省区,其人均GDP趋 于为同样是人均GDP低值的省区所包围。由此形成人均 GDP低值与低值的空间集聚,据此可认识到西部落后省 区趋于空间集聚的分布特征。
n
i
(xi x)2
1 n
x n i1 xi
➢ Geary 系数C计算公式如下:
n n
Байду номын сангаас
n 1
wij xi x j 2
C
i1 j1
nn
n
2 wij xi x2
i1 j1
i 1
式中:C为Geary系数;其它变量同上式。
➢如果引入记号:
nn
2. G统计量
全局G统计量的计算公式为:
G
wij xi x j /
xi x j
ij
ij
对每一个区域单元的统计量为:
Gi wij x j / x j
i
j
➢对统计量的检验与局部Moran指数相似,其检验
值为:
Z (Gi
)

Gi E(Gi ) VAR(Gi )
➢显著的正值表示在该区域单元周围,高观测值的
➢ 并且,对应于Moran散点图的不同象限,可识 别出空间分布中存在着哪几种不同的实体。
➢ 将Moran散点图与LISA显著性水平相结合,也 可以得到所谓的“Moran显著性水平图”,图 中显示出显著的LISA区域,并分别标识出对 应于Moran散点图中不同象限的相应区域。
二、应用实例 中国大陆各省份人均GDP的空间关联分析
的空间联系,属于低-低集聚和高-高集聚类型,而且 位于第三象限内的低-低集聚类型的省份比位于第一象 限内的高-高集聚类型的省份更多一些。
LH:湖南
HH:北京、天津、河南、安徽、湖北、江西 、海南、广东、福建、浙江、山东、上海、 江苏
LL:黑龙江、内蒙古、新疆、吉林、甘肃、 山西、陕西、青海、西藏、四川、云南、辽 宁、贵州
➢根据各省份之间的邻接关系,采用二进制邻接权 重矩阵,选取各省分份1998—2002年人均GDP的自 然对数,依照公式计算全局Moran指数I,计算其 检验的标准化统计量Z(I),结果如表4.1.3所示。
年份 1998 1999 2000 2001 2002
I 0.5001 0.5069 0.5112 0.5059 0.5013
n n
n
wij xi x x j x
I i1 j1
nn
n
wij xi x 2
i1 j1
i 1
nn
wij (xi x)(x j x)
i1 ji
nn
S 2
wij
i1 ji
式中: I为Moran指数
S 2 1
S0
wij
i1 j 1
zi (xi x)
z j (xj x)
zT [z1, z2 , , zn ]
➢ 则全局Moran指数I的计算公式也可以进一步 写成:
nn
I
n
wij (xi x)(x j x)
i1 j1
S0
n
(xi x)2
i 1