空间内插方法比较
- 格式:pdf
- 大小:208.59 KB
- 文档页数:6
[转载]插值算法(⼀):各种插值⽅法⽐较原⽂地址:插值算法(⼀):各种插值⽅法⽐较作者:稻草⼈确定性随机性确定性随机性趋势⾯(⾮精确)回归(⾮精确)泰森(精确)克⾥⾦(精确)密度估算(⾮精确)反距离权重(精确)薄板样条(精确)整体拟合利⽤现有的所有已知点来估算未知点的值。
局部插值使⽤已知点的样本来估算位置点的值。
确定性插值⽅法不提供预测值的误差检验。
随机性插值⽅法则⽤估计变异提供预测误差的评价。
对于某个数据已知的点,精确插值法在该点位置的估算值与该点已知值相同。
也就是,精确插值所⽣成的⾯通过所有控制点,⽽⾮精确插值或叫做近似插值,估算的点值与该点已知值不同。
1、反距离加权法(Inverse Distance Weighted)反距离加权法是⼀种常⽤⽽简单的空间插值⽅法,IDW是基于“地理第⼀定律”的基本假设:即两个物体相似性随他们见的距离增⼤⽽减少。
它以插值点与样本点间的距离为权重进⾏加权平均,离插值点越近的样本赋予的权重越⼤,此种⽅法简单易⾏,直观并且效率⾼,在已知点分布均匀的情况下插值效果好,插值结果在⽤于插值数据的最⼤值和最⼩值之间,但缺点是易受极值的影响。
2、样条插值法(Spline)样条插值是使⽤⼀种数学函数,对⼀些限定的点值,通过控制估计⽅差,利⽤⼀些特征节点,⽤多项式拟合的⽅法来产⽣平滑的插值曲线。
这种⽅法适⽤于逐渐变化的曲⾯,如温度、⾼程、地下⽔位⾼度或污染浓度等。
该⽅法优点是易操作,计算量不⼤,缺点是难以对误差进⾏估计,采样点稀少时效果不好。
样条插值法⼜分为张⼒样条插值法(Spline with Tension)规则样条插值法(Regularized Spline)薄板样条插值法 (Thin-Plate Splin)3、克⾥⾦法(Kriging)克⾥⾦⽅法最早是由法国地理学家Matheron和南⾮矿⼭⼯程师Krige提出的,⽤于矿⼭勘探。
这种⽅法认为在空间连续变化的属性是⾮常不规则的,⽤简单的平滑函数进⾏模拟将出现误差,⽤随机表⾯函数给予描述会⽐较恰当。
前段时间要对气象要素进行插值,翻看了多种方法,做了个PPT报告.对每个方法有简单的介绍极一些总结,不一定都是个人看法,参考了多方书面(sufer,ArcGIS应用教程)以及坛子里,百度上等搜到的资料的看后笔记,有些注了出处有些忘了.截图共享下,也不知有用没用.有错的地方请跟贴指正,谢谢啦!--------------------------------所谓空间数据插值,即通过探寻收集到的样点/样方数据的规律,外推/内插到整个研究区域为面数据的方法.即根据已知区域的数据求算待估区域值, 影响插值精度的主要因素就是插值法的选取空间数据插值方法的基本原理:任何一种空间数据插值法都是基于空间相关性的基础上进行的。
即空间位置上越靠近,则事物或现象就越相似, 空间位置越远,则越相异或者越不相关,体现了事物/现象对空间位置的依赖关系。
(/dky/nb/page/2000-3-3/2000332117262480.htm,南京师范大学地理科学学院地理信息系统专业网络课程教程)➢由于经典统计建模通常要求因变量是纯随机独立变量,而空间插值则要求插值变量具备某种程度的空间自相关性的具随机性和结构性的区域化变量。
即区域内部是随机的,与位置无关的,而在整体的空间分布上又是有一定的规律可循的,这也是不宜用简单的统计分析方法进行插值预估的原因。
从而空间统计学应用而生。
➢无论用哪种插值方法,根据统计学假设可知,样本点越多越好,而样本的分布越均匀越好。
常用的空间数据插值方法之一:趋势面分析⏹趋势面分析(Trend analyst)。
严格来说趋势面分析并不是在一种空间数据插值法。
它是根据采样点的地理坐标X,Y值与样点的属性Z值建立多元回归模型,前提假设是,Z值是独立变量且呈正态分布,其回归误差与位置无关。
⏹根据自行设置的参数可建立线性、二次…或n次多项式回归模型,从而得到不同的拟合平面,可以是平面,亦可以是曲面。
精度以最小二乘法进行验证。
3.9。
空间内插3.9.1 空间内插的定义和种类一、定义空间数据的内插通过已知点或分区的数据,推求任意点或分区数据的方法称为空间数据的内插。
其方法是从存在的观测数据中找到一个函数关系式,使该关系式最好地逼近这些已知的空间数据,并能根据函数关系式推求出区域范围内其它任意点或任意分区的值。
它是地理信息系统数据处理常用的方法之一,广泛应用于等值线自动制图、数字高程模型的建立、不同区域界线现象的相关分析和比较研究等。
二、分类:根据以知点或以知分区数据的不同,将空间数据分为点的内插和区域的内插:1、点的内插:是研究具有连续变化特征现象的数值内插方法,根据内插精度的不同可以将点的内插分为:精确和概略两种。
2、区域的内插:是研究根据一组分区的以知数据来推求同一地区另一组分区未知数据的内插方法,主要有重叠法和比重法两种。
三、意义遍历研究区域中的每个位置以测量该位置的高度、大小或某种特性通常都是困难的,或者是昂贵的,因而一般都是采用抽样的方法,按照一定原则,选出一些样点进行测量,然后使用插值函数,估计出所有其它位置的值。
输入的点可以是规则的空间点,也可以是离散点,它们都含有高度、大小或某种特性的值对输入的点进行插值,生成规则栅格网,通常有四种插值(生成表面)的方法:距离反转权重法(IDW)、样条函数法(Spline)、克里格法(Kriging)以及多项式趋势法(Polynomial trend)。
每种方法都有其独特之处,都有一些基本的假设,适用于不同的源数据和应用。
3.9.2 ARCINFO下的空间内插步骤:① Grid Tools----Statistics------Surface , 弹出对话框如下:主要有如下内插法:反距离内插、克里格内插、趋势面内插、拓扑格网内插等。
点击不同内插将进行不同的参数设置,从而根据需要进行各种内插运算。
②以做趋势面内插为例,加以说明:(1)点击 Trend Surface Interoolation 弹出Trend Function对话框:在Output grid 中输入生成的文件名在Name of input 中找到做为Z值的文件(2) 点击,弹出如下对话框,设置参数:(2)内插完成后可在ArcView中打开做内插分析的图,可多做几种内插分析来对比各个内插的区别。
ARCGIS中几种空间插值简单比较(2012-01-10 22:09:14)1.IDW。
基本思想是目标离观察点越近则权重越大,受该观察点的影响越大。
好处是观察点本身是绝对准确的,而且可以限制插值点的个数。
通过power可以确定最近原则对于结果影响的程度。
Search radius可以控制插值点的个数。
2.克里金插值。
克里金插值与IDW插值的区别在于权重的选择,IDW仅仅将距离的倒数作为权重,而克里金考虑到了空间相关性的问题。
它首先将每两个点进行配对,这样就能产生一个自变量为两点之间距离的函数。
对于这种方法,原始的输入点可能会发生变化。
在数据点多时,结果更加可靠。
时, 其内插的结果可信度较高。
通过某种函数来模拟他们之间的关系,这样就能够得到空间分布的关系了。
接着再用这种空间分布的关系来模拟出所得的数据。
Ordinary是指一般的情况,而universal是指已知某种分布模式比如风暴的模拟等等3.Natural Neighbour法原理是构建voronoi多边形,也就是泰森多边形。
首先将所有的空间点构建成voronoi多边形,然后将待求点也构建一个voronoi多边形,这样就与圆多边形有很多相交的地方,根据每一块的面积按比例设置权重,这样就能够求得待求点的值了。
个人感觉这种空间插值方法没有实际的意义来支持。
4.样条函数插值spline这种方法使用样条函数来对空间点进行插值,它有两个基本条件:1.表面必须完全通过样本点2.表面的二阶曲率是最小的。
一下是一篇论文里spline与IDW之间的比较:从本文实验数据可以看出,IDW 插值主要受幂指数和各采样点属性值变化情况的影响,幂指数越高,其局部影响的程度越高,在IDW搜索半径内,若各个采样点属性值变化较小时,内插结果受幂指数的影响较小;Spline 插值主要受插值类型(Regularized 或Tension)和weight 值的影响,一般Regularize 插值结果比Tension插值结果光滑,Regularized Spline 插值中,weight 值越高生成的表面越光滑,Tension Spline 插值则相反;总体来看,IDW和SPLINE 插值受采样点范围、采样点密度、采样点属性取值变化以及各自的参数影响,当采样点足够密时,使用IDW插值可以取得良好效果,SPLINE插值则适合那些空间连续变化且光滑的表面的生成。
空间插值——插值⽅法的适⽤范围
空间确定性插值,以研究区域内部的相似性或者平滑度为基础,由已知样点来创建表⾯。
1、IDW
相近相似原理,反距离加权。
样点分布要尽可能均匀,且布满整个插值区域。
对于不规则分布的样点,插值时利⽤的样点往往也不均匀的分布在周围不同的⽅向上,这样对每个⽅向上的插值结果的影响不同,准确度也会降低。
2、全局多项式插值
⼀个多项式计算预测值,即⽤⼀个平⾯或曲⾯进⾏全区特征拟合。
⾮精确插值法,不与实际样点完全重合。
要求样点模拟的属性在研究区域表⾯的变化是平缓的。
或者检验长期变化的,全局性趋势的影响(即趋势⾯分析)时使⽤。
⼀般选三次拟合。
3、局部多项式内插
多个多项式,每个多项式处在特定重叠的邻近区域内。
不是精确内插。
当需要建⽴平滑表⾯且确定变量的⼩范围的变异时可以使⽤。
能描述数据集中含有的短程变异。
更多地⽤来解释局部变异。
4、径向基函数
包括平⾯样条函数、张⼒样条函数、规则样条函数、⾼次曲⾯函数、反⾼次曲⾯样条函数五种。
适⽤于表⾯变化平缓的表⾯。
当在较短的⽔平距离内,表⾯发⽣较⼤变化,或者⽆法确定采样点数据的准确性,或者采样数据具有较⼤不确定性时,不适⽤。
实验四IDW和Spline空间插值对比与克里格方法内插生成曲面IDW和Spline空间插值对比实验目的:通过练习熟练掌握如何利用IDW内插方法和Spline内插方法进行GDP空间分布特征的分析,以及两种插值方法的适用条件,并以此来加强对空间插值的认识。
实验内容:用IDW法和Spline法内插生成GDP曲面实验数据与要求:数据:GDP为某地区的统计GDP数据,bound为该地区的边界数据。
要求:1)经济发展具有一定的连带效应和辐射作用。
以该地区各区域年GDP数据为依据,采用IDW和Spline内插方法创建该地区GDP空间分异栅格图。
2)分析每种插值方法中主要参数的变化对内插结果的影响。
IDW:P=2和P=5。
Spline:规则样条法,Weight = 0和Weight = 0.01;张力样条法,Weight = 0和Weight =5。
3)分析两种内插方法生成的GDP空间分布图的差异性,简单说明形成差异的主要原因。
实验过程与步骤:(1)运行ArcMap,点击Tools菜单下的Extensions,选择Spatial Analyst,点击Close 按钮(2)单击File菜单下的Open命令,选择E:\Chp8\Ex4\GDP.mxd(3)打开Options对话框中的General选项卡,设置默认工作路径为:“E:\Chp8\Ex4\result\”并设置Analysis mask为bound(4)在Spatial Analyst下拉菜单中选择Interpolate to Raster, 在弹出的下一级菜单中点击Inverse Distance Weighted,弹出如下图所示的对话框,设置Z value field为GDP;设置Power为2;设置Output cell size为500;其他参数不变,点击OK,进行计算Power=2时,生成的结果将Power值改为5,重复上述步骤。
下图为Power=5时,生成的结果(5)在Spatial Analyst下拉菜单中选择Raster Calculator,求Abs((Power=2)—(Power=5))2、Spline内插法(1)在Spatial Analyst下拉菜单中选择Interpolate to Raster, 在弹出的下一级菜单中点击Spline。
前段时间要对气象要素进行插值,翻看了多种方法,做了个PPT报告.对每个方法有简单的介绍极一些总结,不一定都是个人看法,参考了多方书面(sufer,ArcGIS应用教程)以及坛子里,百度上等搜到的资料的看后笔记,有些注了出处有些忘了.截图共享下,也不知有用没用.有错的地方请跟贴指正,谢谢啦!--------------------------------所谓空间数据插值,即通过探寻收集到的样点/样方数据的规律,外推/内插到整个研究区域为面数据的方法.即根据已知区域的数据求算待估区域值, 影响插值精度的主要因素就是插值法的选取空间数据插值方法的基本原理:任何一种空间数据插值法都是基于空间相关性的基础上进行的。
即空间位置上越靠近,则事物或现象就越相似, 空间位置越远,则越相异或者越不相关,体现了事物/现象对空间位置的依赖关系。
(/dky/nb/page/2000-3-3/2000332117262480.htm,南京师范大学地理科学学院地理信息系统专业网络课程教程)➢由于经典统计建模通常要求因变量是纯随机独立变量,而空间插值则要求插值变量具备某种程度的空间自相关性的具随机性和结构性的区域化变量。
即区域内部是随机的,与位置无关的,而在整体的空间分布上又是有一定的规律可循的,这也是不宜用简单的统计分析方法进行插值预估的原因。
从而空间统计学应用而生。
➢无论用哪种插值方法,根据统计学假设可知,样本点越多越好,而样本的分布越均匀越好。
常用的空间数据插值方法之一:趋势面分析⏹趋势面分析(Trend analyst)。
严格来说趋势面分析并不是在一种空间数据插值法。
它是根据采样点的地理坐标X,Y值与样点的属性Z值建立多元回归模型,前提假设是,Z值是独立变量且呈正态分布,其回归误差与位置无关。
⏹根据自行设置的参数可建立线性、二次…或n次多项式回归模型,从而得到不同的拟合平面,可以是平面,亦可以是曲面。
精度以最小二乘法进行验证。
空间内插方法比较一、本文概述空间内插方法是一种在地理信息系统(GIS)和遥感技术中广泛使用的技术,用于根据已知的数据点推测未知区域的值。
这种方法在环境科学、气象学、城市规划、资源管理等众多领域都有着重要的应用。
本文旨在探讨和比较几种常见的空间内插方法,包括反距离权重法(IDW)、克里金插值法(Kriging)、自然邻点插值法(Natural Neighbors)以及多项式插值法等。
我们将首先简要介绍这些空间内插方法的基本原理和实施步骤,然后通过一个具体的案例或数据集来比较它们的性能。
我们将评估插值结果的精度、平滑度以及在不同应用场景下的适用性。
我们还将讨论这些方法的优缺点,以便读者能够根据自己的需求选择合适的空间内插方法。
通过本文的阅读,读者将对空间内插方法有更加深入的理解,能够掌握其基本原理和实施步骤,了解不同方法之间的差异和优缺点,并能够在实践中选择合适的空间内插方法。
二、空间内插方法概述空间内插是一种重要的地理信息系统(GIS)技术,用于估算在已知数据点之间或之外的未知地理位置的值。
它是通过分析和理解空间数据的分布模式,使用数学算法来预测和模拟这些模式在空间上的变化。
这种技术广泛应用于各种领域,包括环境科学、气象学、地质学、城市规划等。
空间内插方法大致可以分为两类:确定性方法和统计性方法。
确定性方法,如反距离权重法(IDW)、样条函数法(Spline)等,主要基于空间数据的物理特性和已知点之间的空间关系进行插值。
这类方法通常假设空间数据具有某种连续性和平滑性,通过最小化插值误差或最大化平滑度来得到预测值。
统计性方法,如克里金插值(Kriging)、协方差法等,则更多地依赖于对空间数据分布模式的统计分析和理解。
这类方法认为空间数据不仅具有空间相关性,而且可能存在某种潜在的随机性。
因此,它们通过构建和拟合空间统计模型,如变异函数或协方差函数,来估算未知位置的值。
每种空间内插方法都有其独特的优缺点和适用范围。
第三章第五节空间数据的内插方法总结
一、空间内插的概念:设一直一组空间数据,他们可以是离散点的形式,也可以是多边形分区数据的形式,现在要从这些数据中找到一个函数关系式,使关系式最好地逼近这些已知的空间数据,并能根据该函数关系式推求出区域范围内其它任意点或任意多边形分区范围的值。
这种通过已知点活多边形分区的数据,推求任意点或多边形分区数据的方法就称为空间数据的内插。
二、空间数据的内插分为两部分,一是点的内插;二是区域的内插;
点内插:地理信息系统书第96页,表3—3点的空间内插分类,知道每一个内插法的概念就可以了。
点内插重点放在克里金内插法,有普通、简单和通用内插法三种,记住原理概念就行的。
第15卷第3期2000年6月地球科学进展ADV ANCE IN EARTH SCIEN CESV ol.15 No.3Jun.,2000学术论文空间内插方法比较李 新,程国栋,卢 玲(中国科学院寒区旱区环境与工程研究所,甘肃 兰州 730000)摘 要:空间内插可以分为几何方法、统计方法、空间统计方法、函数方法、随机模拟方法、物理模型模拟方法和综合方法。
介绍了每一种方法的适用范围、算法和优缺点。
指出没有绝对最优的空间内插方法,必须对数据进行空间探索分析,根据数据的特点,选择最优方法;同时,应对内插结果做严格的检验。
开发通用空间内插软件、智能化内插以及加强相关基础研究将是空间内插研究的重点。
关 键 词:空间内插;空间数据探索分析;地理信息系统中图分类号:P208 文献标识码:A 文章编号:1001—8166(2000)03-0260-061 空间内插根据已知地理空间的特性探索未知地理空间的特性是许多地理研究的第一步,也是地理学的基本问题。
常规方法无法对空间中所有点进行观测,但是我们可以获得一定数量的空间样本,这些样本反映了空间分布的全部或部分特征,并可以据此预测未知地理空间的特征。
在这一意义上,空间内插可以被定义为根据已知的空间数据估计(预测)未知空间的数据值。
其目标可以归纳为:①缺值估计:估计某一点缺失的观测数据,以提高数据密度;②内插等值线:以等值线的形式直观地显示数据的空间分布;③数据格网化:把无规则分布的空间数据内插为规则分布的空间数据集,如规则矩形格网、三角网等。
空间内插对于观测台站十分稀少,而台站分布又非常不合理的地区具有十分重要的实际意义。
这些地区的常规观测常常不能满足要求,在这种情况下,利用有限的常规观测估计合理的空间分布,或尽可能地提高数据密度就成为迫切要求。
在这些方面,缺值估计和数据格网化将发挥重要的作用。
(1)缺值估计。
各种科学考察中形式多样的短期观测是提高数据观测密度的重要方式,无形中起到了加密台站的作用;而且由于这些考察常常到达人迹罕至的高海拔和极地等区域,有助于了解区域内观测变量的完整空间分布。
但是,这些观测序列往往很短,短则数十天,长不过几年。
如何利用周围台站的长序列观测资料和短期观测本身的信息,将观测变量插补到长序列是一个重要问题。
(2)数据格网化。
规则格网能够更好地反映连续分布的空间现象,并对他们的变化作出模拟。
现代地球科学模型和气候模型,如GCM(一般环流模型),都要求与GIS数据模型和遥感数据高度兼容的空间数据集。
格网化的数据,尤其是规则矩形格网,已成为目前地学模型的主要数据形式。
因此,对已知观测台站的观测数据进行空间内插,得到格网化数据是模型的第一步。
空间内插一般包括这样几个过程〔1〕:①内插方法(模型)的选择;②空间数据的探索分析,包括对数据的均值、方差、协方差、独立性和变异函数的估计等;③内插方法评价;④重新选择内插方法,直到合理;⑤内插。
因此,通过比较而选择一个合用的、适合于数据空间分布特点的内插方法是空间内插的关键。
本文将空间内插分类为几何方法、统计方法、空间统计方中国科学院特别经费支持领域项目“冰冻圈基础研究”(编号:KJ-B-2-102)资助。
第一作者简介:李新,男,1969年10月生于甘肃酒泉,副研究员,主要从事地理信息系统和遥感在冰冻圈和水资源研究中的应用。
收稿日期:1999-08-19;修回日期:1999-11-03。
法、函数方法、随机模拟方法、物理模型模拟方法和综合方法,通过比较研究,指出每一种方法的适用范围、算法和优缺点。
2 空间内插方法比较空间内插可依据:①确定或随机;②点与面;③全局或局部等标准分类〔2~4〕。
本文依据内插方法的基本假设和数学本质,把空间内插分类为以下几种方法。
2.1 几何方法是最简单的空间内插方法。
几何方法基于“地理学第一定律”〔5〕的基本假设,即邻近的区域比距离远的区域更相似。
几何方法的优点是计算开销少,具有普适性,不需要根据数据的特点对方法加以调整。
当样本数据的密度足够大时,几何方法一般能达到满意的精度。
几何方法的最大问题是,无法对误差进行理论估计。
最常用的几何方法有泰森多边形(最近距离法)和反距离加权方法。
2.1.1 泰森多边形(最近距离法)泰森多边形用于生成“领地”或控制区域。
实际上,尽管泰森多边形产生于气候学领域,它却特别适合于专题数据的内插,因为它生成专题与专题之间明显的边界,不会有不同级别之间的中间现象。
泰森多边形的算法非常简单,未采样点的值等于与它距离最近的采样点的值。
2.1.2 反距离加权方法反距离加权法是最常用的空间内插方法之一。
它认为与未采样点距离最近的若干个点对未采样点值的贡献最大,其贡献与距离成反比。
可用下式表示:Z=ni=11(D i)pZ ini=11(D i)p(1)式中,Z是估计值,Z i是第i(i=1,…,n)个样本,D i 是距离,p是距离的幂,它显著影响内插的结果,它的选择标准是最小平均绝对误差。
Husar等〔6〕的研究结果表明,幂越高,内插结果越具有平滑的效果。
2.2 统计方法其基本假设是,一系列空间数据相互相关,预测值的趋势和周期是与它相关的其它变量的函数。
统计方法的优点是计算开销不大,有一定的理论基础,能够对误差作出整体上的估计。
但是,其前提是一定要有好的采样设计,如果采样过程不能反映出表面变化的重要因素,如周期性和趋势,则内插一定不能取得好的效果〔1,7〕。
常用的统计方法有趋势面方法和多元回归方法。
2.2.1 趋势面趋势面根据有限的观测数据拟合曲面,进行内插。
它适用于:①能以空间的视点诠释趋势和残差;②观测有限,内插也基于有限的数据。
当趋势和残差分别能与区域和局部尺度的空间过程相联系时,趋势面分析最有用〔8〕。
趋势面方法可以被定义为:y=Aθ+e(2)式中,y是n×1维矩阵,对应于n个样本;A是n个样本的坐标矩阵;θ是趋势面参数矩阵。
A和θ依赖于趋势面的次数。
趋势面的次数是它最重要的特征。
e是残差,通常是一个独立随机变量。
当残差是随机独立时,统计检验有效;但实际上,趋势面中的残差常是自相关(特别是趋势面的次数较低时),因此,检验是显著有偏差的。
残差的空间自相关可以用随机过程模型模拟。
由于趋势面的以上特性,它的目标有时并非最佳拟合,而是把数据分成区域趋势组分和局部的残差。
2.2.2 多元回归在各种统计方法中,使用较多的是回归分析,其特点是不需要分布的先验知识。
多元回归在数学形式上与趋势面很相似,但是,它们又有着显著的不同。
首先,在趋势面分析中,A 是坐标矩阵,而在回归分析中,它可以是任意变量。
其次,在趋势面方法中,模型的拟合严格地遵从自常数、一次、二次、立方等的顺序,主要的问题是确定模型的次数,因此,趋势面分析有内在的多重共线性问题;而在多元回归中,尽管也存在多重共线性,但它并非内在的,可以通过逐步回归解决,因此,相对于趋势面的选择次数,多元回归的核心问题是选择变量(主成分分析等方法有助于选择变量)和区分模型。
2.3 空间统计(Geostatistics)方法空间统计又称地质统计学,于20世纪50年代初开始形成,60年代在法国统计学家M athero n的大量理论研究工作基础上逐渐趋于成熟〔9,10〕。
其基本假设是建立在空间相关的先验模型之上的。
假定空间随机变量具有二阶平稳性,或者是服从空间统计的本征假设(intrinsic hypo thesis)〔1,11~15〕。
则它具有这样的性质:距离较近的采样点比距离远的采样点更相似,相似的程度、或空间协方差的大小,是通过点对的平均方差度量的。
点对差异的方差大小只与采样点间的距离有关,而与它们的绝对位置无关。
空间统计内插的最大优点是以空间统计学作为其坚261第3期 李 新等:空间内插方法比较 实的理论基础,可以克服内插中误差难以分析的问题,能够对误差做出逐点的理论估计;它也不会产生回归分析的边界效应。
缺点是复杂,计算量大,尤其是变异函数(v ariog ram )是几个标准变异函数模型的组合时,计算量很大;另一个缺点是变异函数需要根据经验人为选定。
空间统计方法以Kriging 及其各种变种(Co kriging 等)为代表。
2.3.1 Kriging 内插(1)Kriging 内插的公式Kriging 内插由南非地质学家Krige 发明,并因此而命名。
Ma theron 〔16〕给出了Kriging 的一般公式。
Kriging 内插的公式为:z ⌒(x 0)=ni =1λi z (x i )(3)式中,z (x i )为观测值,它们分别位于区域内x i 位置;x 0是一个未采样点;λi 为权,并且其和等于1。
即ni =1λi =1(4)选取λi ,使z ⌒(x 0)的估计无偏,并且使方差e ⌒2e 小于任意观测值线形组合的方差。
最小方差由下式给定:e ⌒2e=ni =1λi V (x i ,x 0)+h (5)它由下式得到:n i =1λi V (x i ,x j )+h =V (x j ,x 0) j (6)式中,V (x i ,x j )是z 在采样点x i 和x j 之间的半方差(semi-v ariance),V (x j ,x 0)是z 在采样点x i 和未知点x 0之间的半方差,这些量都从适宜的变异函数得到。
h 是极小化处理时的拉格朗日乘数。
估计半方差是一个较为复杂的过程,这一过程称为空间数据探索分析(ESDA )。
(2)空间数据探索分析(ESDA)对于Kriging 内插而言,空间数据探索分析的目标是建立半方差V (h )和点对之间的空间距离h 之间的关系,即变异函数。
由于空间统计的本征假设可以表示为以下两个公式:·任意两个距离为h 的两点间的差值的数学期望为0:E 〔Z (x )-Z (x +h )〕=0(7) ·任意两个距离为h 的两点间的差值的方差最小:Var 〔Z (x )-Z (x +h )〕=E{〔X ′(x )-X ′(x +h )〕2}=2V (h )(8)因此,由下式估计半方差γ(h ):V (h )=12n E n i =1〔z (x i +h )〕2(9)这一关系即变异函数。
它提供了内插、优化采样的有用信息。
Krig ing 内插的第一步是根据样本找到适合的变异函数理论模型。
最常用的变异函数模型有:nugg et 、球面、指数、高斯、阻尼正弦、幂和线形模型。
其中,前几种模型在一定的范围内达到极大方差,而线形模型的方差增长没有极限。
以下是几种基本变异函数的形式〔1,17〕,这些变异函数的特性分别是:·Nugg et 模型 缺乏空间相关。
·球面模型 空间相关随距离的增长逐渐衰减,当距离>θ后,空间相关消失。