半变异函数(第一部分)
- 格式:docx
- 大小:36.74 KB
- 文档页数:1
克里金(kriging)插值的原理与公式推导
克里金插值是一种空间插值方法,用于估计未知区域的数值,其
原理是基于空间数据的空间相关性来进行插值。
具体来说,克里金插
值假设空间数据在不同位置之间具有一定的相关性,即在空间上相邻
的点具有相似的数值。
克里金插值利用这种相关性来进行插值,从而
可以更准确地估计未知位置的数值。
克里金插值的公式推导涉及到半变异函数的定义,通常使用高斯
模型、指数模型或球形模型来描述数据的空间相关性。
在推导过程中,会利用已知数据点的数值和位置信息,以及半变异函数的参数来构建
插值模型,进而估计未知位置的数值。
克里金插值的公式可以表示为:
\[Z(u) = \sum_{i=1}^{n} \lambda_i \cdot Z(u_i)\]
其中,\(Z(u)\)为未知位置的数值,\(Z(u_i)\)为已知数据点的
数值,\(\lambda_i\)为插值权重,通过半变异函数及数据点之间的空
间距离计算得出。
除了基本的克里金插值方法外,还有一些相关的扩展方法,如普通克里金、泛克里金等,这些方法在建模和插值的过程中考虑了更多的因素,如均值趋势、空间方向等,使得插值结果更加准确和可靠。
总的来说,克里金插值是一种常用的空间插值方法,适用于各种地学环境下的数据分析与建模。
在实际应用中,需要根据具体数据的特点选择合适的插值方法和模型参数,以获得准确的插值结果。
1,建议你认真学习地统计学知识,有效滞后距(active lag distance)是指半方差计算采用的最大的距离,一般取采样点最大距离的1/2. lag distance interval 与 n 的乘积就是 active lag distance。
如果你不懂的话,就不要修改。
不过有时候选取合适的n,会得到精确度不一样的结果。
间距(lag distance interval)不同,变异函数代表的尺度就不一样,比如你取50m时能反映50m内的空间变异,而取100m时能反映100m的空间变异。
2,一般来说,软件选择的是最优的。
不过在很多情况下软件会自动选择线性,特别是数据不太适合半变异函数分析的时候。
会出现一些逻辑错误,比如计算出来的变程很大,10000m以上,而实际上最大滞后距才1800m,这显然是逻辑错误。
需要手动调节参数,将变程等有效指标调到合适的范围,当然,可能会使得RSS值有所降低。
但这是最优的。
3,地统计学要求样本符合正态分布,也就是说必须对数据进行转化,常见的转换方法有average + - 3 * S, 对数转化,BOX-COX转化。
在SPSS里用非参数检验,K-S检验,得sig值大于0.05为正态分布。
有时候数据实在无法转换为正态分布,可以将就着用。
你会发现,数据转化与未转化的半变异函数是差不多的。
我一般用GS+软件计算半方差,它的模型拟合能力很强。
但是它的作图就差强人意啦。
如果你EXCEL水平很高的话,可以把GS+计算的lag 和semivariance值复制到excel中,然后自己编写模型函数,这样作图就很好了。
ARCGIS里的kriging插值做得很好,但是由于其半变异函数的模型拟合无法看出拟合效果,我建议你根据GS+里面算的模型结果到ARCGIS里进行kriging插值,不然插值出来没有物理意义,就只有纯粹的数字意义了。
4,不建议在GS+里作图。
不过GS+软件本身是可以导出图片的,你仔细看看每个按钮,如果不懂英文就查一查吧。
几种克里金温度插值的比较1克里金插值法克里金法类型分常规克里金插值(常规克里金模型/克里金点模型)和块克里金插值。
常规克里金插值,其内插值与原始样本的容量有关,当样本数量较少的情况下,采用简单的常规克里金模型内插的结果图会出现明显的凹凸现象;块克里金插值是通过修改克里金方程以估计子块B内的平均值来克服克里金点模型的缺点,对估算给定面积实验小区的平均值或对给定格网大小的规则格网进行插值比较适用。
克里金插值有多种方式,可分为简单克里金插值、普通克里金插值、泛克里金插值等线性插值法,指示克里金插值、析取克里金插值等非线性插值法和概率克里金插值、贝叶斯克里金插值等。
克里金法提供了一个在有限区域内对空间变量进行无偏最优估计的方法。
1.1简单克里金插值图1 未经数值变换的简单克里金插值(作图:曹源飞)图2 数值变换后的简单克里金插值(作图:曹源飞)采用简单克里金插值时,由于原温度数据不满足正态分布,故进行数值转换,即在Transformation Type中选择Normal Score,Order of trend removal 中选择Second得到图2.simple kriging很少直接用于估计,因为它假设空间过程的均值依赖于空间位置,并且是已知的,但在实际中均值一般很难得到。
它可以用于其它形式的克立格法中例如指示和析取克立格法,在这些方法中数据进行了转换,平均值是已知的。
1.2 普通克里金插值图3 普通克里金插值(作图:杨敏)Ordinary kriging是单个变量的局部线形最优无偏估计方法,也是最稳健常用的一种方法。
普通克里金(Ordinary Kriging)提供了一个在有限区域内对空间变量进行无偏最优估计的方法,是根据样本空间位置不同、样本间相关程度不同,对每个样品赋予了不同的权,进行滑动加权平均,以估计待测点的值。
普通克里金法为一种广泛使用的地理统计的插值方法,但一般都只依据经验使用一个变异函数来计算插值结果。
研究生课程探索性空间数据分析杜世宏北京大学遥感与GIS研究所提纲一、地统计基础二、探索性数据分析•地统计(Geostatistics)又称地质统计,是在法国著名统计学家Matheron大量理论研究的基础上逐渐形成的一门新的统计学分支。
它是以区域化变量为基础,借助变异函数,研究既具有随机性又具有结构性,或空间相关性和依赖性的自然现象的一门科学。
凡是与空间数据的结构性和随机性,或空间相关性和依赖性,或空间格局与变异有关的研究,并对这些数据进行最优无偏内插估计,或模拟这些数据的离散性、波动性时,皆可应用地统计学的理论与方法。
•地统计学与经典统计学的共同之处在于:它们都是在大量采样的基础上,通过对样本属性值的频率分布或均值、方差关系及其相应规则的分析,确定其空间分布格局与相关关系。
但地统计学区别于经典统计学的最大特点是:地统计学既考虑到样本值的大小,又重视样本空间位置及样本间的距离,弥补了经典统计学忽略空间方位的缺陷。
•地统计分析理论基础包括前提假设、区域化变量、变异分析和空间估值。
• 1. 前提假设–⑴随机过程。
与经典统计学相同的是,地统计学也是在大量样本的基础上,通过分析样本间的规律,探索其分布规律,并进行预测。
地统计学认为研究区域中的所有样本值都是随机过程的结果,即所有样本值都不是相互独立的,它们是遵循一定的内在规律的。
因此地统计学就是要揭示这种内在规律,并进行预测。
–⑵正态分布。
在统计学分析中,假设大量样本是服从正态分布的,地统计学也不例外。
在获得数据后首先应对数据进行分析,若不符合正态分布的假设,应对数据进行变换,转为符合正态分布的形式,并尽量选取可逆的变换形式。
• 1. 前提假设–(3)平稳性。
对于统计学而言,重复的观点是其理论基础。
统计学认为,从大量重复的观察中可以进行预测和估计,并可以了解估计的变化性和不确定性。
–对于大部分的空间数据而言,平稳性的假设是合理的。
其中包括两种平稳性:•一是均值平稳,即假设均值是不变的并且与位置无关;•另一类是与协方差函数有关的二阶平稳和与半变异函数有关的内蕴平稳。
城市表层土壤重金属污染分析摘要通过分析城市城区土壤地质环境数据,选取采集样本为研究对象,建立模型综合评价城区污染状况,分析确立重金属污染源及其污染的传播方式。
模型一:采用模糊综合评价模型通过建立各重金属浓度的隶属度函数进而求出模糊关系矩阵和模糊权重矩阵,最后求出模糊评价向量,按照最大隶属度原则计算得出各区污染程度的等级,其中生活区、山区、公园绿地属于一级污染,工业区和主干道路区属于二级污染。
模型二:采用改进单因子污染指数模型计算各种重金属污染指数,再根据标准确定各区主要污染因子及其污染程度。
本文得到山区和公园绿地区各种金属污染程度都较低。
生活区主要污染因子Cd和Zn,工业区主要污染因子Cd、Cu、Hg、、Zn,主干道路区主要污染因子Cd和Zn,最后由这些不同区域的不同属性判断重金属污染的原因主要包括生活垃圾,工业排放,汽车尾气等。
模型三:利用地统计学中的半方差函数公式描述八种重金属元素分布在整个城市区域上的浓度变化,分析出这八个变量的空间变异方式,即确定变量的传播方式。
利用克里克法对重金属含量进行插值,模拟出各种重金属的分布扩散区域图,其中As,Cd,Hg 在东北部的污染源全都为点状以小范围的方式向周围辐射,Cd,Cr,Cu,Hg,Ni,Pb,Zn等元素都城市东南部以大范围的方式向四周面状和带状扩散。
污染源中心为22号、8号、20号等许多采样点所处区域。
最后再收集数据,对模型三进行改进,重金属元素通过大气、河流和沉降进入土壤,但都需要经过植物根系主导的土壤水循环,以此建立微分方程模型研究重金属元素的迁移规律,分析地质环境演变。
关键字模糊综合评价单因子污染指数半方差函数微分方程1 问题重述土壤是人类赖以生存的最基本的自然资源之一,也是人类环境的重要组成成分。
随着工业化、城市化进程的不断加快,废弃物排放、农业化肥使用量增加,土壤重金属污染越来越严重。
土壤重金属污染是由于人类活动使重金属在土壤中的累计量明显高于土壤环境质量标准或土壤环境背景值,致使土壤环境质量下降和生态环境恶化的现象。
基于随机建模技术的水文地质岩相的模拟初探杜慧丽河海大学土木工程学院,江苏南京 (210098)E-mail :dhl1110@摘 要:对于溶质运移等小尺度的水文地质模型,水文地质参数在土壤孔隙介质空间分布的变异性会严重影响地下水流动与溶质运移,但实际资料通常无法提供模型所需要的详细的水文参数说明。
因此如何适当地估测地下水溶质传输模拟所需的水文参数在空间的分布成为水文地质领域的重要研究课题。
针对此种情况,本文运用地质统计学方法中的序贯高斯和模拟退火算法分别进行模拟,可以根据钻孔资料,建立小尺度的水文地质相模型,并比较分析了两种算法的模拟效果,探讨两者对地质统计模型构建的影响,为进一步进行小尺度的水文地质模型的计算研究提供一种新的思路方法。
关键词:地质统计学,空间变异性,模拟退火,序贯高斯,随机建模1. 引言通常水文地质计算中是将含水层视为均匀水平分布,水文地质参数取为常数。
这主要是因为在当前技术条件下,受限于经费与现实条件难以掌握任意尺度的水文地质参数的真实特征,所以采取的简化方法。
实际上由于地质作用的影响,水文地质参数在土壤孔隙介质的空间分布具有空间变异性。
此变异性严重影响地下水流动与溶质运移的行为,因此计算地下水流动与溶质运移时,地层差异所造成水文地质参数的空间变异性必须加以重视。
如何适当地估测地下水污染传输模拟所需的水文参数在空间的分布成为水文地质领域的重要研究课题。
本文使用地质统计学中的模拟退火算法和高斯序贯算法进行水文地质相的模拟,根据钻孔资料分析得出水文地质相的分布规律,随机模拟满足分布规律的水文地质相,为分析探讨水文地质参数空间变异性对水流和污染物运移方面的影响提供了新的思路。
2. 地质统计学方法简介2.1 区域变量理论地质统计学是以空间随机函数Z(X)表示任意和空间坐标有关的参数,称为区域性变量,其中X=(x,y,z)代表点所在的空间位置。
一般而言,区域性变量具有两类主要特征,第一为随机性,即所在分析区域中任意点的观测值,皆具有不确定性。
第七章 土壤特性的空间变异性土壤特性在空间分布是非均一的,例如在平面上土壤的质地、剖面上土层的厚度,以及土壤含水率、土壤水分运动参数、土壤水基质势(负压)、含盐量等在同一时刻,即使是相距很近的点,其数值也是不同的。
这种土壤特性在空间上分布的差异性称为土壤特性的空间变异性。
为了探讨土壤各种因素的变化规律,必须进行田间试验,布设观测点和取样点,由于土壤特性空间变异性的存在,观测和取样点数目不宜过少,但因受人力、物力的限制,也不宜过多,这样,就存在确定合理取样数目、对未观测点进行估值、利用土壤特性的变异规律对田间土壤水分运动进行分析等问题。
以下将分别对这些问题作简要介绍。
第一节 土壤特性的变异性和合理取样数目一、土壤特性的变异性分析[55,63,68,69]土壤特性受随机因素的影响,在一定的空间内进行多次试验所取得的数值可能是不同的,因而存在一定的偶然性。
如将土壤特性看作是一个随机变量Z ,在空间上变化看作是独立的变化,则其变化特征可由其概率密度函数产P (x )表示。
X 为土壤特性x 的可能取值,发生这一事件的概率为p (x )。
发生随机变量X 的取值小于或等于X 的事件的概率为⎰∞-=≤xdx x p x X p )()( (2-7-1)概率P (X ≤x )称为累积概率,概率密度函数P (x )为一非负函数,P (x )≥0,且 P (-∞〈x 〈∞〉=⎰∞∞-dx x p )(。
累积概率函数P (X ≤x )。
有时写成:)()(x P P x F ≤=F (x )称为随机变量X 的分布函数。
随机变量有多种分布形式,对于土壤特性最常见的有以下两种。
1.正态分布在这种情况下概率密度表达式为222)(exp[21)(σσπm x x p --=] (2-7-2) 式中δ、m ——常数随机变量X 服从正态分布,记为X ~N (m ,δ2)。
在m=0,δ=1时的正态分布,称之为“标准正态分布”,记为 N (0,l )。
第一章:(定狡)空间分析:空间分析是基于地理对象的位巻和形态特征的空间数据分析技术,其目的在于提取和传输空间信息。
地理智慧:也可称为空间智慧,是空间数据一空间信息一空间智慧这一数据分析链上的最高层次。
通过空间分析获得地理智慧,可以解决与位置相关的复杂空间问题。
当代GIS的特点、它对空间分析的影响:首先,它是以动态异构、时空密集、非结构化的大数据为主体:其次,GIS信息计算能力大大提高,基于高性能环境支撑下的空间处理与分析工具计算:最后,它具有个性化服务模式,庞大的地理信息服务网络。
面对GIS的不断发展,空间分析需要转换思维模式:从模型分析的思维转换为数据计算的思维,从地理大数据中挖掘信息,提供决策支持:从基于空间数字化得到的静态的空间信息转换为加入时间维的动态、实时的人地信息思维模式,把人、时间、位置紧密结合起来: 从离线的GIS工具转换到依靠云计算和计•算机网络的在线服务的思维。
什么是PPDAC模型、它与空间分析有什么关系:问题(problem)、规划(plan)、数据(data)、分析(analysis)、和结论(cconclusion):PPDAC模型为空间分析相关问题的解决流程提供了一个框架,并强调形式化分析是流程中非常重要的一部分。
空间分析的研究肉宥包插邨掘方面(主妥方式)(6个):基于传统地图方法的空间分析:基于统计方法的空间分析:时空数据分析:专业模型与GIST具集成分析:智能化空间分析和可视化空间分析。
(空间分柝理论、空间分析方法和空间分析应用)GIS的主矣特征:第二章:(概念)欧式空间:欧式空间是对现实世界(物理空间)的一种数学理解与表达,是GIS 中常用的一种空间描述方法,主要用于描述空间的几何特征,如位置、长度、面积和方位等。
拓扑空间:拓扑空间是另一种理解和描述现实世界(物理空间)的数学方法,拓扑空间是描述空间目标宏观分布或目标之间相互关系的有效工具。
拓扑属性:若空间目标间的关联、相邻与连通等几何属性不随空间目标的平移、旋转、缩放等变换而改变,这些保持不变的性质称为拓扑属性。
克里金插值法(Kriging Interpolation)是一种用于空间数据插值的地统计学方法,常用于地理信息系统(GIS)软件如ArcGIS中。
它基于统计学原理,根据已知点的空间分布和变量值,预测未知位置的变量值。
以下是克里金插值法的基本原理:
1. 空间自相关性:克里金插值法的核心思想是假设同一地理区域内的点之间存在空间自相关性,即相邻点之间的变量值具有一定的关联性。
这意味着离得越近的点之间的变化趋势可能更相似。
2. 半变异函数:插值过程中使用了半变异函数(Semi-Variogram Function)来描述点之间的变异性。
半变异函数展示了不同距离下变量值之间的相关性或协方差。
这个函数可以帮助确定变量值在不同方向上的变异性和相关性。
3. 权重计算:在插值过程中,为了预测未知点的变量值,需要根据已知点的位置、变量值以及它们之间的空间关系来计算权重。
与离目标点距离近且变异性较小的点会得到较大的权重,而距离远或变异性大的点则得到较小的权重。
4. 插值预测:通过计算权重,将已知点的变量值加权平均,从而预测未知点的变量值。
权重的计算基于半变异函数和点之间的距离。
5. 交叉验证:为了评估插值的精度,通常会采用交叉验证方法。
该方法将已知数据分成训练集和测试集,通过对测试集进行插值并与真实值比较,评估克里金插值法的预测能力。
总之,克里金插值法通过考虑空间自相关性和半变异函数,利用已知点之间的关系来预测未知点的变量值。
这使得它在GIS等领域中广泛用于空间数据插值和预测。
1/ 1。
半变异函数(第一部分)
半变异函数是概率论中一种重要的概率分布。
它属于正态分布的一种变形,属于一类非对称性的分布。
半变异函数的形式是:y = (2/σ√2π) (1+x2/σ2) -1/2 α,其中σ代表标准差,α 代表偏度参数。
4个参数的半变异函数关系性更加紧密,根据参数的不同,它的几何形状形可能会发生改变,这也是其它变异函数的不同之处。
半变异函数有若干重要的特点。
其中,分布的峰值与基线均出现在分布的中心位置,与正态分布在两端出现最大值不同。
并且,它还具有较宽的左右两侧分布,使得半变异性分布在极端情况下也更具有延展性。
此外,半变异函数可用来选择特定的观测值,可应用于差异分析,还能够表征观测值的非线性特征,从而能够更准确地反映数据中存在的模式。
半变异函数经过长期发展,已经成为统计分析中重要的工具,它不仅可以应用于波动分析、风险分析,同时还可以作为进行统计计算和模型构建的重要基础。
通过灵活运用半变异函数,研究人员以及经济相关的决策者可以从不同的层面深入研究问题的解决方案,为社会发展注入新的动力,推动社会经济的发展。