半方差函数
- 格式:doc
- 大小:38.00 KB
- 文档页数:3
半方差函数半方差函数(semivariance function)是地理空间统计学中常用的一种工具,用于描述空间数据的离散程度。
它可以帮助我们分析和理解空间数据的变异性。
1. 什么是半方差函数半方差函数是一种衡量空间数据变异性的函数。
它是指在一定距离内的所有样本点之间的差异的平均值。
具体地说,对于给定的距离 h,半方差函数计算所有样本点对之间的差异的平均值,并除以2。
这就是为什么它被称为“半方差”函数的原因。
半方差函数可以用公式表示如下:$$ \\gamma(h) = \\frac{1}{2n(h)} \\sum_{i=1}^{n(h)} (z(x_i) - z(x_i + h))^2 $$其中,$\\gamma(h)$ 表示半方差函数,n(n)表示距离为h 的样本点对的个数,n(n n)表示在位置n n处的样本值,n(n n+n)表示在位置n n处距离为 h 的样本值。
半方差函数的值越大,表示样本点之间的差异越大,即空间数据的变异性越强。
2. 半方差函数的应用半方差函数在地理空间统计学中有广泛的应用。
它可以帮助我们分析和理解空间数据的变异性,从而更好地进行地理空间分析和模型建立。
2.1 描述空间数据的变异性半方差函数可以帮助我们描述空间数据的变异性。
通过计算不同距离上的半方差值,我们可以了解不同距离上的样本点之间的差异大小。
这有助于我们理解空间数据的空间分布特征,并可以为后续的空间插值和预测提供基础。
2.2 空间插值和预测半方差函数在空间插值和预测中起着重要的作用。
通过分析半方差函数的形状和变化趋势,我们可以选择合适的空间插值方法和模型,以获得更准确的预测结果。
比如,当半方差函数在一定距离范围内保持稳定时,可以采用普通克里金插值方法;当半方差函数在一定距离范围内呈现出可区分的趋势时,可以采用泛克里金插值方法。
2.3 空间优化和数据采样半方差函数还可以用于空间优化和数据采样。
通过分析半方差函数,我们可以选择合适的数据采样密度,以获得更好的空间数据表示。
半方差半方差函数(Semi-variogram)及其模型半方差函数也称为半变异函数,它就是地统计学中研究土壤变异性的关键函数、2、1、1半方差函数的定义与参数如果随机函数Z(x)具有二阶平稳性,则半方差函数((h)可以用Z(x)的方差S2与空间协方差C(h)来定义:((h)= S2-C(h)((h)反映了Z(x)中的空间相关部分,它等于所有以给定间距h相隔的样点测值之差平方的数学期望:(1)实际可用:(2)式中N(h)就是以h为间距的所有观测点的成对数目、某个特定方向的半方差函数图通常就是由((h)对h作图而得、在通常情况下,半方差函数值都随着样点间距的增加而增大,并在一定的间距(称为变程,arrange)升大到一个基本稳定的常数(称为基台,sill)、土壤性质的半方差函数也可能持续增大,不表现出确定的基台与变程,这时无法定义空间方差,说明存在有趋势效应与非平稳性、另一些半方差函数则可能完全缺乏空间结构,在所用的采样尺度下,样品间没有可定量的空间相关性、从理论上讲,实验半方差函数应该通过坐标原点,但就是许多土壤性质的半方差函数在位置趋于零时并不为零、这时的非零值就称为"块金方差(Nugget variance)"或"块金效应"、它代表了无法解释的或随机的变异,通常由测定误差或土壤性质的微变异所造成、对于平稳性数据,基底方差与结构方差之与约等于基台值、2、1、2 方差函数的理论模型土壤在空间上就是连续变异的,所以土壤性质的半方差函数应该就是连续函数、但就是,样品半方差图却就是由一批间断点组成、可以用直线或曲线将这些点连接起来,用于拟合的曲线方程就称为半方差函数的理论模型、在土壤研究中常用的模型有:①线性有基台模型:式中C1/a就是直线的斜率、这就是一维数据拟合的最简单模型:((h)=C0 +C1·h/a 0在极限情况下,C1/a可以为0,这时就有纯块金效应模型:((h)=C0, h>0 (4)((0)=0 h=0②球状模型((h)= C0 +C1[1、5h/a-0、5(h/a)3] 0a (5)((0)=0 h=0③指数模型((h)=C0+C1[1-exp-h/a ] h>0 (6)((0)=0 h=0④双曲线模型(7)⑤高斯模型((h)=C0+C1[1-exp(-h2/a2)] h>0 (8)((0)=0 h=0选定了半方差函数的拟合模型后,通常就是以最小二乘法计算方程的参数,并应用Ross等的最大似然程序(MLP),得到效果最好的半方差方程、2、1、3 模型的检验(cross-validation,又称作jacknifing)为了检验所选模型三个参数的合理性,必须作一定的检验、但就是到现在为止还没有一个有效的方法检验参数的置信区间;同时,由于我们不知道半方差模型的确切形式,所选定的模型只就是半方差函数的近似式,故无法以确切的函数形式对模型参数进行统计检验、交叉验证法的检验方法,一种间接的结合普通克立格的方法,为检验所选模型的参数提供了一个途径、这个方法的优点就是在检验过程中对所选定的模型参数不断进行修改,直至达到一定的精度要求、交叉验证法的基本思路就是:依次假设每一个实测数据点未被测定,由所选定的半方差模型,根据n-1个其它测定点数据用普通克立格估算这个点的值、设测定点的实测值为,估算值为,通过分析误差,来检验模型的合理性、2、1、4半方差函数的模型的选取原则与参数的确定半方差函数的模型的选取原则就是:首先根据公式计算出((h)的散点图,然后分别用不同类型的模型来进行拟合,得到模型的参数值及离差平方与,首先考虑离差平方与较小的模型类型,其次,考虑块金值与独立间距,最后用交叉验证法来修正模型的参数、2、2 Kriging最优内插估值法如果区域化变量满足二阶平稳或本征假设,对点或块段的估计可直接采用点克立格法(Puctual Kriging )或者块段克立格法(Block Kriging)、这两种方法就是最基本的估计方法,也称普通克立格法(Origing Kriging,简称OK)、半方差图除用于分析土壤特性空间分布的方向性与相关距离外,还可用于对未测点的参数进行最优内插估值与成图,该法原理如下:Kriging最优内插法的原理设x0为未观测的需要估值的点,x1, x2,…, xN 为其周围的观测点,观测值相应为y(x1 ),y(x2),…,y(xN)、未测点的估值记为(x0),它由相邻观测点的已知观测值加权取与求得:(9)此处,(i为待定加权系数、与以往各种内插法不同,Kriging内插法就是根据无偏估计与方差最小两项要求来确定上式中的加权系数(i的,故称为最优内插法、1、无偏估计设估值点的真值为y(x0)、由于土壤特性空间变异性的存在,以及,•1。
半方差函数半方差函数(SemivarianceFunction)是一种统计描述,也可以定义为一种统计描述的方法,它能够测量随机变量X(也可以是定性变量)在各个不同观测值之间的差异。
半方差函数使用观测值之间的差值来衡量变量在一定程度上相同的程度,而不是把它们看作是基于它们的绝对值。
半方差函数的应用通常伴随着布莱尔谱,它是一种频率图,用于衡量离散变量的相关性,而半方差函数可以用来度量不同观测值之间的相关性。
半方差函数可以帮助数据分析人员快速了解变量之间的关系,因为它们可以帮助识别变量之间的关系,以及变量是否有模式或趋势,并通过探索数据的相关性来更好地理解数据的表现。
此外,半方差函数还可以推断出在特定范围内特定观测值的概率,从而帮助数据分析人员估计未来的变量的表现。
半方差函数的计算很简单。
以一维情况为例,其公式为:S(h) = 1/[2*N(h)]ΣΣ[|X(i)-X(i+h)|/2]其中,h为比较量,即一个观测值和另一个观测值之间的距离;X(i)为第i个观测值;N(h)为距离h的观测值的数量。
半方差函数能够有效地描述变量之间的相关性,可以用来分析歧异和异质性,也可以有助于研究者识别不同变量之间的关系,并为决策树模型提供了客观的输入。
例如,当双变量X1和X2的半方差函数于特定的观测值h处出现连续的增长时,说明X1与X2之间具有一定的相关性或异质性,反之亦然。
半方差函数的应用也有许多。
它可以用于股价预测,根据不同变量的相关性和绝对差异,预测未来股价的变化趋势;可以用来分析受试项目,在设计实验时通过半方差函数来准确分析受试项目之间的差异;半方差函数还可以用来估计连续变量的变化趋势,从而准确判断变量的变化趋势。
总的来说,半方差函数是一种有用的统计描述方法,它能够有效地识别变量之间的关系、推断出变量的概率以及分析受试者之间的差异。
通过半方差函数,数据分析人员可以对变量之间的关系有更深入的了解,并能够利用这种了解进行准确而高效的模型预测。
半方差半方差函数(Semi-variogram)及其模型半方差函数也称为半变异函数,它是地统计学中研究土壤变异性的关键函数.2.1.1半方差函数的定义和参数如果随机函数Z(x)具有二阶平稳性,则半方差函数((h)可以用Z(x)的方差S2和空间协方差C(h)来定义:((h)= S2-C(h)((h)反映了Z(x)中的空间相关部分,它等于所有以给定间距h相隔的样点测值之差平方的数学期望:(1)实际可用:(2)式中N(h)是以h为间距的所有观测点的成对数目.某个特定方向的半方差函数图通常是由((h)对h作图而得.在通常情况下,半方差函数值都随着样点间距的增加而增大,并在一定的间距(称为变程,arrange)升大到一个基本稳定的常数(称为基台,sill).土壤性质的半方差函数也可能持续增大,不表现出确定的基台和变程,这时无法定义空间方差,说明存在有趋势效应和非平稳性.另一些半方差函数则可能完全缺乏空间结构,在所用的采样尺度下,样品间没有可定量的空间相关性.从理论上讲,实验半方差函数应该通过坐标原点,但是许多土壤性质的半方差函数在位置趋于零时并不为零.这时的非零值就称为"块金方差(Nugget variance)"或"块金效应".它代表了无法解释的或随机的变异,通常由测定误差或土壤性质的微变异所造成.对于平稳性数据,基底方差与结构方差之和约等于基台值.2.1.2 方差函数的理论模型土壤在空间上是连续变异的,所以土壤性质的半方差函数应该是连续函数.但是,样品半方差图却是由一批间断点组成.可以用直线或曲线将这些点连接起来,用于拟合的曲线方程就称为半方差函数的理论模型.在土壤研究中常用的模型有:①线性有基台模型:式中C1/a是直线的斜率.这是一维数据拟合的最简单模型:((h)=C0 +C1·h/a 0在极限情况下,C1/a可以为0,这时就有纯块金效应模型:((h)=C0, h>0 (4)((0)=0 h=0②球状模型((h)= C0 +C1[1.5h/a-0.5(h/a)3] 0a (5)((0)=0 h=0③指数模型((h)=C0+C1[1-exp-h/a ] h>0 (6)((0)=0 h=0④双曲线模型(7)⑤高斯模型((h)=C0+C1[1-exp(-h2/a2)] h>0 (8)((0)=0 h=0选定了半方差函数的拟合模型后,通常是以最小二乘法计算方程的参数,并应用Ross等的最大似然程序(MLP),得到效果最好的半方差方程.2.1.3 模型的检验(cross-validation,又称作jacknifing)为了检验所选模型三个参数的合理性,必须作一定的检验.但是到现在为止还没有一个有效的方法检验参数的置信区间;同时,由于我们不知道半方差模型的确切形式,所选定的模型只是半方差函数的近似式,故无法以确切的函数形式对模型参数进行统计检验.交叉验证法的检验方法,一种间接的结合普通克立格的方法,为检验所选模型的参数提供了一个途径.这个方法的优点是在检验过程中对所选定的模型参数不断进行修改,直至达到一定的精度要求.交叉验证法的基本思路是:依次假设每一个实测数据点未被测定,由所选定的半方差模型,根据n-1个其它测定点数据用普通克立格估算这个点的值.设测定点的实测值为,估算值为,通过分析误差,来检验模型的合理性.2.1.4半方差函数的模型的选取原则和参数的确定半方差函数的模型的选取原则是:首先根据公式计算出((h)的散点图,然后分别用不同类型的模型来进行拟合,得到模型的参数值及离差平方和,首先考虑离差平方和较小的模型类型,其次,考虑块金值和独立间距,最后用交叉验证法来修正模型的参数.2.2 Kriging最优内插估值法如果区域化变量满足二阶平稳或本征假设,对点或块段的估计可直接采用点克立格法(Puctual Kriging )或者块段克立格法(Block Kriging).这两种方法是最基本的估计方法,也称普通克立格法(Origing Kriging,简称OK).半方差图除用于分析土壤特性空间分布的方向性和相关距离外,还可用于对未测点的参数进行最优内插估值和成图,该法原理如下: Kriging最优内插法的原理设x0为未观测的需要估值的点,x1, x2,…, xN 为其周围的观测点,观测值相应为y(x1 ),y(x2),…,y(xN).未测点的估值记为(x0),它由相邻观测点的已知观测值加权取和求得:(9)此处,(i为待定加权系数.和以往各种内插法不同,Kriging内插法是根据无偏估计和方差最小两项要求来确定上式中的加权系数(i的,故称为最优内插法.1. 无偏估计设估值点的真值为y(x0).由于土壤特性空间变异性的存在,以及, y(x0)均可视为随机变量.当为无偏估计时,(10)将式(9)代入(10)式,应有(11)2. 估值和真值y(x0)之差的方差最小.即(12)利用式(3-10),经推导方差为(13)式中,((xi,xj)表示以xi和xj两点间的距离作为间距h时参数的半方差值,((xi, x0)则是以xi和x0两点之间的距离作为间距h时参数的半方差值.观测点和估值点的位置是已知的,相互间的距离业已知,只要有所求参数的半方差((h)图,便可求得各个((xi,xj)和((xi,x0)值.因此,确定式(9)中各加权系数的问题,就是在满足式(11)的约束条件下,求目标函数以式(13)表示的方差为最小值的优化问题.求解时可采用拉格朗日法,为此构造一函数,(为待定的拉格朗日算子.由此,可导出优化问题的解应满足:i=1,2,N (14)由式(14)和式(11)组成n+1阶线性方程组,求解此线性方程组便可得到n个加权系数(i和拉格朗日算子(.该线性方程组可用矩阵形式表示:(15)式中,( ij为((xi,xj)的简写.求得各(i值和(值后,由式(9)便可得出x0点的最优估值y(x0).而且还可由式(13)求出相应该估值的方差之最小值(2min.将式(14)代入式(13),最小方差值还可由下式方便地求出:(16)上述最优化问题求解还可用其他方法,在应用Kriging内插法时还有其他方面的问题,在此都不一一列举了.。
Matlab半方差球状拟合模型1. 什么是半方差球状拟合模型?半方差球状拟合模型是用于描述空间数据的变异性的一种统计模型。
在地质学、地理学、环境科学等领域中,经常需要对地理空间上的数据进行分析和建模。
半方差球状拟合模型可以帮助我们理解和预测空间数据的变异性,从而为决策和规划提供支持。
在半方差球状拟合模型中,我们假设数据的变异性可以通过半方差函数来描述。
半方差函数表示两个点之间的变异性随着距离的增加而增加或减小的程度。
而球状拟合模型则是一种常见的半方差函数形式,它假设变异性在一定距离范围内是均匀的,在超过这个距离范围之后变异性为0。
2. Matlab中的半方差球状拟合模型Matlab是一种功能强大的数值计算和科学计算软件,它提供了丰富的工具和函数来进行空间数据分析和建模。
在Matlab中,我们可以使用gstat工具箱来进行半方差球状拟合模型的建模和分析。
首先,我们需要准备好空间数据。
假设我们有一组地点坐标和对应的观测值,我们可以将这些数据存储在一个矩阵中,其中每一行表示一个地点的坐标和观测值。
data = [x1, y1, z1, value1;x2, y2, z2, value2;...xn, yn, zn, valuen];接下来,我们可以使用variogramfit函数来拟合半方差球状模型。
该函数需要指定数据矩阵、变量列和距离列作为输入参数。
我们还可以选择拟合的半方差函数形式和其他参数。
[vmodel, vstruct] = variogramfit(data(:, 1:3), data(:, 4), ...'model', 'spherical', ...'plotit', true);在拟合完成后,variogramfit函数会返回拟合的半方差模型和相关的结构信息。
我们可以使用这些信息来进行进一步的分析和预测。
3. 半方差球状拟合模型的分析和应用通过拟合半方差球状模型,我们可以获得关于空间数据变异性的有用信息。
文章编号:0564-3945(2001)04-0145-04内蒙古土壤pH 值、粘粒和有机质含量的空间结构特征徐尚平,陶 澍,曹 军(北京大学城市与环境学系,北京 100871)摘 要:采用半方差函数和普通克里格方法分析了内蒙古地区土壤p H 、粘粒和有机质含量的空间结构特征.结果表明,内蒙古土壤pH 、粘粒和有机质含量的空间结构特征可以用线性半方差函数模型加以描述,且具有明显的各向异性.插值结果显示,它们的空间变异尺度与土类分布具有较好的一致性.内蒙古地区土壤pH 值表现为自东向西逐渐升高的趋势,而粘粒和有机质含量测沿同一方向逐渐降低.表生地球化学作用的空间变异是决定内蒙古土壤上述参数分布特征与尺度的主要因素.关 键 词:土壤;半方差函数;克里格分析;pH;有机质;粘粒中图分类号:S153 文献标识码:A1 前 言土壤pH 值、粘粒和有机质含量是土壤发育过程中各种表生地球化学作用综合影响的体现,也是影响土壤微量元素含量分布的重要因素[1].对土壤pH 、粘粒和有机质含量空间结构的探讨不仅有助于阐明各种因素对它们的作用方式和程度,也有助于了解微量元素含量的空间分布特征的成因.地统计学的提出是以矿床储量和矿石品位的精确估计为目的的.以空间结构为基础,以区域化变量为核心,以半方差函数为工具的地统计学在包括土壤科学和环境科学的许多领域中得到了广泛应用.这样的研究不仅针对土壤微量元素[2-5],也涉及土壤基本理论参数.譬如,Dobbermann 等对菲律宾某地土壤pH 值进行的空间分析,探讨其小尺度空间变异及其与地形和人为因素的关系[6].迄今为止,关于土壤常规理化参数空间结构的研究多集中在中小尺度.本研究则尝试在百-千公里尺度上分析了内蒙古土壤粘粒、有机质含量和pH 值的空间变异特征.2 研究区域与研究方法研究地区包括内蒙古自治区全境,位于蒙古高原东南部及周沿地带,介于北纬37b 24c -53b 20c ,东经97b 10c -126b 04c 之间.大部分属中温带大陆性季风气候,大兴安岭北段属寒温带大陆性气候.水热条件自东向西呈湿润、半湿润、半干旱、干旱和极干旱带状分布.由于地理环境、气候生物等因素的差异,该地区土壤呈明显经向分异特征.自东向西依次分布黑土、暗棕壤、黑钙土、栗钙土、棕钙土、棕漠土和灰漠土.部分地区有褐土、灰钙土、草甸土和风沙土分布.本研究在内蒙古地区349个样点采集了A 、B 、C 三层土壤样品.土样经自然晾干,人工碾碎后剔除动植物残体,过20目筛后进行土壤粘粒含量和pH 测定.上述样品用玛瑙研磨机研细过150目筛后用于有机质含量测定,测定方法同有关标准[7].地质统计学研究非正态分布的数据可能导致比例效应,从而影响分析结果的可靠性[8].先期分析结果表明,各层土壤的pH 值,有机质和粘粒含量均不符合正态分布,因此,对有机质和粘粒含量数据作角变换,对pH 值作Box-Cox 变换(三层分别取幂值119、314和313)[9].本研究采用美国国家环保局主持编写的GEO -EAS 软件进行数据处理和分析,插值等值线图采用Surfer 实现.研究变量沿某一方向半方差函数的计算按照Journel AG [8]提出的公式,且角度域值均为2215b .例如,假设自西向东为0b ,由南向北为90b ,则如果空间两点构成的矢量位于以东西向为主轴,左右偏差分别2215b 的区域内,则认为这一矢量的方向属东西向.因此,实际上通过选择2215b 的域值把二维空间分为四个独立的区域.3 结果与讨论311 土壤粘粒、有机质和pH 均值和纵向分异本研究先对变换后数据求均值,然后进行数据逆变换得到各变量的均值.研究地区土壤A 、B 、C 三个发生层有机质平均含量分别为2164%、1111%和0170%,粘粒含量分别为9132%、15125%、9158%,pH 值为717、719和810.其中有机质含量在表层富集,粘粒在淀积层最高,而pH 值逐层升高,分别反映了成土过程中强烈的腐殖化、粘化和钙积化过程.收稿日期:1999-09-19基金项目:国家杰出青年基金(4952102)资助作者简介:徐尚平(1973-)男,山东五连人,硕士,主要从事环境地球化学和空间分析方面的研究.第32卷第4期2001年8月 土 壤 通 报Chinese Journal of Soil ScienceVol.32,No.4Aug,2001312 空间结构的宏观特征为了从总体上分析内蒙古地区土壤的pH 值、粘粒和有机质含量的空间结构特征,分别用变换后数据计算了土壤不同发生层pH 值、粘粒和有机质含量的实验半方差函数,并采用最小二乘法对其进行了拟合.所有拟合参数列于表1.除B 层土壤的粘粒含量的空间半方差函数可以用球状模型加以描述外,其余变量的实验半方差函数均表现出线性特征.图1列出了土壤A 层p H 值、粘粒和有机质含量的实验和拟合半方差函数. 如图1所示,在不考虑各向异性特征时,所有实验半方差函数均可用块金效应和线性模型来表示,且其表1内蒙古土壤各层有机质、粘粒含量及pH 值半方差函数拟合结果土壤层次变量块金常数模 型类型变程基台值A 层有机质0.0031线性>10000.01粘粒0.008线性>10000.0072pH 值6线性>100041B 层有机质0.0016线性>10000.005粘粒0.003球状2000.009pH 值4000线性>100015000C 层有机质0.002线性>10000.0032粘粒0.012线性>10000.019pH 值2800线性>100011000图1 土壤A 层pH 值,有机质和粘粒含量实验及理论半方差函数图2 内蒙古表层土壤中粘粒、有机质含量和pH 值的带状各向异性146 土 壤 通 报 32卷空间变程均在1000km 以上.这说明,内蒙及周边地区土壤pH 值、有机质和粘粒含量的空间规律变化的范围在1000km 以上,对它们空间变程的确定需要在更大尺度上进行采样和分析.不可否认,母质、地形、人类影响等因素可以造成土壤粘粒、有机质含量和pH 值的小尺度空间变异.但本研究采用的采样密度(百公里以上)专门用来揭示百分里以上尺度的空间变异特征.计算结果说明,普遍存在的块金效应可能与小尺度(如母质)变异有关.另一方面,块金效应也可能在某种程度上反映了实验误差的影响.313 宏观空间结构的方向性特征为了进一步探明内蒙古地区土壤粘粒和有机质含量以及pH 值沿不同方向的空间变异特征,分别计算了它们沿南-北,东-西,西北-东南以及东北-西南方向的半方差函数.不同发生层的计算结果相似,均表现出明显的带状各向异性.仅以土壤A 层为例,其结果如图2所示.T rangmar 对印度尼西亚W est Sumatra 地区土壤中的粘粒含量和pH 的空间结构特征进行的分析表明,二者的空间变异具有明显的各向异性的特点[10].但该研究仅针对小尺度的变异,其空间结构中的各向异性反映了研究地区母质、地形等小尺度局地条件的影响.相比之下,本研究中发现的结构特征及方向性变异则代表地带性水热条件的变异.内蒙古地区位于我国温带季风性气候区和温带大陆性气候区的交界处,水热条件沿东南-西北方向变化梯度最大,表现为典型的经向地带性分异,这样的分异决定了内蒙土壤类型的大尺度的东北-西南向递变.有关研究曾采用独立方差计算证明土类是影响内蒙地区草原土壤理化性质参数经向分异的主导因素[11].本研究的结果同样显示,内蒙地区土壤理化参数沿东北-西南方向具有最大变程(1000km 左右),而沿与之垂直的西北-东南方向的变程却相当短([400km).这一现象与内蒙地区土壤类型的空间分布模式是一致的.314 空间插值在空间结构分析的基础上,对内蒙地区土壤各类层次粘粒、有机质含量和pH 值变换后的数据进行了克里格插值.A 层土壤中各变量及B 层土壤有机质含量的插值结果在图3中列出.值得指出的是,对变换后数据进行的空间分析的结果无法直接用于各区域化变量的空间插值,因为插值结果取决于块金常数和方差,而本研究中半方差函数的计算又基于变换后的数据.我们在图中建立了原始数值与变换后数值的映射表以利于结果的分析及与其他研究结果的比较.显然,各变量均表现为自东向西的渐变趋势,其中土壤有机质和粘粒含量自东向西逐渐降低,而土壤pH 值则沿东西向逐渐升高.Yost 对夏威夷地区土壤pH 和区域降水量进行的空间分析结果显示,降水量对土壤pH 值具有重要影响[12、13].而内蒙地区各层次土壤中粘粒、有机质含量以及土壤pH 的空间分布模式与内蒙地区水热条件的渐变规律和土类的空间变异特征相一致.这说明,表生地球化学作用是影响内蒙地区土壤粘粒、有机质含量和pH 值的主要因素.图3 内蒙古表层土壤有机质含量、粘粒含量和pH 值的克里格插值图4 结 论内蒙古地区B 层土壤中粘粒含量高于A 、C 两层;有机质含量从土壤表层到底层逐渐下降,而土壤pH值则逐渐升高.总体而言,内蒙土壤pH 值、粘粒和有机质含量的空间结构特征可以用线性模型加以描述,具有明显的各向异性,其空间变异的尺度与土类分布特征基本一致.表生地球化学作用则是决定内蒙土壤1474期 徐尚平等:内蒙古土壤pH 值、粘粒和有机质含量的空间结构特征上述三个理化参数空间分布的主要因素.参考文献:[1]何振立,周启星,谢正苗,污染及有益元素的土壤化学平衡[M].北京:中国环境科学出版社,1998.[2]T ao Shu.S patial Structure of copper,lead,and mercurycontents in surface soil in the Sh enzhen area[J]W ater,Airand Soil Pol lution,1995a,82:583-591.[3]T ao Shu.Krigi ng and mapping of copper,lead an d mer-cury contents in surface s oil in Shenzhen area.[J]Water,Air and Soil Pol ution,1995b,83:161-172.[4]T ao Shu.Factor Score M apping of S oil Trace ElementContents for the S henzhen Area[J].Water,Air,and SoilPollution,1998,102:415-425.[5]王学军,席爽.北京东郊污灌土壤重金属含量的克里格插值及重金属污染评价.中国环境科学[J].1997,17:225-228.[6]Dobermann A,Goovaerts P,George T.Sources of soil var-iation in an acid Ulti sol of th e Philippi nes[J].Geoderma,1995,68:173-191.[7]魏复盛.中国土壤元素背景值[M].北京:中国环境科学出版社.1990.[8]Journel A.G,Huijbregts C J.M i ning geostatistics[M].Academic Press.London,1978.[9]陶澍.应用数理统计方法[M].北京:中国环境科学出版社.1994.[10]Trangmar B B,Yost R S,Uehara G.Spati al dependenceand interpolati on of soil properties in W est Sumatra,In-donesia,I,Anisotropic variati on[J].Soil S cience Societyof America Journal,1986,50:1391-1395.[11]陶澍,林春野,冯泉.我国北部草原系列土壤中成图作用对微量元素影响的经向分异[J].土壤学报,1995,32,126-131.[12]Yost R S,Uehara G,Fox R L.Geostatistical analysi s ofsoil chemical properties of large land areas.I.S emi-var-iograms[J].Soil Science Society of America Journal,1982a,46:1028-1032.[13]Yost R S,Uehara G,Fox R L.,Geostatistical analysis ofsoil ch emical properties of large land areas.Ò.Kriging[J].S oil S cience Society of America Journal,1982b,46,1033-1037.Spatial Structure Pattern of Soil pH,C lay And OrganicMatter C ontents in the Inner Mongolia AreaXU Shang-ping,TA O Shu,CA O Jun(Department of Urban and En vironmental Scie nc e,Peking Univ ersity,Beij ing100871,China)Abstract:Spatial distribution patter n of clay,org anic matter contents and pH o f soils in the Inner M ongolia Area w as analyzed using var iogram analysis and or dinary kriging.T he variogr ams of these parameters were w ell depicted by a linear model with a rang e of around1000km.Significant anisotropy can be recog nized.T he spatial di stribution patterns of soil pH,clay and o rganic matter contents match the chang e in soil class westwards.Keywords:Soil;V ar iogram;K rig ing;pH;Clay;Org anic matter148土壤通报32卷。
城市表层土壤重金属污染的空间分布特征分析摘要:分析了某城市城区表层土壤中的As、Cd 等8种重金属在生活区、工业区、山区、主干道路区及公园绿地区的含量水平,得出了不同区域重金属的污染程度;运用污染负荷指数法对影响土壤各重金属主要因子进行分析,确定不同区域重金属污染的主要特征;建立重金属污染物的传播模型,运用Kriging插值法对重金属含量进行最优无偏估计插值,对重金属污染的空间分布进行分析,揭示了城市表层土壤中重金属含量的空间分布特征。
关键词:城市城区;表层土壤;重金属污染;空间分布特征随着城市经济的快速发展和城市人口的不断增加,大量工业“三废”、城市生活垃圾和污泥等污染物的排放与不恰当处置使重金属在土壤中不断积累,加重了土壤重金属的污染负荷,导致我国城市表层土壤的重金属污染日趋严重。
而城市土壤重金属污染是能有效反映城市环境污染状况的重要指标之一。
因此,对城市土壤环境异常的查证并应用查证数据开展城市环境质量评价、研究人类活动影响城市土壤环境的演变模式日益成为人们关注的焦点。
1 数据来源与研究方法以某城市城区为研究区,将其划分为间距1 km左右的网格子区域,按照每平方公里1个采样点对表层土壤(0~10 cm土层)进行取样、编号,并用GPS 记录采样点的位置。
应用专门仪器测试分析,获得了每个样本所含的多种重金属元素的浓度数据。
另外,按照2 km的间距在那些远离人群及工业活动的自然区取样,将分析数据作为该城区表层土壤中重金属元素的背景值。
研究以2011年高教社杯全国大学生数学建模竞赛A题[1]所列的数据为数据来源,文献[1]列出了采样点的位置、海拔高度及其所属功能区的信息、8种主要重金属元素在采样点处的浓度和8种主要重金属元素的背景值。
按照功能划分,现代城市整个城区一般可分为生活区、工业区、山区、主干道路区及公园绿地区等,分别记为1类区、2类区、3类区、4类区、5类区,不同的区域环境受人类活动影响的程度不同。
半方差函数模型半方差函数模型是地质统计学中常用的一种空间插值方法。
它基于假设:在空间上相邻两点之间的变异程度与这两点之间的距离有关,距离越远,变异程度越大。
一、半方差函数定义半方差函数是描述变量随着距离增加而发生变化的函数。
它定义为:γ(h) = 1/2 * Var(Z(x) - Z(x+h))其中,γ(h)表示距离为h时的半方差值;Var表示方差;Z(x)和Z(x+h)分别表示距离为0和h时的随机变量值。
二、半方差函数图像通过绘制半方差函数图像可以观察到随着距离增加,半方差值逐渐增大,并趋于稳定。
通常将这个稳定状态称为平台期。
三、模型参数确定确定模型参数需要进行以下步骤:1. 选择合适的样本点集合;2. 计算每对样本点之间的距离,并计算对应的半方差值;3. 绘制半方差图像,并拟合出平台期;4. 根据平台期确定模型参数。
四、常见模型类型常见的半方差函数模型类型包括:1. 球型模型:γ(h) = c[3/2(h/a)-1/2(h/a)^3],其中a为拟合得到的平台期长度,c为方差;2. 指数模型:γ(h) = c[1-exp(-h/a)],其中a为拟合得到的平台期长度,c为方差;3. 高斯模型:γ(h) = c[1-exp(-h^2/a^2)],其中a为拟合得到的平台期长度,c为方差。
五、半方差函数插值半方差函数插值是通过已知样本点的半方差函数图像来估计未知点处的值。
具体步骤如下:1. 计算未知点与样本点之间的距离;2. 根据距离和拟合得到的半方差函数模型计算半方差值;3. 利用半方差函数图像和已知样本点的值进行加权平均计算未知点处的值。
六、优缺点分析半方差函数模型具有以下优缺点:优点:1. 基于物理假设,符合实际情况;2. 可以处理不规则采样数据;3. 插值结果比较稳定。
缺点:1. 对于不同类型数据需要选择不同的半方差函数模型;2. 对于大规模数据,计算量较大;3. 插值结果受到样本点分布和选取的影响。
半方差半方差函数(Semi-variogram)及其模型半方差函数也称为半变异函数,它是地统计学中研究土壤变异性的关键函数.2.1.1半方差函数的定义和参数如果随机函数Z(x)具有二阶平稳性,则半方差函数((h)可以用Z(x)的方差S2和空间协方差C(h)来定义:((h)= S2-C(h)((h)反映了Z(x)中的空间相关部分,它等于所有以给定间距h相隔的样点测值之差平方的数学期望:(1)实际可用:(2)式中N(h)是以h为间距的所有观测点的成对数目.某个特定方向的半方差函数图通常是由((h)对h作图而得.在通常情况下,半方差函数值都随着样点间距的增加而增大,并在一定的间距(称为变程,arrange)升大到一个基本稳定的常数(称为基台,sill).土壤性质的半方差函数也可能持续增大,不表现出确定的基台和变程,这时无法定义空间方差,说明存在有趋势效应和非平稳性.另一些半方差函数则可能完全缺乏空间结构,在所用的采样尺度下,样品间没有可定量的空间相关性.从理论上讲,实验半方差函数应该通过坐标原点,但是许多土壤性质的半方差函数在位置趋于零时并不为零.这时的非零值就称为"块金方差(Nugget variance)"或"块金效应".它代表了无法解释的或随机的变异,通常由测定误差或土壤性质的微变异所造成.对于平稳性数据,基底方差与结构方差之和约等于基台值.2.1.2 方差函数的理论模型土壤在空间上是连续变异的,所以土壤性质的半方差函数应该是连续函数.但是,样品半方差图却是由一批间断点组成.可以用直线或曲线将这些点连接起来,用于拟合的曲线方程就称为半方差函数的理论模型.在土壤研究中常用的模型有:①线性有基台模型:式中C1/a是直线的斜率.这是一维数据拟合的最简单模型:((h)=C0 +C1·h/a 0在极限情况下,C1/a可以为0,这时就有纯块金效应模型:((h)=C0, h>0 (4)((0)=0 h=0②球状模型((h)= C0 +C1[1.5h/a-0.5(h/a)3] 0a (5)((0)=0 h=0③指数模型((h)=C0+C1[1-exp-h/a ] h>0 (6)((0)=0 h=0④双曲线模型(7)⑤高斯模型((h)=C0+C1[1-exp(-h2/a2)] h>0 (8)((0)=0 h=0选定了半方差函数的拟合模型后,通常是以最小二乘法计算方程的参数,并应用Ross等的最大似然程序(MLP),得到效果最好的半方差方程.2.1.3 模型的检验(cross-validation,又称作jacknifing)为了检验所选模型三个参数的合理性,必须作一定的检验.但是到现在为止还没有一个有效的方法检验参数的置信区间;同时,由于我们不知道半方差模型的确切形式,所选定的模型只是半方差函数的近似式,故无法以确切的函数形式对模型参数进行统计检验.交叉验证法的检验方法,一种间接的结合普通克立格的方法,为检验所选模型的参数提供了一个途径.这个方法的优点是在检验过程中对所选定的模型参数不断进行修改,直至达到一定的精度要求.交叉验证法的基本思路是:依次假设每一个实测数据点未被测定,由所选定的半方差模型,根据n-1个其它测定点数据用普通克立格估算这个点的值.设测定点的实测值为,估算值为,通过分析误差,来检验模型的合理性.2.1.4半方差函数的模型的选取原则和参数的确定半方差函数的模型的选取原则是:首先根据公式计算出((h)的散点图,然后分别用不同类型的模型来进行拟合,得到模型的参数值及离差平方和,首先考虑离差平方和较小的模型类型,其次,考虑块金值和独立间距,最后用交叉验证法来修正模型的参数.2.2 Kriging最优内插估值法如果区域化变量满足二阶平稳或本征假设,对点或块段的估计可直接采用点克立格法(Puctual Kriging )或者块段克立格法(Block Kriging).这两种方法是最基本的估计方法,也称普通克立格法(Origing Kriging,简称OK).半方差图除用于分析土壤特性空间分布的方向性和相关距离外,还可用于对未测点的参数进行最优内插估值和成图,该法原理如下:Kriging最优内插法的原理设x0为未观测的需要估值的点,x1, x2,…, xN 为其周围的观测点,观测值相应为y(x1 ),y(x2),…,y(xN).未测点的估值记为(x0),它由相邻观测点的已知观测值加权取和求得:(9)此处,(i为待定加权系数.和以往各种内插法不同,Kriging内插法是根据无偏估计和方差最小两项要求来确定上式中的加权系数(i的,故称为最优内插法.1. 无偏估计设估值点的真值为y(x0).由于土壤特性空间变异性的存在,以及, y(x0)均可视为随机变量.当为无偏估计时,•1。
半方差函数空间自相关半方差函数(semivariogram)是空间统计学中的一种基本工具,在地理信息系统和环境科学中广泛应用,用于描述和分析随机现象的空间变异性和相关性。
半方差函数通过计算空间上相距一定距离内的数据值之间的方差,反映出不同距离(或时间)的数据之间的相依度,是空间自相关分析的重要工具。
空间自相关是指空间上相邻点所对应数据值的相似程度。
空间自相关性可以用半方差函数来描述,半方差函数就是一个描述数据值之间距离增加而变化的程度的函数。
它定义了数据点之间的距离、空间位置和方向等概念,通过计算相邻点之间的方差来反映数据的空间相关程度。
在半方差函数中,通常使用Lag表示点之间的距离,用Gamma函数来表示半方差,Gamma函数被定义为:$$\gamma(h) = \frac{1}{2N(h)}\sum_{i=1}^{N(h)}(z(x_i) - z(x_i + h))^2$$其中,$h$表示点之间的距离,$z(x_i)$和$z(x_i + h)$分别表示位于$x_i$和$x_i + h$两个点上的数据值,$N(h)$表示在距离$h$内的点对数。
根据半方差函数的形状,可以将数据的自相关性分为两类:正相关和负相关。
当半方差函数在$h = 0$处为零,然后随着距离的增加而上升到某一最大值,然后趋于平稳,这表示数据具有正的自相关性,也就是说,通过一定距离内的数据值可以预测其他点的数据值。
如果半方差函数在$h = 0$处有一定的值,然后随着距离的增加而下降到零,这表示数据具有负的自相关性,也就是说,通过一定距离内的数据值无法预测其他点的数据值。
半方差函数可用于分析一系列现象的空间自相关性,例如地形、土地利用、气象、生态等。
在地理信息系统中,半方差函数可以用来评估不同位置的空间可预测性,推断潜在的位置关系,优化地理数据采集技术,评估区域内的空间分布特征等。
同时,半方差函数可以帮助解决一些环境问题,如土地利用变化、环境污染传播、生态系统稳定性等。
半方差
半方差函数(Semi-variogram)及其模型
半方差函数也称为半变异函数,它是地统计学中研究土壤变异性的关键函数.
2.1.1半方差函数的定义和参数
如果随机函数Z(x)具有二阶平稳性,则半方差函数((h)可以用Z(x)的方差S2和空间协方差C(h)来定义:((h)= S2-C(h)
((h)反映了Z(x)中的空间相关部分,它等于所有以给定间距h相隔的样点测值之差平方的数学期望:
(1)
实际可用:
(2)
式中N(h)是以h为间距的所有观测点的成对数目.某个特定方向的半方差函数图通常是由((h)对h作图而得.在通常情况下,半方差函数值都随着样点间距的增加而增大,并在一定的间距(称为变程,arrange)升大到一个基本稳定的常数(称为基台,sill).
土壤性质的半方差函数也可能持续增大,不表现出确定的基台和变程,这时无法定义空间方差,说明存在有趋势效应和非平稳性.另一些半方差函数则可能完全缺乏空间结构,在所用的采样尺度下,样品间没有可定量的空间相关性.
从理论上讲,实验半方差函数应该通过坐标原点,但是许多土壤性质的半方差函数在位置趋于零时并不为零.这时的非零值就称为"块金方差(Nugget variance)"或"块金效应".它代表了无法解释的或随机的变异,通常由测定误差或土壤性质的微变异所造成.
对于平稳性数据,基底方差与结构方差之和约等于基台值.
2.1.2 方差函数的理论模型
土壤在空间上是连续变异的,所以土壤性质的半方差函数应该是连续函数.但是,样品半方差图却是由一批间断点组成.可以用直线或曲线将这些点连接起来,用于拟合的曲线方程就称为半方差函数的理论模型.在土壤研究中常用的模型有:
①线性有基台模型:
式中C1/a是直线的斜率.这是一维数据拟合的最简单模型:
((h)=C0 +C1·h/a 0在极限情况下,C1/a可以为0,这时就有纯块金效应模型:
((h)=C0, h>0 (4)
((0)=0 h=0
②球状模型
((h)= C0 +C1[1.5h/a-0.5(h/a)3] 0a (5)
((0)=0 h=0
③指数模型
((h)=C0+C1[1-exp-h/a ] h>0 (6)
((0)=0 h=0
④双曲线模型
(7)
⑤高斯模型
((h)=C0+C1[1-exp(-h2/a2)] h>0 (8)
((0)=0 h=0
选定了半方差函数的拟合模型后,通常是以最小二乘法计算方程的参数,并应用Ross等的最大似然程序(MLP),得到效果最好的半方差方程.
2.1.3 模型的检验(cross-validation,又称作jacknifing)
为了检验所选模型三个参数的合理性,必须作一定的检验.但是到现在为止还没有一个有效的方法检验参数的置信区间;同时,由于我们不知道半方差模型的确切形式,所选定的模型只是半方差函数的近似式,故无法以确切的函数形式对模型参数进行统计检验.交叉验证法的检验方法,一种间接的结合普通克立格的方法,为检验所选模型的参数提供了一个途径.这个方法的优点是在检验过程中对所选定的模型参数不断进行修改,直至达到一定的精度要求.
交叉验证法的基本思路是:依次假设每一个实测数据点未被测定,由所选定的半方差模型,根据n-1个其它测定点数据用普通克立格估算这个点的值.设测定点的实测值为,估算值为,通过分析误差,来检验模型的合理性.
2.1.4半方差函数的模型的选取原则和参数的确定
半方差函数的模型的选取原则是:首先根据公式计算出((h)的散点图,然后分别用不同类型的模型来进行拟合,得到模型的参数值及离差平方和,首先考虑离差平方和较小的模型类型,其次,考虑块金值和独立间距,最后用交叉验证法来修正模型的参数.
2.2 Kriging最优内插估值法
如果区域化变量满足二阶平稳或本征假设,对点或块段的估计可直接采用点克立格法(Puctual Kriging )或者块段克立格法(Block Kriging).这两种方法是最基本的估计方法,也称普通克立格法(Origing Kriging,简称OK).
半方差图除用于分析土壤特性空间分布的方向性和相关距离外,还可用于对未测点的参数进行最优内插估值和成图,该法原理如下:
Kriging最优内插法的原理
设x0为未观测的需要估值的点,x1, x2,…, xN 为其周围的观测点,观测值相应为y(x1 ),y(x2),…,y(xN).未测点的估值记为(x0),它由相邻观测点的已知观测值加权取和求得:
(9)
此处,(i为待定加权系数.
和以往各种内插法不同,Kriging内插法是根据无偏估计和方差最小两项要求来确定上式中的加权系数(i的,故称为最优内插法.
1. 无偏估计设估值点的真值为y(x0).由于土壤特性空间变异性的存在,以及, y(x0)均可视为随机变量.当为无偏估计时,
•1。