地统计学重点
- 格式:doc
- 大小:120.50 KB
- 文档页数:6
复习重点:统计学基本概念、问题简答复习重点统计1.简述统计的含义及其相互之间的关系。
统计资料、统计工作、统计学统计资料是统计工作的成果统计工作满足对统计资料的准确性统计学与统计工作是理论和实践的关系2.简述变量分配数列编制的步骤。
步骤:①将原始资料按其数值大小重新排列②确定全距③确定组距和组数④ 确定组限⑤ 编制变量数列3.什么是统计指标、什么是统计标志?说明二者的联系与区别。
统计指标是反映社会经济现象总体数量特征的概念标志指标简称标志,是反映总体单位某种特征的名称。
区别:指标是说明总体特征的,而标志是说明总体单位特征的;标志有不能用数值表示的品质标志和能够用数值表示的数量标志两种,而指标都能用数值表示联系:许多统计指标的数值是从总体单位的数量标志汇总而来的;指标和数量标志之间存在着转化关系。
4.什么是发展速度?包括哪些类型?各类之间的数量关系?发展速度是两个时期发展水平之比,它表明现象发展的程度和方向。
(一)定基发展速度=报告期水平÷某一固定时期水平(二)环比发展速度=报告期水平÷前一期水平数量关系:1.环比发展速度的连连乘积等于相应的定基发展速度2.相邻的两个定基发展速度之比等于相应时期的环比发展速度5.什么是结构相对指标、强度相对指标和比例相对指标?各类之间的关系如何?结构相对指标是利用分组的方法,将总体去区分为性质不同的若干部分,以部分数值与总体数值对比,计算各部分所占比重或比率的相对数,是反映同一时期总体内部组成状况的综合指标。
部分与总体的关系比例相对指标是反映同一总体内部各部分之间数量对比关系的综合指标,用来反映总体各组成部分之间的数量联系程度和比例关系。
部分与部分的关系强度相对指标是将两个性质不同但有一定联系的总体的指标对比而得到的相对数,用以反映现象强度、密度或普遍程度的综合指标。
关联指标间的关系6.什么是统计调查?有哪些类型?统计调查方案包括哪些内容?统计调查是根据研究的任务和目的,按照预先设计的方案,采用统计学的理论和方法,对所研究对象进行有计划,有组织的搜集资料的工作过程。
统计学基础知识考试重点第一章统计和数据第二章●统计是用来处理数据的,是关于数据的一门学问。
1、统计学:是用以收集数据、分析数据和由数据得出结论的一组概念、原则和方法。
2、统计分析数据的方法分为:(1)描述统计(2)推断统计3、描述统计:是研究数据搜集、处理和描述的统计学方法。
4、推断统计:是研究如何利用样本数据来推断总体特征的统计学方法。
5、推断统计包括:(1)参数估计(2)假设检验6、定性变量的特点:只反映现象的属性特点,不能说明具体量的大小和差异。
●定性变量包括分类变量和顺序变量。
●只反映现象分类特征的变量称分类变量。
分类变量没有数值特征,所以不能对其数据进行数学运算。
●如果类别具有一定的顺序,这样的变量称为顺序变量。
顺序变量不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。
7、定量变量的特点:可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异。
●数值型数据(定量数据)作为统计研究的主要资料,其特征在于它们都是以数值的形式出现的,有些数值型数据只可以计算数据之间的绝对差,而有些数值型数据不仅可以计算数据之间的绝对差,还可以计算数据之间的相对差。
其计量精度远远高于定性数据。
在统计学研究中,数值型数据有着最广泛的用途。
8、数据按获取的方法不同分为:(1)观测数据(2)实验数据9、观测数据:是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。
10、实验数据:一般是在科学实验环境下取得的数据。
11、统计数据资料的来源:(1)通过直接的调查或实验获得的原始数据,这是统计数据的直接来源;(2)别人调查的间接数据,并将这些数据进行加工和汇总后公布的数据,这是数据的间接来源。
12、数据的直接来源:(1)统计调查(2)实验法●通过统计调查得到的数据,一般称为观测数据。
●运用实验法时,实验组和对照组的产生应当是随机的。
基础知识第一章:导论1、什么是统计学?统计方法可以分为哪两大类?统计学是收集、分析、表述和解释数据的科学。
统计方法可分为描述统计方法和推断统计方法。
2、统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。
按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。
按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。
按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。
3、举例说明总体、样本、参数、统计量、变量这几个概念。
总体是包含研究的全部个体的集合。
比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就是总体。
样本是从总体中抽取的一部分元素的集合。
比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。
参数是用来描述总体特征的概括性数字度量。
比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。
统计量是用来描述样本特征的概括性数字度量。
比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。
变量是说明现象某种特征的概念。
比如商品的销售额是不确定的,这销售额就是变量。
第二章:数据的收集1、调查方案包括哪几个方面的内容?调查目的,是调查所要达到的具体目标。
调查对象和调查单位,是根据调查目的确定的调查研究的总体或调查范围。
调查项目和调查表,要解决的是调查的内容。
2、数据的间接来源(二手数据)主要是公开出版或公开报道的数据;数据的直接来源一是调查或观察,二是实验。
3、统计调查方式:抽样调查、普查、统计报表等。
1.统计的三种含义:统计工作、统计资料、统计学2.统计学的研究对象是大量社会经济现象3.统计学的特点:数量性、总体性、具体性、社会性、差异性4.统计学研究方法:大量观察法、统计分组法、统计指标法、统计推断法、统计模型5.统计的基本职能:信息(最基本)、咨询、监督职能6.统计工作的过程:统计设计、统计调查、统计整理、统计分析7.总体和总体单位(判断):总体是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。
构成总体的这些个别单位成为总体单位。
总体的特点:同质性、大量性、差异性8.标志和指标:标志是用来说明总体单位特征的名称,分为品质标志和数量标志。
指标是说明总体的综合数量特征的。
指标包括:空间、时间、指标名称、指标数值、计量单位、计算方法9.标志和指标的区别和联系:区别-(1)标志是说明总体单位特征的,而指标是说明总体特征的。
(2)指标都能用数值表示,而标志中的品质标志不能用数值表示,使用属性表示的。
(3)指标数值是经过一定的汇总取得的,而标志中的数量指标不一定经过汇总,可直接取得。
(4)标志一般不具备时间地点等条件,但作为一个完整的统计指标,一定要讲时间地点和范围。
联系-(1)有许多统计指标的数值是从总体单位的数量标志值汇总而来的。
(2)两者存在着一定的变换关系。
10.变量按取值是否连续可分为离散变量和连续变量。
11.统计调查的特征:准确性、及时性、全面性12.统计调查方案设计:确定调查目的、确定调查对象和调查单位、确定调查项目、确定调查时间和调查期限、制定调查的组织实施计划、选择调查方法13.确定调查单位就是要赋予调查单位以科学的定义,而填报单位是负责上报调查资料的单位。
14.问卷的结构:封面信、指导语、问题与答案、编码15.调查时间是指调查资料所属的时点或者时期。
调查期限是指调查工作进行的起讫时间(从开始到结束的时间)。
16.统计调查的组织形式:(1)按调查对象包括的范围分类:普查、统计报表制度、抽样调查、重点调查、典型调查(2)按调查的组织形式分类:统计报表制度和专门调查(3)按登记事物的连续性分类:经常调查和一时调查17.各类统计调查的特点调查范围调查时间组织形式统计报表全面或非全面经常报表制度普查全面一时专门调查抽样调查非全面经常或一时专门调查重点调查非全面经常或一时报表或专门典型调查非全面一时专门调查18.统计整理阶段的工作内容程序:资料审核、统计分组、统计汇总、编制统计表19.统计分组:就是根据统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。
1.统计学的研究对象:客观事物总体的数量特征(数量表现和数量关系),通过这些数量特征反映客观现象规律性的表现。
2.统计学研究对象的特点:数量性、总体性、具体性、社会性、差异性3.统计总体(总体):由客观存在的、具有某种共同性质的许多个别单位所构成的整体,当这个整体作为统计研究的对象时称为统计总体。
(大量性、同质性、差异性)4.总体单位(个体):构成总体的每一个事物或基本单位称为总体单位。
5.在某一特定范围、特定目的的统计研究中,统计总体与总体单位是包含与被包含的关系。
但是两者可以在一定条件下转换。
总体与个体是互为存在条件的连接在一起,没有个体,总体也不存在,没有总体,个体也就无法确定。
6.标志:用来说明总体单位属性或特征的名称。
每个总体单位都具有许多属性和特征。
7.标志表现:标志特征在各单位的具体表现。
如果说标志是统计所要调查的项目,那么标志表现是调查所得结果标志的实际体现。
品质标志的具体表现是属性,数量标志的具体表现是数值。
数量标志的具体表现,称为数量标志值,简称标志值。
8.标志的分类:标志按其性质不同可以分为品质标志和数量标志。
品质标志:表示事物的质的特征,无法量化。
主要用作分组的依据。
数量标志:表示事物的量的特征,能够量化。
可进行计算。
9.变量:包括可变的数量标志和统计指标。
变量的具体表现,就是可变数量标志或统计指标的不同取值,称为变量值。
10.变量的分类:按照变量值是否连续,变量可以分为连续型变量和离散型变量。
连续型变量是指它的数值是连续不断的,即在任意两个相邻数值之间可以取无限多个不同的数值。
(eg.人体的身高、体重)。
一种近视的结果。
离散型变量的数值是通过逐个计数的方法得出的,所取的可能数值只能按整数计数,不可能有小数。
(eg.职工人数、企业数、机器台数)而且其可能数值的个数是有限的,构成有限总体。
11.统计指标:反映社会经济现象总体的数量特征的名称和具体数值。
与标志不同,它是依附于统计总体的。
统计学考试重点(是我去年考试时的,命中率百分之百)1.统计的涵义:从数量方面认识总体现象的本质和规律的一种认识活动或调查研究活动。
概括为:统计工作,统计资料,统计学。
2.统计工作,统计资料与统计学的联系:统计工作是获取统计资料的实践活动,统计资料是统计工作的成果。
同时又服务于统计工作,统计学来源于统计实践,有用于指导统计实践,它可以使统计工作进行的更科学,得到的统计资料更全面、更及时、更准确3.统计的研究对象是大量社会经济现象的数量特征与规律。
4.统计的研究对象具有以下特点:①数量性②总体性③具体性。
5.统计工作可分为四个阶段,统计设计,统计调查,统计整理,统计分析。
6.统计工作的基本方法:大量观察法,统计分组法,综合指标法,统计推理法7.统计总体:简称总体,是根据统计研究目的确定的所研究对象的全体。
8.总体单位:简称单位或个体,是只构成总体的个别单位。
9.指标是指用来说明总体单位数量特征或属性特征的概念或名称。
10.标志根据表现形式分为:品质标志和数量标志 11.指标是说明总体数量特征的科学概念和具体数值。
12. 指标所包含的要素有:指标名称,指标数值,时间,空间,计量单位。
13.指标按其表现形式不同,又可分为总量指标,相对指标,平均指标。
14.按所反映总体内容不同可分为:数量指标和质量指标。
15.变量,所谓变量,是指可变的数量标志。
16.统计数据的计量尺度分为:定类尺度,定序尺度,定距尺度,定比尺度。
17.数据的类型有:定性数据(由定类尺度和定序尺度计量形成) 。
定量数据(由定居尺度和定比尺度计量形成) 。
18. 统计调查方案的设计 (内容):①确定调查的目的和任务②确定调查对象、调查单位与报告单位,③确定调查项目、设计调查表式,④确定调查时间、空间和调查期限,⑤制定调查工作的组织实施计划。
⑥选择调查方法 19.统计数据搜集的原则:准确性原则,及时性原则,系统性原则,完整性原则。
统计学期末复习要点一、复习重点1、理解描述统计学与推断统计学2、熟识定量数据与定性数据的图表叙述,常用图表3、熟练掌握加权算术平均数、标准差、标准差系数的计算方法理解样本均值、样本比例的样本原产及中心音速定理4、理解点估计的三个评价标准,区间估计的置信水平的概念5、熟练掌握总体均值与总体比例的区间估计方法6、认知影响样本容量大小因素(置信水平、总体方差、容许误差),就是怎样影响的?7、认知假设检验的原理、步骤及两类错误8、熟练掌握总体均值、总体比例的假设检验9、认知方差分析的概念、原理及基本步骤10、熟练掌握单因素方差分析方法,理解单因素方差分析表的内在联系11、掌控相关系数的性质及检验方法,一元线性与多元线性回归方程的插值,评价及检验,掌控相关系数、决定系数及回归估计标准误差的概念、排序及三者间的关系。
12、熟练掌握多元线性重回分析方法,重点熟识excel重回分析输出表的内在联系13、认知时间序列的共同组成因素及两类模型14、熟悉选择拟合时间序列趋势模型的分析方法、理解一元线性、抛物线、指数曲线趋势模型15、认知平均值综合指数与加权平均指数的概念及排序16、认知拉氏指数和帕氏指数概念及排序17、理解指数体系的概念及作用,熟练掌握总量指标的两因素分析方法18、理解cpi 指数及其经济意义,cpi指数与购买力指数的关系二、思考题1、解释洛伦茨曲线及其用途。
2、怎么理解均值在统计学中的地位?3、详述众数、中位数和均值的特点和应用领域场合。
4、详述综合指数的基本基本建设原理。
5、写出大样本条件下总体均值左侧检验的基本步骤。
6、写下大样本条件下总体方差未明时正态总体均值左侧检验的基本步骤。
7、简述样本容量与置信水平、总体方差、允许误差的关系。
8、在假设检验中第ⅰ类错误和第ⅱ类错误分别指什么,并表明它们出现的概率大小之间的关系。
9、分别列出小样本情形下一个总体(总体方差未知)均值的左侧、右侧及双侧检验的假设形式和拒绝域?10、详述方差分析的基本假设11、解释方差分析中总误差平方和、水平项误差平方和、误差项平方和三者含义及其关系?12、在对实际的时间序列拟合其长期趋势方程,通常可采用哪些分析方法?13、为什么平均发展速度用几何平均法计算?计算平均发展速度应注意哪些问题?14、简述移动平均法的基本原理和特点。
1.地理数据:就是用一定的测度方式描述和衡量地理对象的有关量化标志。
两大基本类型:空间数据和属性数据。
2.属性数据:主要用于描述地理实体、地理要素、地理现象、地理事件、地理过程的有关属性特征。
划分两种类型:数量标志数据(包括间隔尺度数据和比例尺度数据)和品质标志数据(包括有序数据、二元数据和名义尺度数据)。
3.间隔尺度数据:这种数据,是以有量纲的数据形式表示测度对象在某种单位(量纲)下的绝对量。
4.比例尺度数据:这种数据,是以无量纲的数据形式表示测度对象的相对量。
5.有序数据:当测度标准不是连续的量,而是只表示其顺序关系的数据,则称其为有序尺度或等级尺度数据。
6.二元数据:即用0、1两个数据表示地理事物、地理现象或地理事件的是非判断问题。
7.名义尺度数据:即用数字表示地理实体、地理要素、地理现象或地理事件的状态类型。
8.洛伦兹曲线:意大利统计学家洛伦兹,首先使用累计频率曲线研究工业化的集中化程度。
9.集中化指数:是一个描述地理数据分布的集中化程度指数。
10.回归分析方法:就是研究要素之间具体数量关系的一种强有力的工具,运用这种方法能够建立反映地理要素之间具体数量关系的数学模型,即回归模型。
11.时间序列:也叫时间数列或动态数列,是要素(变量)的数据按照时间顺序变动排列而形成的一种数列,它反映了要素(变量)随时间变化的发展过程。
12.图的定义:从数学本质上揭示了地理实体与地理事物空间分布格局,地理要素之间的相互联系以及它们在地域空间上的运动形式,地理事件发生的先后顺序等。
设V是由n个点所组成的集合,E是由m条线所组成的集合,而且E中任意一条线都是以V中的点为端点,任意两条线除了端点外没有其他公共点。
那么V和E在一起就构成了图记G。
图的两个基本要素:点集(或称顶点集)、边集(或称弧集)13.地理学的三个基本阶段:古代地理学(19世纪以前)、近代地理学(19世纪-20世纪50年代)、现代地理学(20世纪60年代以来)。
统计学重点知识归纳总结统计学是一门研究数据收集、分析、解释和呈现的学科。
它在各个领域都有广泛的应用,包括经济学、医学、社会科学等。
本文将对统计学的重点知识进行归纳总结,帮助读者更好地理解和应用统计学。
一、概率论基础概率论是统计学的基础,它研究的是随机现象发生的概率。
在概率论中,我们常用到以下几个重要的概念和定理:1. 事件与概率:事件是指试验的某种结果,概率是该事件发生的可能性大小。
概率的基本性质包括非负性、规范性和可列可加性。
2. 条件概率与独立性:条件概率是指事件A在另一事件B已经发生的条件下发生的概率。
两个事件A和B是独立的,当且仅当它们的联合概率等于各自的概率的乘积。
3. 随机变量与概率分布:随机变量是指随机试验结果的数值表示。
离散随机变量的概率分布通过概率质量函数来描述,连续随机变量的概率分布则通过概率密度函数来描述。
4. 期望和方差:随机变量的期望是其取值与其概率的乘积的总和。
方差衡量了随机变量离其期望值的偏离程度。
二、抽样与估计抽样是指从总体中选择一部分个体进行观察和测量的过程。
统计学中,我们常使用的抽样方法包括简单随机抽样、系统抽样和分层抽样等。
1. 抽样分布和抽样误差:当样本容量足够大时,样本的统计量(如均值和比例)的分布接近正态分布。
抽样误差是样本统计量与总体参数之间的差异。
2. 置信区间:置信区间是对总体参数的一个范围估计。
一般情况下,置信区间使用样本统计量和抽样分布来计算。
3. 抽样分布的中心极限定理:中心极限定理指出,当样本容量足够大时,样本均值的分布接近正态分布,且均值的期望等于总体均值。
4. 参数估计:利用样本数据来估计总体参数的值。
常用的参数估计方法包括最大似然估计和最小二乘估计。
三、假设检验与推断假设检验是统计学中的一种方法,用于判断总体参数是否符合某个特定的假设。
推断统计学是基于样本数据对总体特征进行推断的过程。
1. 假设检验的步骤:假设检验的步骤包括建立原假设和备择假设、选择显著性水平、计算检验统计量和进行决策。
统计学在地理学研究中的应用地理学作为一门关注地球表面和人类活动的学科,常常需要运用统计学方法来分析和解释大量的地理数据。
统计学在地理学研究中的应用范围广泛,涉及地理数据的收集、整理、分析和解释等方面。
本文将重点讨论统计学在地理学研究中的应用领域和方法。
一、地理数据的收集和整理地理学研究需要大量的地理数据作为基础,而统计学在地理数据的收集和整理过程中发挥着重要的作用。
统计学方法可以通过合理的样本设计和抽样方法来收集地理数据,并进行数据质量的评估和校正。
此外,统计学方法还可以在数据整理过程中对异常值和缺失值进行处理,确保数据的准确性和完整性。
二、地理现象的描述和分析地理学研究需要对地理现象进行描述和分析,而统计学方法可以帮助地理学家对地理现象进行定量化描述和分析。
例如,可以利用统计学方法对地理现象的分布特征进行测度,包括中心位置、离散程度和空间相关性等。
此外,统计学方法还可以通过建立统计模型来解释地理现象的成因和规律,并进行预测和模拟。
三、地理空间模式的研究地理学研究中常常需要研究地理空间模式,即地理现象在空间上的分布和格局。
统计学方法可以帮助地理学家分析地理空间模式的特征和演化规律。
例如,可以利用空间统计学方法来检测地理现象的聚集和离散现象,进而研究其背后的驱动机制。
此外,统计学方法还可以通过建立地理空间模型来模拟和预测地理现象在空间上的变化趋势。
四、地理决策支持统计学方法在地理决策支持系统中发挥着重要的作用。
地理学研究常常需要分析和解释地理数据,为政府和企业提供决策支持。
统计学方法可以通过数据挖掘和空间数据分析等技术来发现隐藏在地理数据中的规律和关联。
利用统计学方法,地理学家可以预测和评估不同方案对地理环境和人类活动的影响,从而为决策提供科学依据。
综上所述,统计学在地理学研究中发挥着重要的作用。
地理数据的收集和整理、地理现象的描述和分析、地理空间模式的研究以及地理决策支持等领域都离不开统计学方法的应用。
地统计学是20世纪60年代由法国著名统计学家G.Matheron(马特隆)创立的一门新的统计学分支
地统计学是以区域化变量理论为基础,以变异函数为主要工具,研究在空间分布上既有随机性又有结构性,或空间相关和依赖性的自然现象的科学。
理论基础——区域化变量理论
主要工具——协方差函数和变异函数
主要内容——克立格(Kriging)插值法
经典统计学与地统计学的区别
地统计学
研究区域化变量
变量不能重复试验
样本具有空间相关性
研究样本的数字特征和区域化变量的空间分布特征
经典统计学
研究纯随机变量
变量可无限次重复观测或大量重复观测
样本相互独立
研究样本的数字特征
地理数据是用一定的测度标准去衡量地理要素而取得的地理信息。
定性地理数据间隔尺度数据比例尺度数据
定量地理数据有序数据二元数据名义尺度数据
相关关系的种类
①按所涉及的变量的多少
单相关:两个变量之间的相关。
复相关:三个或三个以上变量之间的相关。
②按相关关系的表现形态
直线相关:如果两个变量之间相互变化近似为一条直线,则称为直线相关。
曲线相关:变量之间的相互变化近似为一条曲线。
③简单相关关系下按变量变动的方向
正相关:两个变量同方向变化。
负相关:两个变量反方向变化。
无相关(或零相关):两个量的变化互不影响。
偏相关当研究某一个要素对另一个要素的影响或相关程度时,暂不考虑其它要素的影响,而单独研究那两个要素之间的相互关系的密切程度时,则称为偏相关
复相关几个要素同时与某一个要素之间的相关关系
回归分析就是对具有高度相关关系的现象,根据其相关的形态,建立一个适宜的数学模型(回归方程),来近似地反映变量之间的一般变化关系,以便于进行估计或预测的统计方法。
一元线性回归两个要素之间的线性关系。
拟合优度:样本观察值聚集在样本回归值周围的紧密程度。
区域化变量 以空间点x 的三个直角坐标xu,xv,xw 为自变量的随机场Z(xu,xv,xw)=Z(x),称为区域化变量
区域化变量示例有二维的、三维的。
例:矿石品位、矿体厚度、大气污染浓度、气温、降水量、海拔高度、土壤重金属含量等等。
区域化变量的性质
(1)随机性和结构性
(2)空间局限性
(3)不同程度的连续性
(4)不同类型的各向异性
协方差函数
设某一区域化变量Z(x)的任意n 维分布函数不因空间点x 发生位移h 而改变,即若对任一向量h 下式成立
则称区域化变量Z(x)为平稳的。
当区域化变量Z(x)的增量Z(x)-Z(x+h)满足下列两个条件时,则该区域化变量满足内蕴假设
1)在整个研究区内,区域化变量Z(x)的增量的数学期望为0
2)在整个研究区内,区域化变量Z(x)的增量的方差函数对于任意x 和h 存在,且平稳(即随机函数Z(x)的增量只依赖于分割它们的向量h ,而不依赖于具体位置x )
协方差计算
N(h)样点对数
Z (i )样本点 样点对起点 样点对第二个点
协方差函数的性质
1) 先验方差不能小于零
2) C(h)=C(-h),即C(h)对于h=0的直线是对称的,它是一个偶函数。
3) 即协方差函数绝对值小于等于先验方差。
∑=+-+-=)
(1
#
)]()()][()([)(1)(h N i i i i i h x Z h x Z x Z x Z h N h C
4) 当空间距离增大时,Z(x)和Z(x+h)之间的线性相关降低或不存在。
5)C(h)必须是一个非负定函数,即由C(xi –xj )构成的协方差函数矩阵必须是非负定矩阵
变异函数计算
缺失值直接跳过
变异函数性质
(1) γ(h)=0,即在h=0时,变异函数为零。
(2) γ(h)=γ(-h),即γ(h)对h=0的直线对称,是一个偶函数。
(3) γ(h)≥0,即研究现象的变异函数值只能大于或等于零。
(4) |h|→∞时,γ(h)→C(0),或写作γ(∞)=C(0),即当空间上样点间距离无限大时,变异函数值接近先验方差。
(5) [-γ(h)]必须是一个条件非负定函数,即由[-γ (xi -xj)]构成的变异函数矩阵必须是条件非负定矩阵,或者说:若条件 成立,则矩阵[-γ (xi -xj)]为非负定阵。
变异函数的功能
(1)变异函数通过“变程”反映变量的影响范围
(2)不同方向上的变异函数图可反映区域化变量的各向异性
(3)块金常数C0的大小可反映区域化变量的随机性大小
(4)变异函数在原点处的性状可反映区域化变量不同程度的空间连续性
球状模型
当 C0=0,C=1时,称为标准球状模型.
原点处切线的斜率为3C/2a,
切线与基台值线交点的横坐标为2a/3,
变程为a
指数模型
∑=+-=)(12*)]
()([)(21)(h N i i i h x Z x Z h N h
γ
指数模型的变程为3a 。
C0为块金常数,(C0+C)为基台值,C 为拱高 原点处切线的斜率为C/a, 切线与基台值线交点的横坐标为a 比球状模型连续好 高斯模型 C0为块金常数,(C0+C)为基台值,C 为拱高 高斯模型的变程为根号3 切线与基台值线没有交点,对应于空间变异十分连续的区域化变量。
纯块金效应模型 此时,C0=C(0),先验方差 区域化变量为随机分布,空间相关性不存在 结构分析 构造一个变异函数模型对于全部有效结构信息作定量化的概括,以表征区域化变量的主要特征。
套合结构 把分别出现在不同距离h 上和(或)不同方向α 上同时起作用的变异性组合起来。
可以表示为多个变异函数之和,每一个变异函数代表一个方向一种特定尺度上的变异性 每一个变异函数代表同一方向上一种特定尺度的变异,并可以用不同的变异函数理论模型来拟合,即单一方向的套合结构
⎩⎨⎧>-+==-0)1(00)(220h e C C h h a h γ⎩⎨⎧>==000)(0h c h h γ0C 0>)
()()()(h h h h 210γγγγ++=⎪⎪⎩⎪⎪⎨⎧>≤<-⋅==222322220])(2123[00)(a h C a h a h a h C h h γ⎪⎪⎩⎪⎪⎨⎧>≤<-⋅==111311110])(2123[00)(a h C a h a h a h C h h γ
各向异性的种类
(1)几何异向性可转变为各向同性同基台值不同变程
当区域化变量在不同方向上表现出变异程度相同而连续性不同时称为几何异向性
(2)带状异向性当区域化变量在不同方向上变异性差异不能用简单几何变换得到时,就称为带状异向性。
结构分析的步骤
(1)区域化变量选择
(2)数据的获取与审议
(3)数据的统计分析
(4)变异函数的计算
(5)变异函数的结构分析——各向异性
(6)理论变异函数模型的最优拟合及检验
(7)变异函数理论模型的专业分析
克立格法概念又称为空间局部估计或空间局部插值法,克立格法是建立在变异函数理论及结构分析基础上,在有限区域内对区域化变量的取值进行线性无偏最优估计的一种方法。
主要类型:
简单克立格法
普通克立格法Ordinary Krigin
泛克立格法Universal Kriging
对数正态克立格法Logistic Normal Kriging
指示克立格法Indicator Kriging
概率克立格Probability Kriging
析取克立格法Disjuctive Kriging
协同克立格法Co-Kriging
克里金估计量对于任意待估点或块段的实际值,其估计值是通过该待估点或待估块段影响范围内的n个有效样品值的线性组合得到
漂移:非平稳区域化变量Z(x)的数学期望,在任一点x上的漂移就是该点上区域化变量Z(x)的数学期望
涨落是一个数学期望为0的区域化变量,可认为涨落是围绕漂移m(x)摆动的随机误差。
协同区域化变量:在统计意义及空间位置上均具有某种程度相关性,并且定义于同一空间域中的区域化变量。
例:气温、海拔Au、Ag、As含量
协同克立格法:是多元地统计学研究的基本方法,建立在协同区域化变量理论基础之上,利用多个区域化变量之间的互相关性,通过建立交叉协方差函数和交叉变异函数模型,用易于观测和控制的变量对不易观测的变量进行局部估计。
满足二阶平稳假设的协同区域化变量应满足:
(1)每一个协同区域化变量的数学期望存在且平稳:
(2)交叉协方差函数存在,且平稳:
满足内蕴假设的协同区域化变量应满足:
(1)每一个协同区域化变量增量的数学期望为0:
(2)对于协同区域化变量,交叉变异函数存在且平稳。
即。