当前位置:文档之家› 地质统计学

地质统计学

地质统计学
地质统计学

第一章绪论

一、历史背景与产生

地质统计学是二十世纪六七十年代发展起来的一门新兴的数学地质学科的分支。它开始主要是为解决矿床从普查勘探、矿山设计到矿山开采整个过程中各种储量计算和误差估计问题而发展起来的。它是由法国著名学者G. 马特隆教授于1962年创立的。其核心即所谓的“克立格”。它是一种无偏的最小误差的储量计算方法。该方法按照样品与待估块段的相对空间位置和相关程度来计算块段品位及储量,并使估计误差为最小。这是南非采矿工程师D. G. Krige 根据南非金矿的具体情况与1952年提出的,故命名为克立格法。后来法国学者G. 马特隆(Matheron)对克立格提出的方法进行研究,认为克立格提出的方法是在考虑了空间分布特征的基础上,合理地改进了统计学,是一种传统方法与统计学方法结合起来的新方法。同时为了解决具二重型(结构型与随机性)的地质变量的条件下使用统计方法的问题。马特隆教授提出了区域化变量的概念(Regionalized Variable),从而创立了地质统计学。根据地质统计学理论,地质特征可以用区域化变量的空间分布特征来表征。而研究区域化变量的空间分布特征分布的主要数学工具是变差函数(Variogram)。

到七十年代中后期,马特隆的学生JOURENL等在研究其它地质变量的基础上,认为某些地质变量并不是一成不变的,而是有一定波动的,这样使用克立格法就不能很好再现地质变量的分布特征。因此他们采样模拟的方法,将克立格估计的离散方差的波动性模拟出来,从而产生了随机模拟法。因此,从二十世纪八十年代以来,地质统计学分为两派:一派以法国的马特隆教授等人为主,仍致力于克立格估计的研究;一派以美国JOURENL等人为主,主要致力于随机模拟方法的研究。

地质统计学的产生是在经典统计学的基础上发展起来的。在此前,为了反映地质变量的空间变化性,一些地质学家曾经使用一些经典的概率统计方法来研究地质变量。但由于地质变量并不是纯粹的随机变量,因此,直接用简单的统计方法解决复杂的地质问题,有一定的局限性。主要表现在:①经典统计方法在研究地质变量时,不考虑样品的空间分布,由于样品的空间分布位置不同,尽管它们的均值、方差都一样,但地质变量的稳定性并不相同。②经典概率统计学研究对象是纯随机变量,并都服从一定的已知概率分布,而地质变量既有随机性又有结构性。③经典统计学的变量原则上要求可以无限次重复测量或试验,且每次测量可能结果均不同,而地质变量不行。④经典统计学一般要求每次抽样是独立进行,相互独立,而地质变量并不相互独立,往往具有空间相关性。为了寻求一种既能保持概率统计的有效性,又考虑到地质变量的特点,使地质统计学应运而生。

二、地质统计学研究现状

经过三十多年的发展,目前地质统计学已经形成了一套完整的理论体系,提出了一些重要的方法和技巧,形成了一系列有实用价值的程序包,并迅速传播到世界各地。从目前来看,可概括为如下:

⑴形成一套完整的理论体系

a. 完善的基础理论(5基本)

基本概念——区域化变量

基本工具——变差函数

基本假论——二阶平稳假设和本征(亦称“内蕴”)假设

基本公式——估计方差离散方差正则化公式

基本方法——普通克立格

b. 非线性及非平稳理论充实

泛克立格K阶本征函数析取克立格等

c. 随机模拟技术越来越丰富

条件模拟和非条件模拟等

d. 地质统计学方法的参数确定进一步规范化

变差函数的求取计算方向的确定等

⑵一系列方法和技巧不断涌现

如正态变换数据旋转等

分形模拟截断高斯模拟等

⑶一系列有效的地质统计学的软件包及应用软件不断推出

美国斯坦福大学的GDLZB软件包

挪威ODEN公司的STORM随机建模软件

加拿大的Geostat 地质统计学软件

法国石油研究院和地质统计中心推出的“Here sim”

⑷研究领域不断扩大

早期主要用于矿产的储量计算

现在已广泛用应用于地质研究(矿产、石油等)、农作物估产、森林资源的估算、环境保护、天气等,总之,凡属于对空间分布的数据均可采用地质统计学方法进行计算。

三、地质统计学的优点

马特隆曾给地质统计学下了较广泛的定义:“地质统计学就是随机函数的形式体系在勘探和估计自然现象的应用”。现在一般认为“地质统计学是以变差函数为基本工具,在研究区域化变量的空间分布结构特征规律性的基础上,综合考虑空间变量的随机性和结构性的一种数学方法”。地质统计学之所以得到迅速发展,是因为它又自身的明显的优点,主要表现在:(1)地质统计学从地质研究的实际出发,对原有的数学理论和方法加以选择和创新,使之更有效的解决地质问题。

(2)能够最大限度的利用已知信息,充分考虑了未知地区与已知信息的空间关系及区域化变量的结构特征。

(3)不仅可以进行整体估计,还可以进行局部估计。

(4)估计精度高,并能具体给出估计精度的概念,克立格方差是一个很好的度量估计精度的概念。

(5)地质统计学方法与计算机相结合,并自动成图和拼图,从而省时和省力。

(6)随机模拟可以很好的再现地质变量的变化,从而为定量研究地质体提供了可靠保障和有利基础。

四、地质统计学在我国的应用阶段

地质统计学自1977年引入我国,最早也是在矿业应用,侯景儒等将地质统计学在我国的发展应用分为三个阶段:

第一阶段(1977年——1989年),称为起步阶段。宣传普及,学习研讨,并结合本部门、本企业需要进行开发研究。

1977年美 H.M.Parker 随美中贸易全国委员会代表团访华,将地质统计学基本概念和内容系统介绍给我国。

1980年4月中国金属学会冶金地质学会成立“地质统计学协作小组”。在此期间先后派出多名学者出国深造地质统计学。

如地质大学王仁铎,北京科技大学侯景儒等。此间出版多本地质统计学专著。

该阶段的特点是:①以大专院校和研究单位为主。②理论方面以线性地质统计学为主,其它领域涉及较少。③主要是学习,应用较少,且随意性较大。主要应用于物、化探及遥感数据处理和找矿,其它应用较少。

第二阶段(1990——1995年),广泛应用阶段,于生产结合,广泛应用。

1990年 10月 西安石油学院研制出克立格绘图系统。

1990年12月 武警黄金指挥部完成国家“七五”项目——地质勘探系统软件应用及开发研

究。

1991年 8月 地矿部举办学习班,由美国B.L.Gibbs 女士讲授地质统计学及美国D.E.Myers

讲授地质统计学。

1991年 10月 在武汉举办培训班。

1993年 1月 成立“地质统计学应用协调组”。

1993年 4月 第一个将地质统计学直接应用于地质勘探生产实践的成果是武警黄金指挥部

的“陕西洛南县架鹿金矿地质勘探储量报告”通过审查。

1993年 8月 “地质统计学在中国矿产资源储量评价的应用”经地矿部立项。

1995年 10月 国家储委公布了关于“运用地质统计学方法提交地质勘探报告的编写提纲和

审查提纲”的试行意见,标志地质统计学在我国成熟,并得到国家的认可。

该阶段的特点是:①结合生产,地质统计学的理论研究更深入,在非线性地质统计学、多元

地质统计学、非平稳地质统计学等都有较深入研究。②应用方面有实质突破。③研制出适合

国内的软件系统。

第三阶段(1995年10月开始),广泛应用,深入发展阶段

该阶段的特点是:①地质统计学的技术法规逐步得到完善。②注重解决实际问题,应用更广

泛。③随机模拟技术引入,并快速发展。④地质统计学软件成熟。

五、地质统计学的发展趋势及面临的问题

地质统计学从诞生至今已四十多年历史,引进我国也已经二十多年,地质统计学在处理数据

信息上显示了最大限度的利用信息的能力。特别是随机模拟技术产生以来,地质统计学迅猛

发展,预计它在如下几个方面会面临挑战和进一步发展:

(1)资料综合问题,目前无论是矿山开发还是石油勘探,都存在资料的综合问题。所获得

的资料其获取方式不同(直接或间接),观察尺度各异(从m m ~μ级, 乃至 km 级)分

辨率相差悬殊,可靠程度也不一样,表达方式各不相同。如何把这些资料统一在一个模型中

进行研究,并使他们较准确的反映出地质体的空间结构信息。仍是地质统计学所面临的一大

问题,有待进一步完善。

(2)方法的综合使用问题,目前地质统计学的方法技术很多,也很成熟,各种方法都能在

一定范围内独立解决问题。但每种方法都有其使用条件和使用范围,为此需要研究方法的适

应性及各种方法如何各尽所能,综合运用,从而使计算结果更为可靠。如退火模拟需要其它

地质统计学方法产生一个初始试验等。

(3)继续加强地质统计学新理论、新方法的研究和应用,花大力气研究非线性地质统计学

(析取克立格)、非参数地质统计学(指示克立格)、各种条件模拟方法等,从而进一步充实

地质统计学。

(4)如何改进三维指示变差函数的求取,从而使指示型模拟方法更好的发挥作用。

(5)如何把已知的地质概念更好的综合到地质统计学中,地质统计学虽然已经考虑了地质

的空间结构性,但往往还不尽人意。譬如在石油地质学中,沉积相往往对地下储层参数起一

定控制作用,这就要求在地质统计学计算过程中充分考虑沉积相的相互关系,做到定性分析

与定量计算相结合。

(6)如何将地质统计学应用到地质研究的全过程中。如从石油勘探到开发及风险评价的整

个过程,只有这样地质统计学才能充分发挥。

六、地质统计学在我国的实践意义

自1977年地质统计学引入我国以来,有利因素和困难因素并存。主要困难有:

(1)对地质统计学认识不足,认为地质统计学只不过是一种计算速度快结果比较准确的计算方法,同时掌握它比较困难,需要较深的数学知识和计算机知识,思想上有畏难情绪,地质统计学的优越性未发挥。

(2)地质统计学专业力量分散,缺少协调机制。这样造成在基层单位缺少地质统计学专业人才,且分散的人才造成低水平重复工作。

(3)我国的地质情况比较复杂,与国外相比有许多不同的特点:矿产种类多、类型复杂、形态多样、往往多种矿产共生或伴生。地质统计学在我国的应用,必须具备较强的实际问题的解决能力。

为此地质统计学在我国应用必须加强以下方面工作:

结合成功实例,广泛宣传。

鼓励运用地质统计学解决生产问题,提交生产成果。

广开门路,培养专业人才。

加强地质统计学新理论、新方法的研究和应用。

总之,地质统计学的理论和研究对象是以不同条件下的区域化变量在空间域和时间域的分布规律为内容的。它的实用范围已不再局限在地质矿产领域,已发展成为用来研究自然界具有随机性和规律性变量的普遍性的科学方法。其应用领域不断扩大,如环境科学、农田水利、气象、林业、海洋等领域均已涉及。随着应用领域的不断扩大和方法本身的不断完善,地质统计学已逐步方展成一个通用的工具性科学。

第二章 区域化变量理论

区域化变量是地质统计学所研究的对象,区域化变量的理论是地质统计学的理论基础。

一、随机过程与区域化变量

1、随机函数:设随机试验E 的样本空间为}{ω=?,若对每一个?∈ω都有一个函数

),,(21ω;i x x x Z Λ与之对应,且当自变量),2,1(n i x i Λ=取任意固定值0i x 时,

),,(02010ω;i x x x Z Λ为一随机变量,则称),,(21ω;i x x x Z Λ为定义在),,(21n x x x Λ上的

一个随机函数。

简单地说依赖于参数的随机变量叫做随机函数。

当随机函数依赖多个自变量时,称为随机场。

2、 随机过程:通常把只依赖于时间参数)(t x t i =的随机函数,称作随机过程。记为),(ωt Z ,

简称)(t Z 。当每次试验取得一个结果时,随机过程变为一般的t 的实值函数),()(ωt Z t f =。

当参数t 取固定值时,随机过程变为一纯随机变量),()(0ωωt Z Z =。当然随机过程中的参

数t 也可以不是时间,而是其它含义,如深度等。

3、区域化变量 (Regionalized Variagram )

G .马特隆将区域化变量定义为:一种在空间上具有数值的实函数,它在空间的每一个点

取一个确定的值,当由一个点移到另一个点时,函数值是变化的。

现在一般认为,区域化变量是指以空间点X 的三个直角坐标),,(w v u x x x 为自变量的随

机场)(),,(x Z x x x Z w v u =。

区域化变量具有两重性:观测前把它看成是随机场,而观测后把它看成一个空间点函数。

区域化变量可以同时反映地质变量的结构性和随机性。当空间点X 固定后,地质变量的

取值是不确定的,可以看作一个随机变量,体现在随机性;另一方面,空间两个不同点之间,

地质变量又具有某种自相关性,且一般而言,两点距离越小,相关性越好,反映了地质变量

的连续性和关联性,体现了结构性一面。正因为区域化变量具有这种特性,才使得地质统计

学具有强大生命力。

从地质学的观点来看,区域化变量可以反映地质变量的以下特征:

① 局部性:区域化变量只限于一定的范围内。这一范围称为区域化的几何域。区域化变

量一般按几何承载定义的,承载变了就会得到不同的区域化变量。

② 连续性:不同的区域化变量具不同的连续性,可用变差函数描述。

③ 导向性:当区域化变量在个方向上相同时,称各向同性,否则称各向异性。

④ 可迁性:区域化变量在一定范围内具一定程度的空间相关性。当超出这个范围时,相

关性很弱甚至消失。这种性质用一般统计方法很难识别。

⑤ 对任一区域化变量而言,特殊的变异性可迭加在一般规律之上。

上述这些特征,经典概率统计方法很难处理,而地质统计学中的基本工具——变差函数,

能较好地研究这些特殊性质。

二、区域化变量的数字特征

区域化变量的数字特征一般都是函数。

1、平均值函数

设)(x Z 为一区域化变量,当x 固定)(0x x =时,)(0x Z 就是一个随机变量,它的平均

值为)]([0x Z E ,当x 看成变量,)]([x Z E 就是一个x 的函数,即为区域化变量的平均值。

通常把区域化变量)(x Z 与其平均值)]([x Z E 的差,叫做中心化的区域化变量,记为)(0x Z

即 )]([)()(0x Z E x Z x Z ?=,中心化的区域化变量的平均值恒为零。

2、方差函数

设)(x Z 为一区域化变量,当x 固定)(0x x =时,)(0x Z 就是一个随机变量,它的方差

为)]([02x Z D ,当x 看成变量,)]([2x Z D 就是一个x 的函数,该函数称为区域化变量的方

差。即 }{}{}{2

222)]([)]([)]([)()]([x Z E x Z E x Z E x Z E x Z D ?=?= 该方法是为了与概率论中的记法区别,因它依赖于空间点的位置x

3、协方差函数

随机过程在21,t t 处的两个随机变量)(1t Z 和)(2t Z 的二阶混合中心矩,定义为协方差函

数,即为 {}[][][])()()()()(),(212121t Z E t Z E t Z t Z E t Z t Z C ov ???=

对区域化变量)(x Z ,协方差函数为

{}[][][])()()()()(),(h x Z E x Z E h x Z x Z E h x Z x Z C ov +??+?=+

也就是说协方差函数依赖于空间点的位置x 和向量h ,当0=h 时,上式为

{}[]

[]{}22)()()0(),(x Z E x Z E x Z x Z C ov ?=+ 为先验方差函数。 三、平稳性假设和本征假设

地质统计学中用变差函数来表示区域化变量的空间结构性,而计算变差函数时,必须要

有)(x Z 和)(h x Z +的若干实现。而在实际工作中只能得到一对这样的数据。因为不可能在

空间同一点取得第二个样品,这就是说区域化变量的实际取值是唯一的,不能重复的,为克

服这一困难,提出假设。

1、平稳假设(Stationary assumption )

设一随机函数Z ,其空间分布率不因平移而改变,即若对任一向量h ,关系式

),,,,,(),,,,,(21212121ΛΛΛΛh x h x z z G x x z z G ++=成立时,则该随机函数为平稳性随

机函数。也就是说无论位移向量h 多大,随机变量的分布不变,在地质上来说,在某一地质

体内部,)(x Z 和)(h x Z +的相关性不依赖于它们在地质体内的特定位置。

这种平稳假设很严格,至少要求)(x Z 的各阶矩均存在且平稳,而在实际工作中却很难

满足。在地质统计学中提出弱平稳(或二阶平稳)。

当区域化变量满足下列两个条件时,认为满足二阶平稳:

① 在研究区内 区域化变量)(x Z 的期望存在且等于常数 []m x Z E =)( ?x

② 在研究区内 区域化变量)(x Z 的协方差函数存在且平稳,即

[][])()()()(),(2h C m h x Z x Z E h x Z x Z C ov =?+?=+ ?x ?h

当0=h 时, [][])0()()(),(C x Z V h x Z x Z C ar ov ==+ ?x (先验方差)

协方差平稳意味着方差及变差函数平稳,从而有

)()0()(h C h C γ?=

2、本征假设(Intrinsic assumption ) 内蕴

在实际工作中,有时协方差函数不存在,因而没有先验方差,也就是说不满足平稳假设。

但在自然现象和随机函数中,有些现象或函数具有无限离散性,即无协方差及先验方差,

但却可能存在变差函数,故提出本征假设,进一步放宽条件。

当区域化变量满足下列两个条件时,认为满足本征假设:

① 在研究区内 区域化变量)(x Z 增量的期望为0 , 即

[]0)()(=+?h x Z x Z E ?x ?h

②所有矢量的增量)()(h x Z x Z +?方差函数存在且平稳,即

[][])(2)()()()(2

h h x Z x Z E h x Z x Z V ar γ=+?=+? ?x ?h 要求)(x Z 的变差函数存在且平稳。

本征假设可以理解为:随机函数)(x Z 的增量)()(h x Z x Z +?只依赖于分隔它们的向量h ,

而不依赖于具体位置x 。这样被向量h 分隔的每一对数据[])(),(h x Z x Z +可以看成一对随

机变量{})(),(21x Z x Z 的一个不同实现。而变差函数的估计量)(*

h γ是 []∑=+?=)(12*

)()()(21)(h N i i i h x Z x Z h N h γ 3、两假设比较

从上面讨论可以看出,二阶平稳假设是讨论区域化变量)(x Z 本身的特征,而本征假设

是研究区域化变量增量的特征。因此总的来说二阶平稳假设要求较强,而本征假设要求较弱,

也就是说区域化变量满足平稳假设,那么它一定满足本征假设,反之不一定成立。下例可说

明。

① 若满足平稳假设条件① 即[]m x Z E =)( 很显然[]0)()(=+?h x Z x Z E ;反之不成

立。例:)(x Z 为一服从柯西分布的随机变量,其分布密度为)

1(1)(2y y +=πρ则 [][][]∞

+∞?∞+∞?∞+∞?+=++=+=+=∫∫22221ln 21)1()1(21)1()()(y y y d dy y y h x Z E x Z E πππ 不存在

但[]0)()()(=?=+?y y E h x Z x Z E

② 平稳假设条件② 可以推出本征假设条件②

二阶平稳假设条件下,有:

[][][][])()(2)()()()()(22

22h x Z x Z E h x Z E x Z E h x Z x Z E h +?++=+?=γ 因[]22)()0(m x Z E C ?= 所以[]2

2)0()(m C x Z E += 由于x 是任意点,以h x +代替x ,有[]2

2)0()(m C h x Z E +=+ 又 []2

)()()(m h C h x Z x Z E +=+ ∴ )()0()(h C C h ?=γ

由此可以看出只要)(),0(h C C 存在,则)(h γ一定存在。即平稳假设比本征假设强,反之

不然。如:对一维随机游走模型,∑==n

i i

x n Z 1)( ????=11i x 为奇数当为偶数当i i 且i x 独立。 则 {}[]{}

∑∑∑===?==??????=n i i i n i i n i i x E x E x E x E n Z E 12211)()()()(

∞→==??????×?+×==∑∑∑===n x E n i n

i n i i 11212121)1(211)( 不存在 而)(h γ存在。设n m > 当n m h ?= 则有

[]21122121)()(??

?????=?=?=∑∑==n i i m i i n m x x E Z Z E n m h γγ []???????+=++=∑∑∑>+=+=+m i j j i m n i m n i i m n x x x E x x E 1

122122121Λ ∑∑∑>+=+=?+=m i j j i m n i m n i i x E x E x E )()()(21112

0)(21)(211

212+?=∑∑==n i i m i i x E x E

2

)(21n n m =?= 存在 由此可以看出本征假设比平稳假设弱。

由于地质统计学的核心工具是变差函数,因此只要满足本征假设,则可使用地质统计学。

4、准平稳和准本征假设

在实际工作中,对整个研究区而言,往往连本征假设也不能满足。如多个砂体迭加成一

个大砂体,这时在整个大砂体内就不能满足假设条件,但在每个单砂体内部却能满足假设条

件,即随机函数只在有限大小的范围内是平稳的(或本征的),则称该随机函数服从准平稳

(准本征)假设。这是一种折衷方案,它既考虑到某种现象相似性的尺度,又顾及到有效数

据的多少,在实际工作中,可以通过缩小范围而得到平稳(本征),此时结构函数只能用于

这个限定的范围。

由于准平稳(本征)在实际工作中比较容易满足,并且它已满足地质统计学的要求,这

才使得地质统计学得以迅速发展。

这种思想在克立格估计中可以用来确定适当大小的移动领域。

四、估计方差

对任一种方法,由于估计时所用样品与被估块段并非严格相同从而产生估计方差。最好

的估计应该是方差最小的无偏估计。研究估计方差的目的就是对某种估计量,研究其估计误

差在其均值上下波动的情况。

1、定义

设)(x Z 为二阶平稳的区域化变量,v Z 为该区域化变量在某一待估块段V 上的真值,?Z

为其估计量,则估计误差??=Z Z x R v )(,[][]E v m Z Z E x R E =?=?)( 若)(x R 是二阶平

稳,则称[][]2

)(E v ar m Z Z E x R V ??=? 为?

Z 对v Z 的估计方差,记为2E σ ,即222)(E

v E m Z Z E ??=?σ E m 平均估计误差的大小,2E σ为估计误差对其分布中心E m 的离散程度的大小。

2、估计方差的计算

设)(x Z 为二阶平稳的区域化变量,数学期望m ,协方差函数)(h C ,变差函数)(h γ,

设要估计的中心点在x ,体积为V 的块段上的区域化变量的平均值。

⑴ 离散型估计方差的计算

设n 个中心在i x ′的点集V ,)(x Z 在i x ′上的取值为)(i x Z ′,待估段的中心为x ,其平均值为∫=

V V dy y Z V Z )(1 则 [][]2

22)()(m Z m Z E Z Z E V V E ???=?=??σ [])()(2)()(22m Z m Z E m Z E m Z E V V ?????+?=??

[][][][]

???????′???????′+??????????????=∑∑∫∫==n j j n i i V V m x Z n m x Z n E dt m t Z V dy m y Z V E 11)(1)(1)(1)(1

[][]???????′????????∑∫=n i i V m x Z n dy m y Z V

E 1)(1)(12 [][]{}[][]{}∑∑∫∫==?′??′+???=n i n

j j

i V V m x Z m x Z E n dydt m t Z m y Z E V 1122)()(1)()(1 [][]{}∑∫=?′??n i V i dy m x Z m y Z E V

n 1)()(112 [][]∑∑∫∫==′′+=n i n

j j

i ov V V ov x Z x Z C n dydt t Z y Z C V 1122)(),(1)(),(1 []∑∫=′?n i V i

ov dy x Z y Z C V n 1)(),(112 因)(x Z 二阶平稳, 有[])()(),(y x C y Z x Z C ov ?=

∴ []∑∑∫∫==′′+?=n i n

j j

i V V E x Z x Z C n dydt t y C V 11222

)(),(1)(1σ ∑∫=′??n i V i

dy x y C V n 1)(12 记 ∑∫=′?=n i V i dy x y C V

n v V C 1)(11),( 向量两端点扫过v V ,时协方差)(h C 的均值; dydt t y C V V V C V V

∫∫?=)(1

),(2 向量两端点扫过V V ,时协方差)(h C 的均值; ∑∑==′?′=n

i n j j i x x C n

v v C 112)(1),( 向量两端点扫过v v ,时协方差)(h C 的均值; 则 ),(2),(),(2v V C v v C V V C E ?+=σ

利用变差函数可表示为

),(),(),(22v v V V v V E γγγσ??= ⑵ 连续型估计方差的计算

设中心在i x ′的体积v 的区域,

则 [][]2

22)()(m Z m Z E Z Z E V V E ???=?=??σ []

)()(2)()(22m Z m Z E m Z E m Z E V V ?????+?=??

[][][][]??????′?′??????′?′+??????????????=∫∫∫∫v v V V t d m t Z v y d m y Z v E dt m t Z V dy m y Z V E )(1)(1)(1)(1

[][]??????′?′?????

???∫∫v V y d m y Z v dy m y Z V E )(1)(12 ΛΛ=

[][]t d y d t Z y Z C v dydt t Z y Z C V v v ov V V ov ′′′′+=∫∫∫∫)(),(1

)(),(122

[]y dyd y Z y Z C Vv V v

ov ′′?∫∫)(),(2 y dyd y y C Vv t d y d t y C v dydt t y C V V v v v V V

′′??′′′?′+?=∫∫∫∫∫∫)(2)(1)(122 ΛΛ= ),(2),(),(v V C v v C V V C ?+=

),(),(),(2v v V V v V γγγ??=

⑶ 加权条件下 估计方差的计算

∑∑∑===′?′?′+=n

i i i n i n j j i j i E

x V C x x C V V C 1112

),(2)(),(λλλσ ∑∑∑===′?′??′=n i n

j j i j i n i i i x x V V x V 111)(),(),(2γλλγγλ

3、几点说明:

⑴ 当)(x Z 弱平稳,则上面所推公式成立;若)(x Z 只满足本征,则只可用变差函数来计

算估计方差。

⑵ 在域v 内对块段V 作估计求得的估计方差,也称v 对V 的外延方差(extension variance )

),(2V v E σ。

⑶ 不论V ,v 是怎样的域,公式适用。

⑷ 变差函数可看成是用)(h x Z +估计)(x Z 的估计方差之半。

⑸ 2E σ的大小可衡量估计量的优劣,2E σ越小,估计量越好,影响2E σ的主要因素有。

(a ))(h γ的数学模型,它反映区域化变量的结构特征和空间连续性。

(b )待估块段V 的几何特征:一般V 越大,),(V V γ越大,2

E σ越小。

(c )信息样品v 的几何特征、数量、空间分布:v 越大,数量越多,相距越远,2E σ越

小。

(d )待估段与信息样品间的距离,该距离越小,2E σ越小。 五、承载效应和离散方差

在研究中,不仅要知道地质变量在某范围内的平均大小,还应该知道在该范围内的离散

情况。

1、承载效应

影响区域化变量离散程度有两个基本因素:① 变量的变化域V ② 作为统计个体的某

单元的承载v 。根据空间相关性的逻辑推理,当v 一定时,域V 较小时,地质变量应相近;

当V 一定时,v 增大,则地质变量相近。

这种承载对离散程度的影响称为承载效应,考虑承载效应是地质统计学特征。

2、离散方差

设V 为以x 为中心的某域,将V 分成n 等份,分别为以i x 为中心的域)(i x V ,于是

nV V V n

i i ==∑=1 设)(y Z 是点y 处随机变量,则每个域)(i x V 的平均值为

∫=

i v i v dy y Z v x Z )(1)(则域V 内的平均值∑∫∑∫∑∫====??????=??????==n i i v V n i v n i v x Z n dy y Z v n dy y Z nv dy y Z V x Z i i 111

)(1)(11)(1)(1)( 由于)(i v x Z 与)(x Z v 均为随机变量,则)(2x S 也为随机变量。于是可以定义离散方差为:

区域变量)(x Z 满足二阶平稳假设条件下,把随机变量)(2

x S 的数学期望定义为在域V 内n 个单元v 的离散方差,记为[]

[]???????==∑=n i V i v x Z x Z n E x S E V v D 1222)()(1)()( 简称v 对V 的离散方差。

上述定义可进一步推广,当V v ≤时,v 可近似看成一点,则

[]∫?=

V V v dy x Z y Z V x S 22)()(1)( ∴ [][]∫=

==V E dy x V y v V x S E V v D )(),(1)()(222σΛ []{}∫?+=V dy y v x V C v v C V V C V )(),(2),(),(1

]{}∫?+=V

dy y v x V C V v v C V V C )(),(2),(),( ),2),(),(V V C v v C V V C ?+=

),(),(V V C v v C ?=

),(),(v v V V γγ?=

影响离散方差的主要因素有:

① V 的大小和形状 ② v 的大小和形状

③ 变差函数)(h γ

离散方差随V 的增大而增大,随v 的增大而减小。

实际上可以说离散方差是承载效应的定量描。

3、克立格关系式

若G V v ??,则)()()(2

22G V D V v D G v D +=

这是..G D .克立格在研究维特沃特斯兰德金矿的数据后发现的,故称克立格关系式。该

式表明如果G 表示地质体,V 表示其中某一范围,v 表示单元,则G 内v 的离散方差,等

于V 内v 的离散方差与G 内V 的离散方差之和。

离散方差对地质研究和矿产设计时都很重要,实际上某一矿产的开采品位并不是勘探时

的品位,其频率分布曲线也不同于岩心的频率分曲线。地质家用放大镜和显微镜研究岩心,

采矿工程师则用大铲开采,因此不但要研究岩心品位,同样也要研究采矿品位。 六、正则化有关问题

纯粹的点数据)(x Z 只有在理论上存在,实际工作中的观测数据可以认为是从中心位于

x 处的某一承载)(x v 上测得的平均值)(x Z v ,即∫=)

()(1)(x v v dy y Z v x Z 我们称平均值)(x Z v 是点变量)(y Z 在体积)(x v 内的正则化量。所谓正则化就是用承载)(x v 内的平均值

代替原始的点数据。

正则化变量具有如下性质:

① 若)(y Z 二阶平稳,则)(x Z v 也二阶平稳。

② 若)(y Z 二阶平稳,则正则化变量)(x Z v 的变差函数)(h v γ存在且平稳。且有

)()0()(h C C h v v v ?=γ

正则化变量变差函数的计算公式:

由于)(x Z v 二阶平稳, 则[]0)()(=+?h x Z x Z E v v 据估计方差定义,我们有

[]][]{})(),()(),()(),(22

121

)(2h x v h x v x v x v h x v x v h E v ++??+==γγγσγ 则有平稳假设 ,故]])(),()(),(h x v h x v x v x v ++=γγ

上式可整理为 ),(),0()(v v v h h γγγ?=

当h 相对于v 很大时,v 可近似看成一点,从而可以得到实际工作中最常用的经验近似公式,),()()(v v h h v γγγ?≈。

当v 给定)(h γ已知时,),(v v γ就是一个定数,也就是说h 很大时,正则化变量的变差函

数)(h v γ总比变差函数)(h γ小一个常数),v v γ。

估计方差、离散方差与正则化变差函数的计算公式是线性平稳地质统计学的三大基本公

式。从这三个公式看出只要知道变差函数r(h),它们都可以计算了,有此可见变差函数确实

是地质统计学的基本工具。

第三章 变差函数和结构分析

经典地质统计学通常采用均值、方差等参数来表征地质参数的变化特征,但这些量只能

概括地质体某一特征的全貌,却无法反映局部变化特征及特定方向的变化特征,而这些特征

对地质研究往往极为重要,为此在地质统计学中引入了一个全新的工具——变差函数,也称

变异函数,它能够反映地质变量的空间变化特征——相关性和随机性,从而弥补经典统计学

的不足,特别是它能透过随机性反映区域化变量的结构性,因此也称结构函数。

一、变差函数(Variogram )定义与实验变差函数的计算

先看一维变差函数的定义:

假设空间点x 只在一维x 轴上变化,把区域化变量)(x Z 在x ,h x +两点处的值之差

之半定义为区域化变量)(x Z 在x 方向上的变差函数,记为),(h x γ,即

[][][][]{}22)()(2

1)()(21)()(21

),(h x Z E x Z E V h x Z x Z E h x Z x Z V h x ar ar +?+?=+?=γ 在二阶平稳假设条件下 [][])()(h x Z E x Z E +=

于是 []2)()(2

1),(h x Z x Z E h x +?=

γ 也就是说变差函数依赖于x 和h 两个自变量。 在本征假设条件下,[]2

)()(h x Z x Z E +?仅依赖于分割它们的距离h 和方向α。而与所考虑的点x 在V 内的位置无关,因此变差函数更明确定义为:变差函数是在任一方向α,相距h 的两个区域化变量)(x Z 和)(h x Z +的增量的方差。它是h 及α的函数,即

[][]{}2)()()()(),(h x Z x Z E h x Z x Z V h ar +?=+?=αγ

那么在连续条件下, []∫+?=V

dx h x Z x Z V h 2)()(1

),(2αγ 在离散条件下, []∑=+?=)(1

2)()()(1),(2h N i h x Z x Z h N h αγ 下面是一个实例:

1α: 1.4)197(24

21)(=×=

?h γ 2α 84.8)336(19

21)2(=×=?h γ 3α 4α 08.12)435(18

21)3(=×=?h γ 2α: 25.4)187(22

21)(=×=?h γ 1α 22.8)296(18

21)2(=×=?h γ 9.10)327(15

21)3(=×=?h γ 3α: 03.5)191(19

21)2()(=×==??a h γγ 91.11)381(16

21)22()(=×==??a h γγ 25.17)345(10

21)23()(=×==??a h γγ 4α: 47.6)233(18

21)2()(=×==??a h γγ 25.11)351(14

21)22()(=×==??a h γγ 44.15)247(1821)23()(=×==??a h γγ 对不等间距的数据:

首先统计样品间距的分布,选择多数样品的间距作为滞后距(lag ),定义带宽(一

般小于2lag )。

采用加权的办法:

2)

()((1h kh

h d j k ij ε??=

j h 为到kh 的实际距离

要求)()(h kh h h kh j εε+≤

[]∑∑∑∑====?+?=L i M j k ij

L i M j i i k ij i i d

h x Z x Z d h 11)(11

2

)()()()(γ i M 为i x 的距离在[])()(h kh h kh εε+,? 内的点数;L 为滞后距为kh 的有效

数据点数。

在实际的工作中,样品的数目总是有限的,我们把有限实测样品值构成的变差函数称为

实验变差函数,记为)(h ?

γ,它是)(h γ的估计值。

有了前面的假设,)(x Z 只依赖于h ,而不依赖具体位置x ,这样被向量h 分割的每一

对数据{})(),(h x Z x Z i i +可以看成是{})(),(h x Z x Z +的一次实现,这样可根据在x 轴上相

隔为h 的点对上的观测值,{})(),(h x Z x Z i i +用求[]2)()(h x Z x Z i i +?的算术平均值的方法来计算估值)(h ?

γ,即 []∑=?

+?=)(12)()()(21)(h N i i i h x Z x Z h N h γ )(h ?γ

对不同的滞后距h ,可以算出相应的)(h ?

γ,把这些点在 )(h h ??γ图上标出,再把相邻点用线段相连就得实验变差函数图。 对实验变差函数图来说,接近原点处的点可靠,这对后面的解释变差图时很重要。

对实验变差函数图(右图),有几个常量要了解。 0c :块金效应(nugget effect ):表示h 很小时,两点间的变化。a :变程(range ):反映区域化变量的变化程度,也可以说反映 区域化变量的影响范围,a h ≤时,任两点间的观测值有相 关性,且相关性随h 的变大而减小,a h >时,不再具有相关性。

c :总基台值 :反映区域化变量在研究范围内变异的强度,为先验方差。

1c :基台值(sill ) :先验方差与块金之差。

二、变差函数的性质

因为)()0()(h C C h ?=γ,所以要了解变差函数的性质,首先要了解协方差函数的性质。

1、协方差函数性质

① 0)0(≥C ,即先验方差不小于零。

证:[][]{}[]0)()()()()0(2

2≥=?=?=x Z V x Z E x Z E m x Z E C ar ② )()(h C h C ?= ,即)(h C 关于直线0=h 对称。

[][]{}m h x Z m x Z E h C ????=?)()()( 令y h x =? 则 h y x += 代入得

[][]{})()()()(h C m y Z m h y Z E h C =???+=?

③ )0()(C h C ≤

Θ [][]{}0)()(2

≥?+±?m h x Z m x Z E ∴ [][][][]{}m h x Z m x Z E m h x Z E m x Z E ?+??±?++?)()(2)()(2

2 0)(2)0()0(≥±+=h C C C

∴ )()0(h C C ±≥

即 )0()(C h C ≤

④ 当∞→h 时 0)(→h C 或写成 0)(=∞C

⑤ )(h C 是非负定函数,(或者说协方差阵是非负定矩阵)。也就是说并不是所有函数都

可作为平稳区域化变量的协方差函数。

2、变差函数的性质

0)0(=γ ②

0)(≥h γ ③ )()(h h γγ=?

④ [])(h γ?必须是条件非负定的,即若0=∑i λ,则)(j i x x ??γ是非负定。也就是说只有具备条件非负定的函数才能作为变差函数

⑤)0()(C =∞γ 。

3、协方差函数与变差函数的关系图 协方差函数反映区域化变了的相关程度 变差函数反映区域化变了的变异程度 它们从两个侧面来反映区域化变量 图示如右 a

三、交叉协方差函数和交叉变差函数

在实际工作中,一种区域化现象常可以用几个相关的变量来表示,即多个变量是同时区域化的,称为协同区域化。多个变量的协同区域化,可用K 维区域化变量的向量形式{})()()(21x Z x Z x Z k ,,,Λ来表示,一次观测,即为K 维向量的一次实现。

1、定义

若协同区域化变量)(x Z k 是二阶平稳的,则对每对区域化变量)(x Z k 和)('x Z k ,

其交叉协方差函数为:[]k k k k k k m m x Z h x Z E h C ''')()()(?+= x ? K k k Λ,2,1,=′ 交叉变差函数为:

[][])()()()(21)('''x Z h x Z x Z h x Z E h k k k k k k ?+??+=γ 2、性质

① 当k k =′时,即为协方差函数和变差函数。

② )('h k k γ可以取负值,即)('

x Z k 增加对应于)(x Z k 减少,反之亦然,即负相关。 ③ 交叉变差函数关于k ′和k 对称,关于h 和h ?对称。即

)()(''h h kk k k γγ= )()('

'h h kk k k γγ=? ④ 交叉协方差函数关于k ′和k 对称,但对h 和h ?没有对称性。即

)()(''h C h C kk k k = )()(''h C h C kk k k ≠?

⑤ 在二阶平稳假设条件下,交叉协方差函数和变差函数都存在,且

[]

)()(21)0()(''''h C h C C h kk k k k k k k +?=γ 3、协同区域化变量的互相关系数

在同一个点x 处,两区域化变量)('x Z k 和)(x Z k 之间的互相关系数为

)0()0()0(''''kk k k k k k k C C C +=ρ

它有如下性质:①

''kk k k ρρ= ② 1'

'≤=kk k k ρρ 四、空间变量的求取(变差函数的其它求取公式)

变差函数是地质统计学的基本工具,并具有上述性质,那么我们在变差函数的通用公式不能很好计算时,是否可用其它公式代替呢?回答是肯定的,其它公式主要有:

① 交叉变差函数(Cross semivariogram ):针对两个变量求取的变差函数

[][]∑=+??+?=)

(1

)()()()()(21)(h N i i i i i ZY h x y x y h x Z x Z h N h γ ; ② 普通相对半变差函数(General relative semivariogram ):

??????+

=∑∑==2)(1)(1)()(21)

()(h N i h N i i i GR y x h N h h γγ 正定非负向量;

③ 成对相对半变差函数(Pairwise relative semivariogram ):

∑=+?=)(122

)2

()()(21)(h N i i i i i PR y x y x h N h γ 正定非负向量;

④ 对数半变差函数(Semivariogram of logarithms ):

[]∑=?=)

(1

2)ln()ln()(21)(h N i i i ZY y x h N h γ ⑤ 开方半变差函数(Semirodogram ):

∑=?=)

(1

)(21)(h N i i i ZY y x h N h γ ⑥ 绝对值半变差函数(Semimaogram ):

∑=?=)

(1

)(21)(h N i i i ZY y x h N h γ ⑦ 指示半变差函数(Indicator semivariogram ): 先对变量指示化,即 ???=1

0indi 否则当k i Z x ≤ 第k 截断,然后求取相应的每个指示值的半变差函数。

上面6式中,⑤和⑥式适用于大比例尺的结构分析,④式适用于数据变化范围较大 不符合正态分布但取对数后能近似符合正态分布的变量。②和③式对数据点稀疏且有特异值的情况下应用效果较好。

另外协方差函数和相关函数在某些情况下也可以用来作为变差函数从而进行结构分析。

五、变差函数的理论模型

在地质统计学中所应用的变差函数都是理论变差函数。理论变差函数就是几个简单的模型,分别介绍如下:

1、球状模型(马特隆模型)

一般公式为???????+?+=c c a h a h c c h 0

3302123(0)(γ a h a h h >≤≤=00

该模型之所以叫“球状”,是因为它们起源于两个半径为

32a a h a 且球心距为h 2的球体重叠部分体积的计算公式。该模型在原点处为线性型,切线的斜率为a c 23,切线到达c 的距离为2a 。

2、指数模型

??????+=?)

1(0)(0a h e c c h γ 00>=h h 注意:变程不是a 而是a 3,原点处为线性型。切线的斜率为a c ,切线到达c 的距离为a ,在原点处连续性最好。

3、高斯模型

??????+=?)

1(0)(20a h e c c h γ 00>=h h

注意:变程不是a 而是a 3,原点处为抛物线性型。原点处切线平行于h 轴,与c 有交点。

以上三种是有基台值的情况,一般认为区域缓变量满足二阶平稳假设;若只满足本征假设,则是无基台值的情况,如以下几种:

4、幂模型 θγh h =)( 20<<θ 最常用是线性模型,即1=θ

ah h =)(γ 5、对数模型

)log()(h h =γ 由于0→h 时,?∞→)log(h

因此对数模型不能用来描述点承载的区域化变量,但可以用来 作为正则化变量的变差函数模型。

6、纯块金效应模型

???>=)0(0)(0

c h γ 00>=h h 此时变程a 可成无穷小量,0=c 对任何0>γ就能达基台值,该模型只对纯随机变量才适用。

7、空穴效应模型

当变差函数并非单调递增,而,显示出有一定周期的波动时,称空穴效应(孔穴效应)。

常用的一维空穴效应模型为:?????

???+=?)2cos(1)(0b e c c h a γπγγ 一般而言一个区域化变量的拟周期变化成份,可作为一种空穴效应出现在变差函数上,如薄互层沿垂向会显示出一定空穴效应。

在实际工作中欲将某个函数作为变差函数,必须使这个函数的负值,函数符合非负定的要求,但做这种检验是非常困难的。所以在实际工作中往往从已有的理论模型中选择就足够 了。

六、变差函数的功能

在地质统计学中变差函数不仅是许多地质统计学计算(如估计方差、离散方差等)的基础,同时它能独立地反映区域化变量的许多重要性质。

统计学基础知识要点 很重要

第一章:导论 1、什么是统计学?统计方法可以分为哪两大类? 统计学是收集、分析、表述和解释数据的科学。统计方法可分为描述统计方法和推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没 有对事物进行人为控制的 条件下等到的;实验数据的 在实验中控制实验对象而 收集到的数据。按被描述的 对象与时间关系分时:截面 数据所描述的是现象在某 一时刻的变化情况;时间序 列数据所描述的是现象随 时间而变化的情况。 3、举例说明总体、样本、 参数、统计量、变量这几个 概念。 总体是包含研究的全部个 体的集合。比如要检验一批 灯泡的使用寿命,这一批灯 泡构成的集合就是总体。样 本是从总体中抽取的一部 分元素的集合。比如从一批 灯泡中随机抽取100个,这 100个灯泡就构成了一个样 本。参数是用来描述总体特 征的概括性数字度量。比如 要调查一个地区所有人口 的平均年龄,“平均年龄” 即为一个参数。统计量是用 来描述样本特征的概括性 数字度量。比如要抽样调查 一个地区所有人口的平均 年龄,样本中的“平均年龄” 即为一个统计量。变量是说 明现象某种特征的概念。比 如商品的销售额是不确定 的,这销售额就是变量。 第二章:数据的收集 1、调查方案包括哪几个方 面的内容? 调查目的,是调查所要达到 的具体目标。调查对象和调 查单位,是根据调查目的确 定的调查研究的总体或调 查范围。调查项目和调查 表,要解决的是调查的内 容。 2、数据的间接来源(二手 数据)主要是公开出版或公 开报道的数据;数据的直接 来源一是调查或观察,二是 实验。 3、统计调查方式:抽样调

统计学原理第版在线作业

统计学原理(第2版)_在线作业_4交卷时间:2017-06-0716:13:06 一、单选题 1. (5分) 当相关系数r=0时,表明变量之间()。 ? A.完全无关 ? B.无线性相关性 ? C.相关程度很小 ? D.完全相关 纠错 得分:5 知识点:8.1相关与回归分析的基本概念,统计学原理(第2版) 展开解析 答案B 解析 2. (5分)

? A.标准差系数 ? B.标准差 ? C.平均差 ? D.全距 纠错 得分:5 知识点:3.3分布离散程度的测度,统计学原理(第2版) 展开解析 答案A 解析 3. (5分) ? A.最大的变量值 ? B.最大的权数 ? C.处于分布数列中间位置的变量 ? D.最常见的数值 纠错 得分:5 知识点:3.1集中趋势指标概述,统计学原理(第2版) 在两个总体的平均数不等的情况下,比较它们的代表性大小,可以采用的标志变异指标是()。 在分布数列中,众数是()。

展开解析 答案D 解析 4. (5分) 在回归分析中,估计标准误差起着说明回归直线的代表性大小的作用:()。? A.估计标准误差大,回归直线代表性大,因而回归直线实用价值也小 ? B.估计标准误差小,回归直线代表性小,因而回归直线实用价值也小 ? C.估计标准误差大,回归直线代表性小,因而回归直线实用价值也小 ? D.估计标准误差大,回归直线代表性小,因而回归直线实用价值也大 纠错 得分:5 知识点:8.3一元线性回归分析,统计学原理(第2版) 展开解析 答案C 解析 5. (5分) 某连续型等差变量数列,其末组组限为500以上,又知其邻组组中值为480,则末组的组中值为()。

统计学基础知识要点

第一章:导论 1、什么就是统计学?统计方法可以分为哪两大类? 统计学就是收集、分析、表述与解释数据的科学。统计方法可分为描述统计方法与推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据与数值型数据;按照统计数据的收集方法,分为观测的数据与实验的数据;按照被描述的对象与时间的关系,分为截面数据与时间序列数据。 按计量尺度分时:分数数据中各类别之间就是平等的并列关系,各类别之间的顺序就是可以任意改变的;顺序数据的类别之间就是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据就是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的就是现象在某一时刻的变化情况;时间序列数据所描述的就是现象随时间而变化的情况。 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体就是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就就是总体。样本就是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数就是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量就是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。变量就是说明现象某种特征的概念。比如商品的销售额就是不确定的,这销售额就就是变量。 第二章:数据的收集 1、调查方案包括哪几个方面的内容? 调查目的,就是调查所要达到的具体目标。调查对象与调查单位,就是根据调查目的确定的调查研究的总体或调查范围。调查项目与调查表,要解决的就是调查的内容。 2、数据的间接来源(二手数据)主要就是公开出版或公开报道的数据;数据的直接来源一就是调查或观察,二就是实验。 3、统计调查方式:抽样调查、普查、统计报表等。 抽样调查就是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查就是为某一特定目的而专门组织一次性全面调查。我国进行的普查主要有人中普查、工业普查、农业普查等。统计报表就是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。 除此之外,还有重点调查与典型调查。 4、统计数据的误差通常就是指统计数据与客观现实之间的差距,误差的主要类型有抽样误差与非抽样误差两类。 抽样误差主要就是指在样本数据进行推断时所产生的随机误差(无法消除);非抽样误差就是人为因素造成的(理论上可以消除) 5、统计数据的质量评价标准:精度,即最低的抽样误差或随机误差;准确性,即最小的非抽样误差或偏差;关联性,即满足用户决策、管理与研究的需要;及时性,即在最短的时间里取得并公布数据;一致性,即保持时间序列的可比性;最低成本,即在满足以上标准的前提下,以最经济的方式取得数据。 6、数据的收集方法分为询问调查与观察实验。 7、统计调查方案包括哪些内容? 调查目的即调查所要达到的具体目标;调查对象与调查单位,调查对象就是根据调查目的确定的调查研究的总体或调查范围,调查单位就是构成调查对象中的每一个单位;调查项目与调查表,就就是调查的具体内容;其它问题,即明确调查所采用的方式与方法、调查时间及调查组织与实施细则。 第三章:数据整理与展示 1、对于通过调查取得的原始数据,应主要从完整性与准确性两个方面去审核。 2、对分类数据与顺序数据主要就是做分类整理,对数值型数据则主要就是做分组整理。 3、数据分组的步骤:确定组数、组距,最后制成频数分布表 统计分组时“上组限不在内”,相邻两组组限间断,上限值采用小数点。 组中值=(下限值+上限值)/2 4、频数:落在各类别中的数据个数;频数分布指把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来;比例:某一类别数据占全部数据的比值;百分比:将对比的基数作为100而计算的比值;比率:不同类别数值的比值;分类数据的图示包括条形图与饼图。 5、直方图与条形图的差别:条形图就是用条形的长度表示各类别频数的多少,宽度则就是固定的,直方图就是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,直方图的各矩形通常就是连续排列,而条形图则就是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章:数据分布特征的测度 1、一组数据的分布特征可以从哪几个方面进行测度? 一就是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;二就是分布的离散程度,反映各数据据远离其中心值的趋势;三就是分布的形状,反映数据分布偏斜程度与峰度。 2、简述众数、中位数与均值的特点与应用场合及关系。

地质统计学

第一章绪论 一、历史背景与产生 地质统计学是二十世纪六七十年代发展起来的一门新兴的数学地质学科的分支。它开始主要是为解决矿床从普查勘探、矿山设计到矿山开采整个过程中各种储量计算和误差估计问题而发展起来的。它是由法国著名学者G. 马特隆教授于1962年创立的。其核心即所谓的“克立格”。它是一种无偏的最小误差的储量计算方法。该方法按照样品与待估块段的相对空间位置和相关程度来计算块段品位及储量,并使估计误差为最小。这是南非采矿工程师D. G. Krige 根据南非金矿的具体情况与1952年提出的,故命名为克立格法。后来法国学者G. 马特隆(Matheron)对克立格提出的方法进行研究,认为克立格提出的方法是在考虑了空间分布特征的基础上,合理地改进了统计学,是一种传统方法与统计学方法结合起来的新方法。同时为了解决具二重型(结构型与随机性)的地质变量的条件下使用统计方法的问题。马特隆教授提出了区域化变量的概念(Regionalized Variable),从而创立了地质统计学。根据地质统计学理论,地质特征可以用区域化变量的空间分布特征来表征。而研究区域化变量的空间分布特征分布的主要数学工具是变差函数(Variogram)。 到七十年代中后期,马特隆的学生JOURENL等在研究其它地质变量的基础上,认为某些地质变量并不是一成不变的,而是有一定波动的,这样使用克立格法就不能很好再现地质变量的分布特征。因此他们采样模拟的方法,将克立格估计的离散方差的波动性模拟出来,从而产生了随机模拟法。因此,从二十世纪八十年代以来,地质统计学分为两派:一派以法国的马特隆教授等人为主,仍致力于克立格估计的研究;一派以美国JOURENL等人为主,主要致力于随机模拟方法的研究。 地质统计学的产生是在经典统计学的基础上发展起来的。在此前,为了反映地质变量的空间变化性,一些地质学家曾经使用一些经典的概率统计方法来研究地质变量。但由于地质变量并不是纯粹的随机变量,因此,直接用简单的统计方法解决复杂的地质问题,有一定的局限性。主要表现在:①经典统计方法在研究地质变量时,不考虑样品的空间分布,由于样品的空间分布位置不同,尽管它们的均值、方差都一样,但地质变量的稳定性并不相同。②经典概率统计学研究对象是纯随机变量,并都服从一定的已知概率分布,而地质变量既有随机性又有结构性。③经典统计学的变量原则上要求可以无限次重复测量或试验,且每次测量可能结果均不同,而地质变量不行。④经典统计学一般要求每次抽样是独立进行,相互独立,而地质变量并不相互独立,往往具有空间相关性。为了寻求一种既能保持概率统计的有效性,又考虑到地质变量的特点,使地质统计学应运而生。 二、地质统计学研究现状 经过三十多年的发展,目前地质统计学已经形成了一套完整的理论体系,提出了一些重要的方法和技巧,形成了一系列有实用价值的程序包,并迅速传播到世界各地。从目前来看,可概括为如下: ⑴形成一套完整的理论体系 a. 完善的基础理论(5基本) 基本概念——区域化变量 基本工具——变差函数 基本假论——二阶平稳假设和本征(亦称“内蕴”)假设 基本公式——估计方差离散方差正则化公式 基本方法——普通克立格 b. 非线性及非平稳理论充实 泛克立格K阶本征函数析取克立格等

统计学基础知识及其概念

一、概念篇 总体:总体是指客观存在的,在同一性质基础上结合起来的许多个别事务的整体,亦称统计总体。 总体单位:总体单位是指构成统计总体的个别事物的总称。 指标:指标是反映总体现象数量特征的概念。 标志:标志是说明总体单位特征的名称。 统计调查:是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地向客观实际搜集统计资料的过程。 调查对象:是根据调查目的、任务确定的调查的范围,即所要调查的总体,它是由某些性质上相同的许多调查单位所组成的。 调查单位:是所要调查的现象总体中的个体,即调查对象中的一个一个具体单位,它是调查中要调查登记的各个调查项目的承担者。 报告单位:是负责向统计调查机关提交调查资料的单位。 普查:是专门组织的一次性的全面调查,用来调查属于一定时点上或时期内的现象的总量。 抽样调查:是从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。抽样调查又称为概率抽样或称为随机抽样。 抽样调查是抽取总体重的部分单位,收集这些单位的信息,用来对总体进行推断的调查方法。这里的总体是指抽样推断所要认识的研究对象的整体,它是由所要研究的范围内具同一性质的全体单位所组成的整体。被抽中的部分单位构成样本。一般的,将总体记作N,将样本记作n。 面谈访问法:是由访问员与被调查者见面,通过直接访问来填写调查问卷的方法。 统计整理:是统计工作的一个重要环节,它是根据统计研究的任务与要求,对调查所取得的各种原始资料,进行审核、分组、汇总,使之系统化、条理化,从而得到反映总体特征的综合资料的过程。 复合分组:对同一总体选择两个或两个以上的标志重叠起来进行分组。 复合分组体系:多个复合分组组成的分组体系。 频数:是指分配数列中各组的单位数,也称次数。 频率:是将跟组的单位数(频数)与总体单位数相比,求得的用百分比表示的相对数,也称比率或比重。 统计指标:是反映总体现象数量特征的基本概念及其具体数值的总称。 总量指标:是反映总体规模的统计指标,表明现象总体发展的结果。 平均指标:是总体各单位某一数量标志一般水平的统计指标。 是将一个总体内各个单位在某个数量标志上的差异抽象化,以反映总体的一般水平的综合指标。 标志变异指标:是表明总体各个单位标志值的差异程度(离散程度)的指标。 强度相对指标:是不属于同一总体的两个性质不同但相互间有联系的总量指标对比的比值,是用来反映现象的强度、密度和普遍程度、利用程度的综合指标。 加权算数平均数:是在总体经过分组形成变量数列(包括单项数列和组距数列),有变量值和次数的情况下,将各组变量值分别与其次数相乘后加总求得标志总量,再除以总体单位数(即次数总和)而求得的数值。 标准差:是总体各单位变量值与其平均数的离差平方的算术平均数的平方根。 发展速度:是表明社会经济现象发展程度的相对指标,它是根据两个不同时期发展水平对比求得,说明报告期水平是基期水平的几倍或百分之几,常用倍数或百分数来表示。由于所采用的基期不同,发展速度又可分为定基发展速度和环比发展速度。 概率抽样:概率抽样在抽取样本时不带有任何倾向性,它通过从总体中随机抽选单位来避免这种偏差,因而对总体的推断更具代表性。 比例分析法:比例分析法又名“比率分析法”,是用倍数或百分比表示的分数式,即通过计算相关指标之间的相对比值,来揭示和对比不同规模、不同性质事物的水平和效益的好坏,或分析部分和整体之间比例关系的分析方法。 国家统计报表制度:国家统计报表制度是各级政府统计部门实施国家统计调查项目的业务工作方案,由国家统计局制定,或者由国家统计局和国务院有关部门共同制定。 现行国家统计报表制度分为周期性普查制度、经常调查制度和非经常性调查制度三大类。 周期性普查制度:是国家统计报表制度的一个类型,是就我国社会经济发展的状况,由国务院组织,每隔一段时

《地质统计学》读书报告

《地质统计学》课程读书报告

地质统计学读书报告 地质统计学包含经典统计学与空间统计学,按其基本原理可定义为:地质统计学是以区域化变量理论为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性,又有结构性的自然现象的科学。其为数学地质领域中一门发展迅速且有着广泛应用前景的新兴学科。国内外的生产实践表明,地质统计学除了在异常评价、找矿勘探、矿体圈定、储量计算、采矿设计、矿山生产及地学科研等方面具有明显的优越性外,它在石油地质、第四纪地质、地层学、生物学、生态学、岩石学、地球化学、构造地质、地震地质、海洋地质、农业、水文地质、工程地质、古气候、古地理、环境、林业、医学等许多方面都有成功应用的实例。地质统计学在不到50年的研究和实践中得到了很大的发展 [1]。 一、理论研究及进展 经历了数十年的发展,地质统计学的理论与方法研究有了很大的提高[2-3]。包括:①从初期二维平面分析到三维立体空间的静态估计,发展到今天在时空域内对研究对象进行四维乃至更高维空间的动态估计和模拟。Journel[4]将克立格法的估值问题,从一般矢量空间扩展到个原始数据的全部可测度函数所形成

的矢量空间(希尔伯特空间)进行考察;②在单变量区域化变量理论的基础上,提出了适合多变量的协同区域化理论[4];③发展了许多计算变异函数(或协方差函数)的方法;④线性地质统计学与非线性地质统计学共同发展;⑤参数地质统计学与非参数地质统计学相互补充。Matheron[5]为首的参数地质统计学派以正态假设为前提,在协同区域化理论的基础上,提出多元地质统计学的基本思想。Journel发展了无须对数据分布作任何假设的非参数地质统计学,提出了一些非参数地质统计学克立格方法;⑥由于时空多元地质统计学的研究得到重视,早期空间域静态建模技术的研究逐渐过渡到研究时空域多元动态条件模拟,各种模拟方法得到了发展;⑦早期的等因子模型的因子是埃尔米特多项式,它要求原始数据服从正态分布。为了拓宽等因子模型的应用,Matheron提出了离散的等因子模型和连续的等因子模型,Rivoirard利用析取克立格技术建立了正交指标剩余模型,Lajauine和La ntuejoul等也提出了建立等因子模型的一些方法;⑧已有的地质统计学方法相互融合。如指示克立格法与协同克立格法相结合形成指示协同克立格法;指示克立格法与因子克立格法相结合形成主分量指示克立格法;协同克立格法与其它不同的线性地质统计技术相结合形成各种协同克立格技术等[6]。 这里重点介绍一下多点地质统计学[7]。多点地质统计学是相对于基于变差函数的两点地质统计学而言的。在两点统计里,储集层相关性通过空间两点协方差( 变差函数) 进行描述。在多点统计里,则是利用空间多个点组合模式进行描述。空间多点组合样式称为数据样板,如果在空间点赋予了值,则为一个特定的空间多点组合模式,称为数据事件。在建模时,对每一个未知点,估计在其处满足给定条件的数据事件出现的概率,随后抽样获得未知点处值或者数

统计学基础知识

一、数据的特征值 (一)数据的位置特征值 1)平均值 如果从总体中抽取一个样本,得到一批数据x 1,x 2,x 3….x n ,则样本的平均值x 为: n-数据个数; x i -第i 个数据数; ∑-求和。 2)中位数 有时,为减少计算,将数据x 1,x 2,x 3….x n 按大小次序排列,用位居于正中的那个数或中间两个数的平均值(当数据为偶数时)表示数据的总体平均水平。 3)中值M 测定值中的最大值x max 与最小值x min 的平均值,用M 表示。 4)众数 在用频数分布表示测定值时,频数最多的值即为众数。若测定值按区间做频数分布时,频数最多的区间代表值(一般取区间中值)也称众数。 (二)数据的离散特征值 1)极差R 测定值中的最大值x max 与最小值x min 之差称为极差。通常R 用于个数n 小于10的情况下,n 大于10时,一般采用标准偏差s 表示。 2)偏差平方和S 各测定值x i 与平均值 之差称为偏差。各测定值的偏差平方和称为偏差平方和,简称平方和,用S 表示。 无偏方差 各个测定值的偏差平方和除以(n-1)后所得的值称为无偏方差(简称方差),用s 2表示: ~ x _x _ x ∑ =--=-=n i i x x n n S s 1 2 _2)(1112 _ 2 _ 22 _ 1)(...) () (x x x x x x n -+-+-∑=-n i i x x 1 2 _ )(S = =

标准偏差s 2 (三)变异系数 以上反映数据离散程度的特征值,只反映产品质量的绝对波动大小。在工程实践中,测量较大的产品,绝对误差一般较大,反之亦然。因此要考虑相对波动的大小,在统计技术上 上式中σ和μ为总体均值和总体标准差,当过程在受控状态下,且样本容差较大时,可用样本标准差s 和样本均值 估计。 _x

统计学重点知识点

基本统计方法 第一章 概论 1. 总体(Population ):根据研究目的确定的同质对象的全体(集合);样本(Sample ):从总体中随机抽取的部分具有代表性的研究对象。 2. 参数(Parameter ):反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表示,是固定的常数;统计量(Statistic ):反映样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,是在参数附近波动的随机变量。 3. 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。 第二章 计量资料统计描述 1. 集中趋势:均数(算术、几何)、中位数、众数 2. 离散趋势:极差、四分位间距(QR =P 75-P 25)、标准差(或方差)、变异系数(CV ) 3. 正态分布特征:①X 轴上方关于X =μ对称的钟形曲线;②X =μ时,f(X)取得最大值;③有两个参数,位置参数μ和形态参数σ;④曲线下面积为1,区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。 4. 医学参考值范围的制定方法:正态近似法:/2X u S α±;百分位数法: P 2.5-P 97.5。

第三章 总体均数估计和假设检验 1. 抽样误差(Sampling Error ):由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。抽样误差不可避免,产生的根本原因是生物个体的变异性。 2. 均数的标准误(Standard error of Mean, SEM ):样本均数的标准差,计算公式: X σσ=误差的大小。 3. 降低抽样误差的途径有:①通过增加样本含量n ;②通过设计减少S 。 4. t 分布特征: ①单峰分布,以0为中心,左右对称; ②形态取决于自由度ν,ν越小,t 值越分散,t 分布的峰部越矮而尾部翘得越高; ③当ν逼近∞,X S 逼近X σ, t 分布逼近u 分布,故标准正态分布是t 分布的特例。 5. 置信区间(Confidence Interval , CI ):按预先给定的概率(1-α)确定的包含总体参数的一个范围,计算公式:/2,X X t S αν±或/2,X X u S αν±。95%CI 含义:从固定样本含量的已知总体中进行重复抽样试验,根据每个样本可得到一个置信区间,则平均有95%的置信区间包含了总体参数。 6. 假设检验的基本原理:小概率反证法的思想。 ①反证法:从问题的对立面(H 0)出发间接判断要解决的问题(H 1)

地质统计学

地统计(Geostatistics)又称地质统计,是在法国著名统计学家G. Matheron大 量理论研究的基础上逐渐形成的一门新的统计学分支。它是以区域化变量为基础,借助变异函数,研究既具有随机性又具有结构性,或空间相关性和依赖性的自然现象的一门科学。凡是与空间数据的结构性和随机性,或空间相关性和依赖性,或空间格局与变异有关的研究,并对这些数据进行最优无偏内插估计,或模拟这些数据的离散性、波动性时,皆可应用地统计学的理论与方法。 地统计学与经典统计学的共同之处在于:它们都是在大量采样的基础上,通过对样本属性值的频率分布或均值、方差关系及其相应规则的分析,确定其空间分布格局与相关关系。但地统计学区别于经典统计学的最大特点即是:地统计学既考虑到样本值的大小,又重视样本空间位置及样本间的距离,弥补了经典统计学忽略空间方位的 缺陷。 地统计分析理论基础包括前提假设、区域化变量、变异分析和空间估值。 第一章品位与储量计算 第一节概述 投资一个矿床开采项目,首先必须估算其品位和储量。一个矿床的矿量、品位及其空间分布是对矿床进行技术经济评价、可行性研究、矿山规划设计以及开采计划优化的基础,是矿山投资决策的重要依据。因此,品位估算、矿体圈定和储量计算是一项影响深远的工作,其质量直接影响到投资决策的正确性和矿山规划及开采计划的优劣。从一个市场经济条件下的矿业投资者的角度看,这一工作做不好可能导致两种对投资者不利的决策:(1)矿体圈定与品位、矿量估算结果比实际情况乐观,估计的矿床开采价值在较大程度上高于实际可能实现的最高价值,致使投资者投资于利润远低于期望值,甚至带来严重亏损的项目。(2)与第一种情况相反,矿床的矿量与品位的估算值在较大程度上低于实际值,使投资者错误地认为在现有技术经济条件下,矿床的开采不能带来可以接受的最低利润,从而放弃了一个好的投资机会。 然而,准确地估算出一个矿床的矿量、品位绝非易事。大部分矿体被深深地埋于地下,即使有露头,也只能提供靠近地表的局部信息。进行矿体圈定和矿量、品位估算的已知数据主要来源于极其有限的钻孔岩心取样。已知数据量相对于被估算的量往往是一比几十万乃至几百万的关系,即对一吨岩心进行取样化验的结果,可能要用来推算几十万乃至几百万吨的矿量及其品位。可以不过分地说,矿量、品位的估算是世界上最大胆的外推。因此,矿体圈定与矿量、品位估算不仅是一项十分重要的工作,而且是一项极具挑战性的工作。做好这一工作要求掌握现代理论知识与手段,并应用它们对有限的已知数据进行各种详细、深入的定量、定性分析;同时也要求从事这一工作的地质与采矿工程师具有科学的态度和求实精神。 本章将较详细地介绍当今世界上常用的矿量、品位估算方法,包括探矿数据的分析、处理和用于品位估值的剖面法、平面法及矿床模型法等。地质统计学作为品位估值的一种方法,从其诞生起就显示了强大的生命力,得到了越来越广泛的应用,本章对此给予较大的篇幅。本章的主要目的不是教会读者如何一步一步

统计学原理第版在线作业

统计学原理(第2版)_在线作业_2 交卷时间:2017-10-29 19:20:33 一、单选题 1. (5分) 若商品零售价格增长2%,商品销售量增长5%,则商品零售额增长(?)。 ?A.?3% ?B.?7% ?C.?% ?D.?0% 得分:?5 知识点:? 指数体系,统计学原理(第2版) 2. (5分) 在依据概率方面,?区间估计与假设检验的关系表现在(?)。 ?A.?二者都立足于小概率 ?B.?二者都立足于大概率 ?C.?前者立足于小概率,后者立足于大概率

?D.?前者立足于大概率,后者立足于小概率 得分:?5 知识点:? 抽样估计的基本方法,统计学原理(第2版),统计学原理 3. (5分) 统计量是根据(?)计算出来的。 ?A.?分类数据 ?B.?顺序数据 ?C.?样本数据 ?D.?总体数据 得分:?5 知识点:? 数据的计量与类型,统计学原理(第2版) 4. (5分) 若销售额指数上升,销售价格指数降低,销售量指数为(?)。 ?A.?不变 ?B.?降低

?C.?增长 ?D.?零 得分:?5 知识点:? 指数体系,统计学原理(第2版) 5. (5分) 为了研究包装方式对产品销售量的影响,将包装方式定为三种,则称这种方差分析为(?)。 ?A.?单因素三水平方差分析 ?B.?双因素方差分析 ?C.?三因素方差分析 ?D.?单因素方差分析 得分:?5 知识点:? 单因素方差分析,统计学原理(第2版) 6. (5分)

用综合指数法编制总指数的关键问题之一是(?)。 ?A.?确定比较对象 ?B.?确定对比基期 ?C.?确定个体指数 ?D.?确定同度量因素及其固定时期 得分:?5 知识点:? 综合指数,统计学原理(第2版) 7. (5分) 已知总体平均数为100,变异系数为30%,则方差为(?)。 ?A.?900 ?B.?30 ?C.?300 ?D.?90 得分:?5 知识点:? 分布离散程度的测度,统计学原理(第2版)8.

在线作业答案福师《统计学》在线作业二15秋满分答案

福师《统计学》在线作业二15秋满分答案 一、单选题(共 35 道试题,共 70 分。) 1. 统计报表制度采用的是()为主要特征的调查方法。 A. 随机形式 B. 报告形式 C. 抽样形式 D. 审核形式 ——————选择:B 2. 对于经常性的人口总量及构成情况进行的调查,适宜采用()。 A. 典型调查 大众理财作业满分答案 B. 重点调查 C. 抽样调查 D. 普查 ——————选择:C 3. 抽样调查的主要目的是()。 A. 广泛运用数学的方法 B. 计算和控制抽样误差 C. 修正普查的资料 D. 用样本指标来推算总体指标 ——————选择:D 4. 若销售量增长5%,零售价格增长2%,则商品销售额增长()。 A. 7% B. 10% C. 7.1% D. 15% ——————选择:C 5. 统计分布数列()。 A. 都是变量数列 B. 都是品质数列 C. 是变量数列或品质数列 D. 是统计分组 ——————选择:C 6. 某省2000年预算内工业企业亏损面达46.3%,这是()。 A. 总量指标 B. 时点指标 C. 时期指标 D. 强度相对指标 E. 平均指标 ——————选择:D 7. 某省2000年1—3月新批94个利用外资项目,这是()。 A. 时点指标 B. 时期指标

C. 动态相对指标 D. 比较相对指标 E. 平均指标 ——————选择:B 8. 将现象按照品质标志分组时,就形成()。 A. 数量数列 B. 品质数列 C. 变量数列 D. 平均数列 ——————选择:B 9. 在是非标志总体中,具有某种标志表现的单位数所占的成数与不具有某种标志表现的单位数所占的成数关系为()。 A. 和为1 B. 差为-1 C. 差为0 D. 不确定 ——————选择:A 10. 统计认识的对象为()。 A. 个体 B. 客体 C. 总体单位 D. 总体 ——————选择:D 11. 总体与总体单位不是固定不变的,是指()。 A. 随着客观情况的发展,各个总体所包含的总体单位数也在变动 B. 随着人们对客观认识的不同,对总体与总体单位的认识也是有差异的 C. 随着统计研究目的与任务的不同,总体和总体单位可以变换位置 D. 客观上存在的不同总体和总体单位之间总是存在着差异 ——————选择:C 12. 采用两个或两个以上标志对社会经济现象总体分组的统计方法是()。 A. 品质标志分组 B. 复合标志分组 C. 混合标志分组 D. 数量标志分组 ——————选择:B 13. 在国营工业企业设备普查中,每一个国营工业企业是()。 A. 调查对象 B. 调查单位 C. 填报单位 D. 调查项目 ——————选择:B 14. 某种材料上月末库存量和本月末库存量两个指标()。 A. 都是时期指标 B. 都是时点指标

地质统计学反演

地质统计学反演(StatMod) 一、方法原理 JASON的StatMod是一个集多种随机模拟技术的软件包,是以概率论为其理论基础的。其目的是提供一个或多个在某种概率条件下的,既满足数据的地质统计学特征又满足地质、测井和地震信息的三维储层参数概率模型。数据的地质统计学特征由数据的概率分布图和变异函数描述。 由于地质统计模拟是基于概率意义上的随机模拟。为满足概率条件必须有足够多的井资料。软件要求的已知井数不少于6口。 地质统计学主要的算法是岩性指示模拟和序贯高斯模拟技术(SGS)。 序贯高斯模拟方法是一种产生来自高斯场模型实现的方法。它基于序贯模拟思想。该方法首先是将研究区域离散为网格系统,然后序贯地处理每一个网格节点。由于每个节点处随机变量是服从条件化的正态分布,因此,网格节点值完全由均值和方差两个参数确定。通过求解克里金方程组就可给出该网格节点处的均值和方差,从而将节点处的正态分布确定下来,并采用相应的抽样方法得到该网格节点处的一个样本。直至全部网格节点计算完毕。需要指出的是:求解克里金方程组时的条件数据包括原始数据,先前已模拟的、落在模拟邻域内所有被模拟的网格节点处的值。序贯高斯模拟方法是一种条件模拟,它保证原始数据和直方图及变异函数都被条件化。在地震储层预测中,每一道就是一个网格节点。 在模拟过程中,需要求取的最典型的属性是波阻抗和孔隙度。地质统计学考虑了模拟过程中结果的不唯一因素,故而增加了结果的误差分析。通过用户定义方式在三维地质模型的每个网格节点上计算出的概率密度函数,可以计算出结果数据体。概率密度函数是数据体中能够对不确定性进行正常估算的参数分布规律。 地质统计学反演对测井曲线的应用方式,与Jason其它的反演方法截然不同。Jason其它反演方法再队测井曲线进行应用过程中,除子波估算外。只有在地震数据中没有低频信息时,在最终的反演结果中才会反映测井曲线的信息。然而地质统计学将重采样后的测井曲线沿井轨迹复制到三维网格点中。在这种方式下,测井曲线被认为是“Priori”类型的信息,因此,在开展地质统计学反演之前,开展其它类型的常规反演就显得十分重要。只有这样,我们才能够确保曲线和地震数据具有一致性,代表了相同带限的地质模型。因此,地质统计学反演比其它类型的反演具有如下技术优势: 1 小井距间的精细尺度内插 2能够进行误差估算,进而评价风险 3改善常规反演结果的分辨率 4能够生成岩性类型数据体,如砂岩和泥岩

统计学原理在线作业

统计学原理(第2版)_在线作业_4 交卷时间: 2017-02-19 20:33:57 一、单选题 1. (5分) A. 无线性相关性 B. 完全相关 C. 完全无关 D. 相关程度很小 纠错 得分: 5 知识点: 相关与回归分析的基本概念,统计学原理(第2版) 展开解析 答案A 解析 2. (5分) 当相关系数r=0时,表明变量之间( )。

A. 标准差系数 B. 全距 C. 平均差 D. 标准差 纠错 得分: 5 知识点: 分布离散程度的测度,统计学原理(第2版) 展开解析 答案A 解析 3. (5分) A. 最大的权数 B. 最大的变量值 C. 处于分布数列中间位置的变量 D. 最常见的数值 纠错 得分: 5 知识点: 集中趋势指标概述,统计学原理(第2版) 在两个总体的平均数不等的情况下,比较它们的代表性大小,可以采用的标志变异指标是( )。 在分布数列中,众数是( )。

展开解析 答案D 解析 4. (5分) A. 估计标准误差大,回归直线代表性小,因而回归直线实用价值也大 B. 估计标准误差大,回归直线代表性大,因而回归直线实用价值也小 C. 估计标准误差小,回归直线代表性小,因而回归直线实用价值也小 D. 估计标准误差大,回归直线代表性小,因而回归直线实用价值也小 纠错 得分: 5 知识点: 一元线性回归分析,统计学原理(第2版) 展开解析 答案D 解析 5. (5分) 在回归分析中,估计标准误差起着说明回归直线的代表性大小的作用:( )。

A. 510 B. 500 C. 520 D. 540 纠错 得分: 5 知识点: 统计数据的整理,统计学原理(第2版) 展开解析 答案C 解析 6. (5分) A. 定类尺度 B. 定比尺度 C. 定距尺度 D. 定序尺度 某连续型等差变量数列,其末组组限为500以上,又知其邻组组中值为480,则末组的组中值为( )。 计量结果不但表现为类别,而且这些类别之间可以进行顺序的比较,计量结果的顺序不能颠倒的计量尺度是( )。

统计学知识点的总结

1、统计的含义 (1)统计工作:即统计实践,是指很据科学的方法从事统计设计、收集、整理、分析研究和提供各种统计资料和统计咨询意见的活动的总称。其成果是统计资料(原始调查资料和加工处理后的系统资 料); (2)统计资料:即统计工作过程中所获得的各种有关数字资料以及与之相关的其他资料的总称。通常以统计表、统计图和统计报告的形式变现,用以反映社会经济现象的规模、水平、速度、结构和比例关系等信息的数字和文字资料; (3)统计科学:即统计理论,是指统计工作实践的理论概括和科学总结。 2、统计学 统计学:是一门搜集、整理、分析数据方法的科学,其目的是探索数据的内在数量规律性, 以达到对客观事物的科学认识。 3、统计学的研究对象 统计学研究的对象是:社会经济现象总体的数量特征和数量关系。 其根本特征:在质与量的辩证统一中,研究大量社会经济现象总体的数量方面,反映社会 现象发展变化的规律性在具体时间、地点和条件下的数量表现,揭示事物的本质、相互联系、 变动规律和发展趋势。 4、统计学研究特点 数量性、总体性、具体性、社会性 5、统计工作的过程及基本职能 统计工作的过程:统计设计、统计调查、统计整理、统计分析(定性一定量一定性:循环 往复)

统计设计:指根据统计研究对象的特点和研究的目的、任务,对统计工作的各个方面和各 个环节的通盘考虑和安排,是统计认识过程的第一个阶段,即定性认识的阶段; 统计调查:指根据统计研究对象和目的要求,依据统计设计的内容、指标和指标体系的要 求,有计划、有目的、有组织的收集原始资料的工作过程,即由定性到定量认识的阶段; 统计整理:指根据统计研究的目的,将统计调查得到的原始资料和通过各种方法得到的次 级资料进行科学的分类和汇总,使其条理化、系统化的工作过程,即为统计分析准备在一定 程度上可以反映总体特征的统计资料; 统计分析:指在统计整理的基础上,根据研究的目的和任务,应用各种科学的统计方法, 从静态和动态两个方面对研究对象的数量方面进行计算、分析研究,认识和揭示所研究对象 的本质和规律性,做出科学的结论,进而提出建议和可预测性的意见的工作过程,即从定量到定性深入认识的阶段。 统计工作的基本职能:信息、咨询、监督 6、统计学研究的基本方法 大量观察法、统计分组法、综合指标法、时间数列分析法、指数法、抽样推断法、相关分 析法。 7、统计学的基本概念 (1)总体:指客观存在的,有性质相同的许多个别事物组成的整体; (2)总体单位:指组成总体的许多性质相同的个别事物,简称单位/个体; (3)标志:用于说明总体单位特征的名称或概念,有数量标志和品质标志之分; (4)标志表现:标志特征在各单位的具体体现,数量标志表现为具体的数值,品质标志表现为对特征加以描述的文字;

地质统计学在环境科学领域的应用进展分析

地质统计学在环境科学领域的应用进展 分析 本文从网络收集而来,上传到平台为了帮到更多的人,如果您需要使用本文档,请点击下载按钮下载本文档(有偿下载),另外祝您生活愉快,工作顺利,万事如意! 0引言 地质统计学,近年来又被称为空间信息统计学,是数学地质领域中一门发展迅速且有着广泛应用前景的新兴学科。它以区域化变量为核心和理论基础,以多孔介质空间结构的变异函数为基本工具,研究那些分布于空间中并显示出一定结构性和随机性的自然现象的一种数学地质方法,在优化采样方案、处理不规则采样及最优化插值计算等方面有明显的优点,在地学、矿业、石油、农林、环境、生态及医学等方面都有成功应用的实例。 1地质统计学的产生和发展现状 20世纪50年代初期,南非矿山工程师根据多年对南非金铀砾岩型金矿储量计算的经验,提出随样品空间位置不同,样品间相关性不同,应对每个样品赋予一定权值进行滑动加权平均来代替传统平均值对盘区块段金品位进行估计。60年代,法国著名统计学家经过大量工作将Krige的成果理论化、系统化,提出“区域化变

量”概念,创立了这门新的统计学分支学科。地质统计学的基本理论与研究方法于1978年由地质学家侯景儒等人系统引入中国科研工作中,经历了曲折的发展后,目前地质统计学在中国的理论方法与实际应用均达到一定的水平[2 3],但在环境科学领域的应用时间还很短。 在不到半个世纪的时间里,地质统计学已在需要评估空间和时间变异的许多领域得到广泛应用。 (1)形成了两大理论学派[4]即以法国统计学家G Matheron为代表的“枫丹白露地质统计学派”和以美国统计学家 A G Journel为代表的“斯坦福地质统计学派”。由于实际计算和应用方法不同,又称为“参数地质统计学”和“非参数地质统计学”。 (2)发展了多种空间局部估计方法,如普通克立格法、协同克立格法、泛克立格法、析取克立格法、对数克立格法、随机克立格法、因子克立格法、指示克立格法等。 (3)多学科相互渗透,拓宽了地质统计学的理论体系,使其不断应用于新的领域,如石油和煤炭勘探与开发、水文工程地质、环境污染预测、农林科学、生物科学、医学等领域。 (4)国内外学者已经研究开发出一批基于地质统

多点地质统计学

多点地质统计学Multiple-point geostatistic是相对于传统的两点地质统计学而言的,主要应用于储层表征与建模中. 传统的地质统计学在储层建模中主要应用于两大方面:其一,应用各种克里金方法建立确定性的模型,这类方法主要有简单克里金、普通克里金、泛克里金、协同克里金、贝叶斯克里金、指示克里金等;其二,应用各种随机建模的方法建立可选的、等可能的地质模型,这类方法主要有高斯模拟(如序贯高斯模拟)、截断高斯模拟、指示模拟(如序贯指示模拟)等。上述方法的共同特点是空间赋值单元为象元(即网格),故在储层建模领域将其归属为基于象元的方法。这些方法均以变差函数为工具,亦可将其归属为基于变差函数的方法。 变差函数局限性(传统地质统计学)变差函数只能把握空间上两点之间的相关性,亦即在二阶平稳或本征假设的前提下空间上任意两点之间的相关性,因而难于表征复杂的空间结构和再现复杂目标的几何形态(如弯曲河道)。弯曲河道的3种不同的空间结构(图1a,b,c)在横向上(东西方向,图1d)和纵向上(南北方向,图1e)的变差函数十分相似,这说明应用变差函数不能区分这3种不同的空间结构及几何形态,因此,基于变差函数的传统地质统计学插值和模拟方法难于精确表征具有复杂空间结构和几何形态的地质体。 现有的储层随机建模的另一途径是基于目标的方法,它是以目标物体为基本模拟单元,进行离散物体的随机模拟(Haldorsen and Damsleth,1990;Holdenet al.,1998)。主要方法为示性点过程(亦称标点过程),其根据先验地质知识、点过程理论及优化方法(如模拟退火)表征目标地质体的空间分布,因此这种方法可以较好地再现目标体几何形态。但这种方法亦有其不足:1)每类具有不同几何形状的目标均需要有特定的一套参数(如长度、宽度、厚度等),而对于复杂几何形态,参数化较为困难;2)由于该方法属于迭代算法,因此当单一目标体内井数据较多时,井数据的条件化较为困难,而且要求大量机时

统计学基础知识期末复习资料

统计学基础知识期末复习资料 一、名词解释 1、统计学 统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。 2、指标和标志 标志是说明总体单位属性或特征的名称。指标是说明总体综合数量特征和数量关系的数字资料。 3、总体、样本和单位 统计总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。简称总体。构成总体的个体则称为总体单位,简称单位。样本是从总体中抽取的一部分单位。 4、统计调查 统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。它是取得统计数据的重要手段。 5、统计绝对数和统计相对数 反映总体规模的绝对数量值,在社会经济统计中称为总量指标。统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。 6、时期指标和时点指标 时期指标是反映总体在一段时期内累计总量的数字资料,是流量。时点指标是反映总体在某一时刻上具有的总量的数字资料,是存量。 7、抽样估计和假设检验 抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。假设检验是先对总体的某一数据提出假设,然后抽取样本,运用样本数据来检验假设成立与否。 8、变量和变异 标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。数量标志和指标在统计中称为变量。 9、参数和统计量 参数是反映总体特征的一些变量,包括总体平均数、总体方差、总体标准差等。统计量是反映样本特征的一些变量,包括样本平均数、样本方差、样本标准差等。 10、抽样平均误差 样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差,简称为抽样误差。重复抽样的抽样平均误差为总体标准差的1/n。 11、抽样极限误差 抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。我们用样本统计量变动的上限或下限与总体参数的绝对值表示抽样误差的可能范围,称为极限误差或允许误差。 12、重复抽样和不重复抽样 重复抽样也称为回置抽样,是从总体中随机抽取一个样本时,每次抽取一个样本单位

相关主题
文本预览
相关文档 最新文档