当前位置:文档之家› 地质统计学复习资料

地质统计学复习资料

地质统计学复习资料
地质统计学复习资料

计算:PPT第二讲、另外一讲、还有试卷

变差函数的概念:P12

区域化变量Z(x)和Z(x+h)两点之差的方差之半定义为Z(x)的变差函数,

它既能描述区域化变量的空间结构性变化,又能描述其随机性变化。

变差函数的作用与应用

变差函数是区域化空间变异性的一种度量,反映了空间变异程度随距离变化而变化的特征。变差函数强调三维空间上的数据构型,从而可定量的描述区域变化量的空间相关性,即地质规律所造成的储层参数在空间上的相关性。

了解区域化变量(随机场)的相关性(噪声,相关程度,相关范围)、空间场的各向异性、空间场的尺度特征、空间场的周期性特征。

模型的参数意义

变程(Range):指区域化变量在空间

上具有相关性的范围。在变程范围

之内,数据具有相关性;而在变程

之外,数据之间互不相关,即在变

程以外的观测值不对估计结果产生影响。变程的大小反映了变量空间的相关性。块金值(Nugget):变差函数如果在原点间断,在地质统计学中称为“块金效应”,表现为在很短的距离内有较大的空间变异性,无论h多小,两个随机变量都不相关。它可以由测量误差引起,也可以来自矿化现象的微观变异性。在数学上,块金值c0相当于变量纯随机性的部分。

块金效应的尺度效应:如果品位完全是典型的随机变量,则不论观测尺度大小,所得到的实验变差函数曲线总是接近于纯块金效应模型。

当采样网格过大时,将掩盖小尺度的结构,而将采样尺度内的变化均视为块金常数。这种现象即为块金效应的尺度效应。

基台值(Sill):代表变量在空间上的总变异性大小。即为变差函数在h大于变程时的值,为块金值c

和拱高cc之和。

拱高:在取得有效数据的尺度上,可观测得到的变异性幅度大小。当块金值等于0时,基台值即为拱高。

模型:P15

为何要拟合:P14

实验变差公式:PPT第2讲

假设

克里金法概念:P36

克里金插值与变差函数的关系

变差函数是克里金方法研究的主要工具,在克里金估计方法中,加权系数的求取是通过变差函数来获得的。由于变差函数只能反映变量的空间结构特征而不能反映变量的随机特征。所以利用克里金方法进行空间数据插差值往往可以取得理想的效果,另外通过设计变差函数,克里金方法很容易实现局部加权差值。

如何理解克里金插值是最优线性无偏估计

克里金插值首先考虑的是空间属性在空间位置上的变异分布.确定对一个待插点值有影响的距离范围,然后用此范围内的采样点来估计待插点的属性值。该方法在数学上可对所研究的对象提供一种最佳线性无偏估计(某点处的确定值)的方法。它是考虑了信息样品的形状、大小及与待估计块段相互间的空间位置等几何特征以及品位的空间结构之后,为达到线性、无偏和最小估计方差的估计,而对每一个样品赋与一定的系数,最后进行加权平均来估计块段品位的方法。这里的最优是指估计结果的理论方差最小,而无偏是指估计误差的期望值为零。

最优性的判别标准

克里金估计的理论方差越小,越优。

与随机模拟的主要区别

1、克里格插值法只考虑局部估计值的精确程度,力图对估计点的未知值作出最优的和无偏的估计,不考虑估计值的空间相关性(离散性);而随机模拟首先考虑的是结果的整体性质和模拟值的统计空间相关性,其次才是局部估计值的精度;

2、插值法给出观测值间的平滑估值(如绘出研究对象的平滑曲线图),而削弱了观测数据的离散性,忽略了井间的细微变化;而条件随机模拟在插值模型中系统地加上了“随机噪音”,这样产生的结果比插值模型真实得多。“随机噪音”正是井间的细微变化,虽然对于每一个局部的点,模拟值并不完全是真实的,估计方差甚至比插值法更大,但模拟曲线能更好地表现出曲线的真实波动情况。

3、插值算法(包括克里格法)只产生一个模型;而随机建模则产生多个可选的模型,各种模型之间的差别正是空间不确定性的表现。

随机模拟更适于储层非均质的研究,因为随机模拟更能反映储层性质的离散性,这对油田开发生产尤为重要。应用该技术建立储层模型可以得到某一属性场的多个不同的等概率实现,用以说明该属性场的空间组合的不确定性,从而为决策者提供了更加丰富的储层模型。插值法掩盖了非均质程度(即离散性),特别是离散性明显的储层参数(如渗透率)的非均质程度,因而不适用于渗透率非均质性的表征。当然,对于一些离散性不大的储层参数,如孔隙度,应用克里格插值方法研究其空间分布,并用于估计储量,亦表现出方便、快速、准确的优越性。

三维储层建模

建立储层特征三维分布的数字化模型,其本质是基于三维网格表征储层特征的分布,其成果是三维数据体,本质是从三维角度对储层进行定量研究并建立其三维模型,核心是对井间储层惊醒多学科综合一体化、三维定量化及可视化的预测。模型包括有构造、属性分布和流体分布模型,建立储层模型就是油藏描述。

序贯高斯模拟

原理:P62

流程图:P64

范畴:P72/60

优缺点:P64&以下的

步骤:P62或以下

序贯指示模拟

原理:P73

优缺点:P75/82

流程图:P76

范畴:指示模拟可用于模拟复杂各向异性的地质现象。由于各个类型变量均对应于一个指示变差函数,也就是说,对于具有不同连续性分布的类型变量(相),可给定(指定或通过数据推断)不同的指示变差函数,从而可建立各向异性的模拟图象。因此,指示模拟可用于多向分布的沉积相建模(如三角洲分流河道与河口坝复合体),也可用于断层和裂缝的随机建模。

步骤:P74或以下

布尔模型

过程:1、把已知井位处的砂体条件优化。2、随机抽样产生预测砂体中心位置。

3、是否与已知井位处的数据发生冲突,如果冲突,则须调整砂体,使之不冲突,否则进行下一步。4从经验累积概率分布函数中随机抽取该砂体的厚度。5、由已确定的厚度—宽度关系确定砂体宽度。6、计算目标函数值Fs=砂体剖面面积/剖面总面积7、重复步骤2产生的另一砂体,直至达到给定阈值为至。

优点:它是储层建模方法中最简单的以中算法,很容易将沉积学的一些知识,如砂体的宽厚比,厚度分布趋势等融入到模拟结果中,主要用于勘探和开发早期阶段。

缺点:完全随机的产生目标对象中心,没有考虑沉积过程中先沉积的河道砂体对

后面沉积的重要控制作用,用此种方法模拟的结果往往对砂体的连通性评价过高。原理:布尔模拟方法是基于目标的随机模拟方法中最简单的一种方法,Matheron 最早利用布尔模型用于描述岩石中颗粒与孔隙的分布。后来被用来描述储层中砂泥岩的分布[4,5]。设U为坐标随机变量,Xk是表征第k类物体几何特征(形状、大小、方向)的参数随机变量;第k类几何物体中心点的分布构成一点过程U,它可以用形状随机过程Xk和表示第k类几何物体出现与否的指标随机过程Ik两者的联合分布“示性”,从而构成一示性点过程。其中

布尔方法就是依据一定的概率定律,按照空间物体分布统计规律产生这些物体中心点的空间分布,并通过2×k个随机函数Xk(u),Ik(u,k)(k=1,2,3,…,k,u∈定义域)的联合分布,确定中心点在此处的物体的几何形状、大小、属性。

示性点过程原理

所谓示点性过程,就是对某一空间区域内的每一个离散点进行标值的过程,其基本思路是根据点过程的概率定律,按照空间中几何物体的分布规律产生这些物体的中心点空间分布,然后将物理性质(如物理几何形状、大小、方向等)标注于每一离散点[9],可以用随机序列ψ={[xn;m(xn)]}表示,其中xn为连续空间内的一个随机点过程,m(xn)为每个点的标值从地质统计学角度讲,示点性过程就是研究目标点及其性质在三维空间中的联合分布,可定义为由表示第i类目标点在位置u处是否出现的随机函数Pi(u,i)和描述第i类目标点物理性质(几何形状、大小、方向)参数的随机变量Xi组成的集合{Pi(u,i),Xi},这样通过在空间上先确定产生目标点的位置,再模拟产生目标的相关属性,构成了一次标点过程,并得到一次模拟实现。

示点性过程模拟建立在对目标体地质认识的基础上,在模拟过程中,将一些关于目标体的先验地质认识作为条件约束信息加入模型中,可以使随机模拟结果最大限度地接近地质实际。由于三维空间内目标体的分布以及目标体的属性极为复杂,在随机模拟过程中需要应用优化算法对目标体分布进行“逐步逼近”,即用各种参数分布和相互作用的多种组合进行迭代,直至最终得到一个满意的随机模拟结果为止。具体来说,就是设计一个目标函数,并确定一个目标函数阈值,根据先

验地质认识随机产生目标体,计算目标函数值,直至达到目标函数阈值为止。

优缺点:打印的文献《基于目标的随机建模方法》&根据先验地质知识、点过程理论及优化方法表征

多点地质统计学的基本思路及优缺点,训练图像的来源及意义。多点地质统计学是相对于基于变差函数的两点地质统计学而言的。多点统计是利用空间多个点组合模式进行描述。其核心分为三个部分:训练图像,数据事件,多点概率,其基本思路是通过数据样板扫描训练图像建立多点统计概率,利用获得的多点统计概率进行未知节点处概率模拟。

优点:在多点地质统计学中,应用“训练图像”代替变差函数表达地质变量的空间结构性,因而可克服传统地质统计学不能再现目标几何形态的不足,同时,由于该方法仍然以象元为模拟单元,而且采用序贯算法(非迭代算法),因而很容易忠实硬数据,并具有快速的特点,故克服了基于目标的随机模拟算法的不足。因此,多点地质统计学方法综合了基于象元和基于目标的算法优点,同时可克服已有的缺陷;多点统计学应用多点数据样板扫描训练图像以构建搜索树并从搜索树中求取条件概率分布函数使多点地质统计学克服了传统二点统计学难于表达复杂空间结构性和再现目标几何形态的不足。

缺点:1、训练图像平稳性问题,多点统计提出了一个几何变换的方法,即通过旋转和比例压缩将非平稳训练图像变为平稳训练图像,并建立多个训练图像以获取未取样点条件概率分布函数,但是,这一方法仍是一种简单化的解决途径,可以解决具有明显趋势而且用少量定量指标如方向和压缩比例能够表达的非平稳性,而对于无规律的局部明显变异性,尚需要更为有效的解决方案。2、目标连续性问题;

3、综合地震信息的问题;

4、当软数据类型较多时,扫描训练图像所得的重复数太少,从而影响条件概率的推导。

5、储层形态合理问题,多重网格搜索问题,

6、由于多点地质统计学仍是基于相元的算法,所以只能在一定程度上重现目标的形状,对于更复杂的如尖角或U型目标的应用较差

来源及意义:

储层建模的原则

我国含油气盆地类型多,储层以陆相碎屑岩及海相碳酸盐岩为主,储层成因复杂,非均质性严重。如河流、三角洲及冲积扇等环境形成的储层,在纵、横向上相变快,不同规模的非均质性严重。因此,对这类储层进行勘探与开发,将面临储层非均质性的问题。为了建立尽量符合地质实际情况的储层模型,针对我国储层的特点,制定如下建模原则。

4 .1 确定性建模与随机建模相结合的原则

确定性建模是根据确定性资料,推测出井间确定的、惟一的储层特征分布。而随机建模是对井间未知区应用随机模拟方法建立可选的、等概率的储层地质模型。应用随机建模方法,可建立一簇等概率的储层三维模型,因而可评价储层的不确定性,进一步把握井间储层的变化。在实际建模的过程中,为了尽量降低模型中的不确定性,应尽量应用确定性信息来限定随机建模的过程,这就是随机建模与确定性建模相结合的建模思路。

4 .2 等时建模原则

沉积地质体是在不同的时间段形成的。为了提高建模精度,在建模过程中应进行等时地质约束,即应用高分辨率层序地层学原理确定等时界面,并利用等时界面将沉积体划分为若干等时层。在建模时,按层建模,然后再将其组合为统一的三维沉积模型。同时,针对不同的等时层输入反映各自地质特征的不同的建模参数,这样可使所建模型能更客观地反映地质实际。

4 .3 相控储层建模原则

相控建模,即首先建立沉积相、储层结构或流动单元模型,然后根据不同沉积相(砂体类型或流动单元)的储层参数定量分布规律,分相(砂体类型或流动单元)进行井间插值或随机模拟,进而建立储层参数分布模型。

如何理解储层建模中的不确定性

储层的性质本来是确定的,在每一个位置点都具有确定的性质和特征;但地下储层结构又是很复杂的,他是许多复杂地质过程(沉积作用、沉岩作用和构造作用)综合作用的结果,具有复杂的储层内部构型及储层参数的空间变化。在储层表征中,由于用于描述储层的资料总是不完备的,测井和地震有分辨率大小的问题,所得出来的结果也有误差,有很多参数本身就存在很多不确定性(测井解释和地震解释都不准确),因此人们很难掌握任一尺度下储层的确定且真实储层特征,特别是对于连续性较差且非均质性较差的陆相储层来说更加难以精确的表征储层特征。这样由于认识程度的不同,储层描述便有不确定性。

储层建模的不确定性包括输入参数的不确定性和建模方法的不确定性。输入的参数不确定性包括测井解释参数的不确定性(测井过程引起的不确定性、钻井泥浆产生的不确定性、测井解释的不确定性、裂缝解释的不确定性),地震解释参数的不确定性(受地震分辨率限制,储层地震异常尺度远大于测井解释储层尺度、地震反射特征相同,其储层类型可能不一致),地质参数不确定性(野外地质露头统计参数只能给出沉积体系参数的分布范围,如何具体的去优选参数具有不确定性、局部统计的规律代替全局统计规律会产生误差),对于同一个储层,你会有不同的方法来对储层进行表征,不同的方法当然就会得到不同的表征结果,因此储层建模有不确定性。

如何评价模型的好坏

随机图像是否符合地质概念式;随机实现的统计参数与输入参数的接近程度;模拟现实是否忠实于真实数据,主要判别他与未参与模拟的硬数据是否吻合,如抽稀的井数据,试井反映的砂体连通性数据;模拟现实是否符合动态生产,可通过简单的二维油藏数值模拟或者局部的三维数模的“历史拟合”情况来进行判别。随机建模与不确定建模的关系

所谓随机建模是指以已知的信息为基础,以随机函数为理论,应用随机模拟方法,产生可选的、等概率的储层模型方法。通过对多个等可能随机储层模型中的不确定性进行评价,以满足油田勘探开发决策在一定风险范围的正确性的需要,这是

与确定性建模方法的重要差别。在随机建模中如果生成了大量的现实,这些现实肯定是有差别的,例如你用随机建模来计算储量,每一个现实就会得出一个计算结果,然后编制储量的累积概率分布曲线,那么在不同概率控制下,其会得到不同的结果,也就是说随机建模所得出结果是具有不确定。

对储层建模的理解

储层建模是近几年发展起来的高新技术,它可以实现对油气储层的定量表征及对各种尺度的非均质性的刻画。从本质上讲, 储层地质建模是从三维的角度对储层进行定量的研究, 其核心是对井间储层进行多学科综合一体化、三维定量化及可视化的预测。目前储层建模技术中较为常用的几种建模方法有确定性建模及随机建模。随机建模是目前储层建模技术的突出发展方向,是根据地质适用性的不同而建立的不同模型。它是反映储层地质特征三维变化与分布的数字化模型。这个模型可以从三维空间上定量的表征油藏的非均质性,有利于油田勘探开发工作者进行合理的油藏评价及开发管理;可以用于油藏评价、储量计算、开发可行性评价,还可以优化油田的开发方案。在开发的中后期可以预测剩余油的分布,优化注水开发调整及三次采油方案;在储量计算中,利用储层建模可以更精确的计算油气储量,比常规的计算方法更准确;有利于三维油藏数值模拟,粗化的三维储层地质模型可以直接作为油藏数值模拟的输入。

储层地质建模属于地质、数学与计算机等多学科结合的学科方向。建模内涵包括两大方面, 其一为储层地质特征的计算机图形显示, 属于计算机图形学的范畴,这一学科的发展已基本满足三维地质建模的图形显示需要, 如储层格架、储层相与岩石物理参数分布的三维图形显示( 目前已有的商业软件均可达到这一目的); 其二为井间储层特征的预测, 即应用已有信息预测储层特征的三维分布, 这就要求相应的建模方法, 它决定着所建立的模型是否符合地下地质实际, 亦即建模精度。

随机模拟方法的比较

Petrel步骤

数据加载、地层对比、断层建模、Pillar网格化、分层、相建模、岩石物性建模、体积计算、绘图、井位设计。

储层建模主要包括哪几步

数据准备、构造建模、储层相建模、储层参数建模、裂缝建模、油藏模型粗化。提高不确定性的对策

提高地震的识别与预测精度(利用绕射波分离技术凸显了裂缝反射信息,提高了不整合面附近及内幕小规模缝洞体的识别、不同的边缘检测技术综合反映洞体特征,提高了缝洞识别的可靠性),加强地质成因背景研究,将现在的地质现象与古代地下形成的地质现象结合起来研究。

对于不同的建模方法提出不同的优化对策

储层随机建模的发展前景?(趋势、展望)

答案1储层随机建模虽然经过不断完善,不断推陈出新,然而应该看到,地质现象是非常复杂的,储层随机建模在许多方面仍然需要努力,以满足油田生产开发的需求。

3.1目标之间相互影响与函数的确定目标之间相互影响具有成因上的意义。对于河道沉积,先期沉积的河道影响后期河道的分布。一般来说,先期沉积河道区由于地形的变化往往成为后期河道沉积时的背景相区。而同期沉积河道之间与沉积时构造、地形、坡度、物源等密切相关。仅考虑地质体之间的距离过于简化。此外对于不同目标体之间的影响考虑不够。例如,对于河流沉积体系,其沉积具有成因层次关系。河道规模决定着堤岸、决口扇等沉积微相的规模、分布等。对河流系统的建模应该考虑这些因素。而基于目标的示性点过程由于是分目标的模拟,很难考虑到目标间这种成因关系。如何在模拟中考虑目标之间的相互影响,并用数学模型来表征应该是储层建模以后研究的一个重要方向。

3.2获取反应实际储层结构特征的参数

随机建模需要输入大量参数。在基于目标的建模中,需要输入目标的几何形态参数,以及目标相互之间影响参数;在两点统计学中,需要输入变差函数特征参数;在多点地质统计学中,需要输入反映储层结构特征的训练图像。这些参数的获取需要地质家仔细分析,其获取相当的困难。在基于目标的建模中,目标的几何形态参数化往往难以进行,因为地下储层形态很难用简单的长宽高来表述,甚至难以用数学函数来反映。在两点统计学中,变差函数仅反映了两点相关关系,其准确推断和拟合是模拟的基础。在多点统计学中,训练图象决定着多点概率的求取,不同的训练图像将会产生不同的模拟结果。如何获取反映地下储层结构特征的训练图像一直是研究的热点和难点。

3.3先验概率的求取

在储层随机建模中,先验概率的获得往往被忽视。先验概率也是影响模型不确定性的重要因素。在勘探阶段,先验概率的提取相当困难,这是因为此时数据量过少,不足以推断出目标参数准确分布,导致模拟结果带有不确定性。在开发阶段,数据量增加,使得先验概率的推断成为可能。尽管如此,这种先验概率的获得仍然依赖于人的主观思考,因而其中必然存在不确定性。因此对先验概率的求取也应该引起相当重视。

3.4随机模拟结果评价

对随机模拟结果的评价一直受到储层建模家关注。为了对随机模拟结果进行合理评价,不同学者给出了不同的评判标准。例如通过统计多个实现上每个网格点目标出现的概率来获取最优的模拟结果;通过抽稀检验评价模拟结果;通过与实际储层展布模式对比评价模拟结果等等。由于随机建模结果将会输入到数值模拟中,因此利用数值模拟结果进行检验将是对随机模拟结果评价的一个方向。

答案2储层随机建模技术用于研究储层岩相、裂缝、孔隙、渗透率、流体饱和度的分布规律并提供关于数据空白区的一系列的随机模拟数据。

其发展一方面体现在建模方法本身的研究进展上,另一方面体现在其使用资料及适用领域方面的拓展。有关随机建模方法的文献近年来在一些会议和杂志上大量出现。这些文献对诸如马尔可夫随机模拟、河道分布模拟、依据地震数据用神经网络法进行岩相模拟、分形模拟、序贯高斯模拟和截断高斯模拟以及概率场模拟之间的理论联系、基于目标模拟和基于象元模拟方法的差别等等问题进行了讨论。

根据该方面所发表的文献看,随机建模技术目前比较前沿的领域是马尔可夫、半马尔可夫域模拟,分形模拟在裂缝研究中的应用,示性点过程模拟中地质知识的应用,不同建模方法的耦合等问题。而且,由于研究的深入,过去储层表征、随机建模领域主要利用井资料分析相带空间展布及物性空间特征的基本格局正在被突破。地震资料在储层随机建模中的应用越来越多,如岩相建模时地震速度的应用,模拟退火算法中地震资料和露头及井资料的结合等。由于这些进展,随机建模的思路与方法也开始在地震正演、反演中得到应用。

储层随机建模技术已经成为储层精细描述、预测及勘探开发风险评价的有效手段并在不断发展之中。由于不同沉积模型研究尺度大小不同,较大尺度沉积模型的

研究往往对较小尺度规模的模型研究产生制约,因此,对研究区比例尺模型、相关概念模型及相关确定性储层建模技术的熟练掌握程度,往往与储层随机建模的有效与否有着重要关系,不同沉积模型之间的结合性研究会有力地促进储层随机建模方法研究以及随机建模应用领域的拓展。】

储层建模的发展前景?(趋势、展望)

鉴于目前储层建模存在的问题, 期望在下述方面作进一步的研究, 以提高建模方法的地质适用性,使地质模型更加逼近地质实际。

3.1 建模算法的改进

前已述及, 目前已有的储层建模算法尚存在一定的问题。以储层构型建模为例, 目前的建模方法尚难于建立真正意义上的三维储层构型模型。

对于基于目标的方法, 今后算法的改进主要在以下几个方面:( 1) 复杂地质体的建模问题, 如将储层构型分析中的侧积体作为目标体的随机建模;( 2) 获取先验地质知识并有效地整合到建模过程中; ( 3) 基于过程的模拟如何实现井数据条件化等。针对多点统计建模, 可以考虑从以下方面改进:( 1) 建立不同的训练图像以反映不同的非均质性, 解决如河道的规模变化、形态变化等非平稳现象;( 2) 目标体连续性的改进, 以产生更加连续的目标体;( 3) 三维模拟中数据事件及三维训练图像的建立;( 4) 综合多学科信息以及物性建模等方面。另外, 裂缝性及缝洞性储层的建模算法仍很不完善, 亦需大力改进。

3.2 原型模型的丰富

通过露头、现代沉积及开发成熟油田的密井网区建立储层地质知识库, 可为储层建模提供必要的地质统计特征参数。国内外学者对此作了不少的工作。

然而, 已有的定量地质知识库尚需进一步完善, 以满足精细储层地质建模的需要。地质知识库不仅要求有单一成因单元的定量几何形态, 而且要求有各成因单元的定量组合模式; 另外, 针对同一沉积类型, 应建立其不同演化阶段的储层构型过程响应定量模式。

3.3 地震信息的整合

在储层建模过程中如何充分应用地震属性是目前面临的主要挑战之一。地震资料具有其它资料难于比拟的井间横向信息, 但其不足是垂向分辨率低与多解性强。已有建模方法虽然考虑了地震信息的整合, 但尚有很多问题需要解决。

在继续提高地震垂向分辨率的前提下, 约束地震资料的多解性就成为提高储层预测与建模精度的关键。一是应加强地震正演模拟, 进一步研究不同类型储层定量模式的地震响应; 二是应进一步发展相控储层预测方法, 以提高储层预测的精度; 三是应进一步研究整合地震属性特别是多属性的储层建模算法。另外, 由于地震资料为时间域信息, 因此加强速度场研究, 提高时—深转换精度亦是应用地震资料进行精细地质建模的关键。

3.4 地质约束

为了建立尽量符合地质实际的储层模型, 在建模过程中应尽量进行地质约束, 如等时约束建模、成因控制建模、应用目标区多学科信息或原型模型确定统计特征参数建模、应用确定性信息限定随机模拟过程等地质约束原则。除此之外, 在建模过程中应特别重视层次分析与模式拟合。

沉积地质体具有层次性。因此, 应分别按照不同级次的构型进行建模, 如分别按微相组合、单一微相、微相内部单元等进行建模。对于不同级次的构型, 输入反映各自地质特征的不同的建模参数,这样可使所建模型能更客观地反映地质实际。模式拟合建模主要是指在各层次的建模过程中, 分别依据不同级次的定量模式, 对储层的空间分布和物性特征进行合理的井间预测。层次分析与模式拟合应贯穿于储层建模的全过程。

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

生物统计学期末考试上机考试部分 复习试卷B

云南师范大学2010~2011学年下学期期末统一考试 高级生物统计学实验(期末) 试卷 学院 专业 年级 学号 姓名 考试方式(闭卷或开卷): 闭卷 考试时量:60分钟 试卷编号(B 卷): 题号 一 二 三 四 五 总分 评卷人 得分 一、下表为某种动物在不同温度下的代谢率的变化,试比较温度对其代谢率 有无影响?并对SSR 法其进行多重比较 温度(℃) 代谢率(mlO 2/g.h ) -5 2.78 3.80 4.87 4.68 5.51 5.67 5.10 2.79 2.60 3.14 4.26 3.72 3.48 2.86 3.37 3.32 4.35 4.59 4.66 4.83 5.16 -5 -5 -5 -5 -5 -5 .00 .00 .00 .00 .00 .00 .00 5.0 5.0 5.0 5.0 5.0 5.0 5.0

ANOVA 数据 7.1972 3.598 5.684 .012 11.39718.633 18.593 20 Between Groups Within Groups Total Sum of Squares df Mean Square F Sig. 经但因素方差分析的:f=5.684, p=0.012,差异显著,说明多有作用, 数据 Duncan a 7 3.2643 7 4.32577 4.6300 1.000.484 温度231Sig. N 12Subset for alpha = .05 Means for groups in homogeneous subsets are displayed. Uses H armonic Mean Sample Size = 7.000. a. 二、为调查红绿色盲是否与性别有关,某单位调查结果如下: 色盲 非色盲 男 32 168 女 13 232 问红绿色盲是否与性别有关? 三、试用交互误差图比较不同季节某种动物的胃长(cm )的变化?并绘制出其在 95%置信带 季节 胃长(cm )

教育统计学考试复习资料

第一章:1、何谓心理与教育统计学?学习它有何意义? 教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析教育科学研究中获得的随机性数据资料,并根据这些数据资料所传递的信息,进行科学推论找出教育活动规律的一门科学。具体讲,就是在教育研究中,通过调查、实验、测量等手段有意获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 意义:(1)统计学为科学研究提供了一种科学方法。(2)教育统计学是教育科学研究定量分析的重要重要工具。 (3)广大教育工作者学习教育统计学既可以顺利地阅读国内外先进的研究成果,又可以提高工作的科学性和效率,同时也为学习教育测量打下基础。 2、教育科学研究数据的特点 (1)教育科学研究数据与结果多用数字形式呈现;(2)教育科学研究数据具有随机性和变异性;(3)教育科学研究数据具有规律性;(4)教育科学研究的目的是通过部分数据来推测总体特征。总之,在教育科学实验或调查中,所获得的数据都具有变异性与规律性的特点。 3、思考题:选用统计方法有哪几个步骤? ①要分析一下实验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方 法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的。②要分析实验数据的类型。不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要。③要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件。 4、教育统计学的分类 (1)依研究的问题实质来划分,教育统计学的研究内容可划分为描述一件事物的性质、比较两件事物之间的差异、分析影响事物变化的因素、一件事物两种不同属性之间的相互关系、取样方法等等。(2)依统计方法的功能进行分类,教育统计学的研究内容可分为描述统计、推论统计和实验设计。 5、描述统计:主要研究如何整理科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性 质。 具体内容包括:(1)数据如何分组,如何使用各种统计图表描述一组数据的分布情况;(2)怎样计算一组数据的特征值,简缩数据,进一步描述一组数据的全貌;(3)表示一事物两种或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件,描述数据分布特征的峰度及偏度系数计算方法等。 6、推论统计:主要研究如何通过局部数据所提供的信息,推论总体(或称全局)的情形。 具体内容包括:(1)如何对假设进行检验,即各种各样的假设检验,包括大样本检验方法(z检验),小样本检验方法(t检验),各种计数资料的假设检验的方法(百分数检验、χ2检验等),变异数分析的方法(F检验),回归分析方法等等。(2)总体参数的估计方法。(3)各种非参数的统计方法等。 7、思考题:描述统计、推论统计和实验设计这三部分统计内容有何关系? 教育统计学的三个组成部分的内容不是截然分开的,而是相互联系的。描述统计是推论统计的基础,推论统计离不开描述统计计算所获得的特征值;描述统计只是对数据进行一般的分析归纳,如果不进一步应用推论统计作进一步的分析,描述统计的结果就不会产生更大的价值和意义,达不到统计分析的最终目的要求。同样,只有良好的实验设计才能使所获得的数据具有意义,进一步的统计处理才能说明问题。当然一个好的实验设计,也必须符合基本的统计方法的要求,否则,再好的设计,如果事先没有确定适当的统计方法处理,在处理研究结果时可能会遇到许多麻烦问题。 8、教育统计与心理统计的异同 相同之处:二者的研究对象都是人,教育现象在很多情况下要通过人的心理现象去观察和分析,统计方法基本相同。不同之处:①在统计方法上:在教育方面的研究中,大样本的统计方法应用较多;而在心理学上小样本的方法较多。②在实验设计的水平上:教育实验中控制因素较难,采用自然实验、准实验设计方式较多,对统计结果的解释需要特别谨慎;而心理学实验则在实验室条件下进行较多,对各种实验变量的控制相对容易,统计处理结果的解释也较易进行。 9、数据的类型 (一)从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类。 计数数据是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数的形式。测量数据是借助于一定的测量工具或一定的测量标准而获得的数据。 (二)根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型。

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

2017统计学考试复习资料

统计学考试复习资料 简答题(12题选5个) 1、统计数据的类型有哪些? (1)、按计量层次分类: a.分类数据:只能归于某一类别的非数字型数据;对事物进行分类的结果,数据表现为类别,用文字来表述,例如:人口按性别分为男、女两类。 b.顺序数据:只能归于某一有序类别的非数字型数据;对事物类别顺序的测度,数据表现为类别,用文字来表述,例如:产品分为一等品、二等品、三等品、次品等。 c.数值型数据:按数字尺度测量的观察值,结果表现为具体的数值,对事物的精确测度,例如:身高为175cm、168cm、183cm。 (2).按收集方法分类: a.观测的数据:通过调查或观测而收集到的数据在没有对事物人为控制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据。 b.试验的数据:在试验中控制试验对象而收集到的数据,比如,对一种新药疗效的试验,对一种新的农作物品种的试验等自然科学领域的数据大多数都为试验数据。 (3).按时间状况分类: a.截面数据:在相同或近似相同的时间点上收集的数据 描述现象在某一时刻的变化情况,比如,2005年我国各地区的国内生产总值数据。 b.时间序列数据:在不同时间上收集到的数据描述现象随时间变化的情况比如,2000年至2005年国内生产总值数据。 2、简述数据误差的来源? (1)抽样误差:由于抽样的随机性带来的误差,所有样本可能的结果与总体真值

之间的平均性差异,影响抽样误差的大小的因素为样本量的大小和总体的变异性。 (2)非抽样误差:相对抽样误差而言,除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异。存在与所有的调查之中:概率抽样、非概率抽样、全面性调查。有抽样框误差、回答误差、无回答误差、调查员误差、测量误差。 3、衡量数据离散程度的指标有哪些? 衡量数据离散程度的指标有:(1).异众比率,用于测度分类数据的离散程度,衡量众数对一组数据的代表程度;(2).四分位差,用于测量顺序数据的离散程度,衡量中位数对一组数据的代表程度;(3).方差和标准差,用于测度数据离散程度的最常用测度值,衡量均值对一组数据的代表程度。 4、为什么说正态分布是客观现象中最主要的分布? 正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。 5、请你说明小概率原理的含义? 在概率论中,我们将发生概率很小一般来说不超过百分之五的事件称为小概率事件,小概率原理指的是在假设检验中,我们提出一个假设,用小概率事件去检验,如果小概率事件发生了,证明我们的假设有问题。 6、评价估计量的标准有哪些?并解释他们的含义。 在实际工作中,总体参数往往是未知的,需要使用样本统计量来估计总体参数。衡量估计量优劣的标准一般有以下三个: (1)无偏性:无偏性不是要求估计量与总体参数不得有偏差,因为这是不可能的,既然是抽样,必然存在抽样误差,不可能与总体完全相同。无偏性指的是如果对这同一个总体反复多次抽样,则要求各个样本所得出的估计量(统计量)的平均值等于总体参数。符合这种要求的估计量被称为无偏估计量。(2)有效性:估计量与总体之间必然存在着一定的误差,衡量这个误差大小的一个指标就是方差,

生物统计学第四版知识点总结

一、田间试验的特点 1、田间试验具有严格的地区性和季节性,试验周期长。 2、田间试验普遍存在试验误差 3、研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研 究其生长发育规律、各项栽培技术或栽培条件的效果。 二、田间试验的基本要求 结果重演性、结果可靠性、条件先进代表性、目的明确性 三、单因素试验的处理数就是该因素的水平数。 四、例如:甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组 合数是? 3因素3水平的处理组合数是? 多因素试验的处理数是各因素不同水平数的所有组合。 五、如进行一个喷施叶面肥的试验,如果设置两个叶面肥浓度,对照应为 喷施等量清水。 六、简单效应的计算 N 的简单效应为40-30=10 在N1水平下,P2与P1的简单效应为38-30=8;在N2水平下,P2与P1的简单效应为54-40=14。 七、平均效应的计算 P的主效(8+14)/2=11; N的主效(10+16)/2=13; 八、互作的计算 N与P的互作为(16-10)/2=3或(14-8)/2=3 九、田间试验误差可分为系统误差和随机误差两种。(1、系统误差影响试 验的准确性,随机误差影响试验的精确性。2、准确度受系统误差影 响,也受随机误差影响;精确度受随机误差影响。3、若消除系统误 差,则精确度=准确度。) 十、小区面积扩大,误差降低,但扩大到一定程度,误差降低就不明显了。 适当的时候可以考虑增加重复次数来降低误差。小区面积一般在 6-60m2,而示范小区面积不小于330m2 。 十一、通常情况下,狭长小区误差比方形小区误差小。 小区的长边必须与肥力梯度方向平行,即与肥力变化最大的方向平行。一般小区长宽比为3-10:1,甚至达20:1 十二、何时采用方形小区?(1)肥水试验;(2)边际效应值得重视的试验。 十三、一般小区面积较小的试验,重复次数可相应增多,可设3-6次重复; 小区面积较大的试验可设2-4次重复。 十四、将对照或早熟品种种在试验田四周,一般4行以上。目的?(目的是防止外来因素破坏及边际效应的影响。) 十五、算术平均数的主要特征 ?1、样本各观测值与平均数之差的和为零,即离均差之和为0。 2、离均差的平方和最小。 十六、【例3·1】在1、2、3、…、20这20个数字中随机抽取1个,求下列随机事件的概率。 (1)A=“抽得1个数字≤4”;

生物统计学考试题及答案

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专 业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已 知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。

A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是 2、态分布不具有下列哪种特征( )。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 3、一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( )。 A 、 2MSe/6 , 3 B 、 MSe/6 , 3 C 、 2MSe/3 , 12 D 、 MSe/3 , 12 4、已知),N(~x 2σμ,则x 在区间]96.1,[σμ+-∞的概率为( )。 A 、0.025 B 、0.975 C 、0.95 D 、0.05 5、 方差分析时,进行数据转换的目的是( )。 A. 误差方差同质 B. 处理效应与环境效应线性可加 C. 误差方差具有正态性 D. A 、B 、C 都对 三、简答题;(每小题6分,共30分 ) 1、方差分析有哪些步骤? 2、统计假设是?统计假设分类及含义? 3、卡方检验主要用于哪些方面? 4、显著性检验的基本步骤? 5、平均数有哪些?各用于什么情况? 四、计算题;(共4题、50分) 1、进行大豆等位酶Aph 的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于下表。试分析大豆Aph 等位酶的等位基因型频率是否因物种而不同。( 99 .52 05.0,2=χ, 81 .7205.0,3=χ)(10分) 野生大豆和栽培大豆Aph 等位酶的等位基因型次数分布 物 种 等位基因型 1 2 3 野生大豆 29 68 96

关于生物统计学考试复习题库

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). 12 2--∑∑n n x x )(

初级生物统计学学习心得

高级生物统计学课程学习总结 摘要:经过一学期对生物统计学的学习,我对生物统计学有了进一步的理解。本文主 要讲述了本学期学习生物统计之后,我对生物统计学的收获和体会。 关键词:生物统计学 收获 体会 学习了黄老师讲授的《高级生物统计学》这门课程,我觉得自己又收获了不少。经过一学期对生物统计学的学习,我对生物统计学有了进一步的理解。虽说我的专业是课程与 教学论,对生物统计学知识的运用较少,但我深信,于我自身,它将起到不可估量的作用。 下面主要谈谈我对这门课程的理解与感悟。 1.对生物统计学的认识 1.1生物统计学的概念 生物统计学是一门以概率理论为基础的,实际应用性非常强的综合性的学科。它运用概率论与数理统计的原理和方法处理生物学中的各种数量资料,从而透过现象揭示生物学 本质的一门科学,是科学研究与实践应用的基础工具。它是研究如何搜集、整理、分析反 映整体信息的数字资料,并以此为依据,推断总体特征,然后用生物学的语言加以描述的 工具。 从生物统计学的概念我们不难看出,生物统计是要我们根据部分所反映出来的性质,推断总体的性质,在推断的过程中,不可避免的会有一定的出错概率,我们只是选择不同 的分析方法将这一概率降到最低。它不仅为我们提供了设计试验,获取资料的方法,还提 供了整理资料,最后得出科学结论的方法。因此,学好生物统计对我们以后设计试验,分 析试验数据,得出科学而精简的结论有很大帮助。 1.2生物统计学的重要性 统计学在生物学中的应用已有长远的历史,许多统计的理论与方法也是自生物上的应用发展而来,而且生物统计是一个极重要的跨生命科学各研究领域的平台。 随着基因组学、蛋白质组学与生物信息学的蓬勃发展,使得生物统计在这些突破性生 物科技领域上扮演着不可或缺的角色。,生物统计学在这些领域被广泛应用,并显得日益重 要。生物统计学是生物领域学生应具备的基本知识和素质,与生命活动有关的各种现象中 普遍存在着随机现象,大到整个生态系统,小到核苷酸序列,均受到许多随机因素的影响, 表现为各种各样的随机现象,而生物统计学正是从数量方面揭示大量随机现象中存在的必 然规律的学科。因此,生物统计学是一门在实践中应用十分广泛的工具学科,它是生物科 管线不仅可以解决吊顶层配卷问题,而且可保障各类路敷设过程中,要加强看料试卷连接管口处理高中资料试卷保护层防腐跨接地线弯曲半径标高中语文电气课件中管壁薄、接利用管线敷设技术。线缆敷设原则不同电压回路交叉时,应采用金属同一线槽内强电回路须同时切根据生产工艺高中资料试卷要求,与带负荷下高中资料试卷调控试使其在正常工况下与过度工作下都于继电保护进行整核对定值,审核杂设备与装置高中资料试卷调试动过程中高中资料试卷电气设备进过关运行高中资料试卷技术指导中资料试卷技术问题,作为调试人图纸资料、设备制造厂家出具高案。 保护高中资料试卷配置技术是指高中资料试卷总体配置时,需要在机组高中资料试卷安全,并且尽可料试卷破坏范围,或者对某些异进行自动处理,尤其要避免错误高然停机。因此,电力高中资料试,要求电力保护装置做到准确灵活置高中资料试卷调试技术是指发电内部故障时,需要进行外部电源

(完整word版)生物统计学复习资料(整理).docx

生物统计学复习资料 第一章 1.生物统计学的基本作用: 1)提供整理和描述数据资料的科学方法,确定某些性状和特征的数量特征。 2)判断试验结果的可靠性 3)提供由样本推断总体的方法 4)提供试验设计的一些重要原则 3.总体:具有相同性质的个体所组成的集合 4.个体:组成整体的基本单元 5.样本:从总体中抽出的若干个体所构成的集合 6.变量:相同性质的事物间表现差异性的某项特征。按其性质分为连续变量和非连续变量。变量可以是定量的,也可以是定性的。 7.连续变量:表示在变量范围内可抽出某一范围的所有值 8.非连续变量:也称离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。 9.常数:是不能给予不同数值的变量,它代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。 10.参数:对总体特征的度量 11.统计数:由测定样本的全部重复观测值算得的描述样本的特征的数。 12.效应:试验因素相对独立的作用 13.误差:是试验中不可控因素所引起的观测值偏离真值的差异 14.随机误差:由于试验中许多无法控制的偶然因素所造成的试验结果与真实结 果之间的差异,不可避免。 15.系统误差:由于试验处理以外的其他条件明显不一致所产生的带有倾向性或 定向性的偏差,可避免。 16.错误:是指在试验过程中,人为因素所引起的差错。 17.准确性:在调查或试验中某一试验指标或性状的观测值与真实值接近程度 18.精确性:指调查或试验中同一试验指标或性状的重复观测值彼此接近程度的 大小。 第二章 1.次数分布:在不同区间内变量出现的次数所构成的分布。 2.资料根据生物的形状特性,可分为数量性状和质量性状

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

2020年统计学考试复习资料

《统计学》复习资料 一、单项选择题: 1. 调查项目通常以表的形式表示,称作调查表,一般可分为( B )。 A.单一表和复合表 B.单一表和一览表 C.简单表和复合表 D.简单表和一览表 2. 要准确地反映异距数列的实际分布情况,必须采用( D ) A.次数 B.累计频率 C.频率 D.次数密度 3. 政治算术派产生于17世纪资本主义的英国,代表人物是( B )。 A.亚当·斯密 B.威廉·配第 C.康令 D.凯特勒 4. 进行相关分析,要求相关的两个变量( A )。 A.都是随机的 B.都不是随机的 C.一个是随机的,一个不是随机的 D.随机或不随机都可以 5. 调查某市工业企业职工的工种、工龄、文化程度等情况( D )。 A.填报单位是每个职工 B.调查单位是每个企业 C.调查单位和填报单位都是企业 D.调查单位是每个职工,填报单位是每个企业 6. 下面的函数关系是( B )。

A.销售人员测验成绩与销售额大小的关系 B.圆周的长度决定于它的半径 C.家庭的收入和消费的关系 D.数学成绩与统计学成绩的关系 7.统计总体的同质性是指( B )。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志属性或数量标志值D.总体各单位具有若干互不相同的品质标志或数量标志 8.反映抽样指标与总体指标之间抽样误差可能范围的指标是( C )。 A.抽样平均误差;B.抽样极限误差; C.抽样误差系数;D.概率度 9.某工人月工资90元,则工资是( C )。 A、质量指标 B、数量指标 C、数量标志 D、变量值 10.某厂工业总产值逐年有所增加,1999年、2001年、2002年分别增长5%、8%、10%,三年工业总产值总共增长( D )。A.23% B.22% C.11.2% D.24.74% 11.某电器厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应选择( C ). A.统计报表B.重点调查C.全面调查D.抽样调查

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

期末考试复习--统计学

习题课 1、有两个班同学参加统计学考试,甲班的平均分数81分,标准差9.9分,乙班的考试成绩如下: 要求:(1)计算乙班的平均分数和标准差。 (2)比较哪个班的平均分数更有代表性。 解题过程参考教材和作业。 2、某钢铁厂2002年—2007年钢铁产量如下表。 (1)计算出表中各动态分析指标的数值,并填入表内的相应格中,

(2)计算2002年—2007年的平均增长量。 需要掌握的时间序列的动态分析指标有: 1. 增长量: (1) 逐期增长量:12312;;;----n n a a a a a a (2) 累积增长量:00201;;;a a a a a a n --- (3) 平均增长量 = 逐期增长量之和/逐期增长量个数 = 累积增长量/(时间序列项数-1) 2. 发展速度与增长速度: (1) 环比发展速度:123 12,,,-n n a a a a a a (2) 定基发展速度: 02 01,,a a a a a a n (3) 增长速度 = 发展速度-1 (4) 平均发展速度 = n n a a 0 (5) 平均增长速度 = 平均发展速度-1 3、某厂生产的三种产品的有关资料如下:

要求: (1)计算三种产品的价格总指数以及由于价格变动使销售总额变动的绝对额 (2)计算三种产品的销售量总指数以及由于销售量变动而使销售总额变动的绝对额 (3)利用指数体系分析说明销售总额(相对程度和绝对额)变动的情况 解:列表计算如下:

(1)三种产品的价格指数: %11515.126100 30100 11 1或== = ∑∑z q z q k z 由于价格变动影响的销售总额绝对额: ∑∑0111-z q z q =30100-26100=4000元 (2)三种产品的销售量总指数: %10303.125350 26100 001或== = ∑∑z q z q k q 由于销售量变动影响的销售总额绝对额: ∑∑0001-z q z q =26100-25350=750元 (3) 销售总额指数: %7.118187.125350 30100 01 1或== = ∑∑z q z q k qz 销售总额的绝对额: ∑∑0011-z q z q =30100-25350=4750元 指数体系:118.7%=115%*103% 4750万元=4000万元+750万元 分析说明:………….….。 4、宁波新四方快餐厅连续3个星期抽查49位顾客,以调查顾客的平 均消费额,得样本平均消费额为25元,并假设总体的标准差为10.5元,要求:

统计学考试要点整理

2010级3班整理生物统计学基础知识整理 生物统计学整理 第一部分名词解释本文档仅供参考,仍有不足,有许多名词没有交待,需自己补充。本资料与课本,课后习题册搭配使用效果更好,有疑问联系大正 1生物统计学:是一门探讨如何从事生物学实验研究的设计,取样,分析,资料整理与推 论的科学.是数理统计在生物学研究中的应用,它是应用数理统计的 原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科, 属于应用统计学的一个分支。 2总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。 3个体:构成总体的每个成员称为个体。 4样本:总体的一部分称为样本 5样本含量:样本内包含的个体数目称为样本含量 6抽样:从总体中获得样本的过程。 7连续性数据:与某种标准做比较所得到的数据称为连续型数据,又称为度量数据 8离散型数据:由记录不同类别个体的数目所得到的数据,称为离散型数据 9变量的方法:对连续性数据进行分析的方法,通常称为变量的方法 10属性的方法:对离散型数据进行分析的方法 11对于数据的变异程度,经常使用的度量方法有三中,1 范围或称为极差 2 平均离差 3 标准离差或称为标准差 12概率论:研究偶然现象本身规律性的科学 13统计学:基于实际观测结果,利用概率论得出的规律,揭示偶然性中所寄寓的必然性 的科学 14随机实验:在我们做第一次观测时,并不能准确得知下一次的结果,这样的实验叫做随机实验 随机误差:试验过程中,由于各种无法控制的随机因素所引起统计量与参数之间的偏差,称之为随机误差。 15基本事件:试验的每一最基本结果用小写拉丁字母表示

2.什么叫总体?什么叫样本?为什么要抽样?怎样抽样? 1)总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。 2)样本:总体的一部分称为样本 3)从总体中获得样本的过程称为抽样,抽样的目的是希望通过对样本的 研究,推断其总体。生物统计学中往往总体数目是无限个,为方便研究总 体特征需要抽样。 4)从总体中抽取样本时,总体中的每一个个体被抽中的机会必须都一样,不能带有偏见,我们得到的样本应该是该市总体的一部分,需要进行随机 抽样。随机抽样的方法很多,例如抽签,拈阄等。最好方法是使用随机数 字表进行抽样。 5)随即数字表抽样步骤:第一步,闭上眼睛用铅笔在随机数字表上任意 点上一点,假若点到奇数,就用第一页表;假若点到偶数,就用第二页表。 第二步,在选定的那一页上,在点一次,决定从那个字开始。决定开始以 后进行读书(例如,总体有 4728 个个体,那就四位数字为一节读下去,

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

相关主题
文本预览
相关文档 最新文档