当前位置:文档之家› 《生物统计学》复习资料

《生物统计学》复习资料

《生物统计学》复习资料
《生物统计学》复习资料

《生物统计学》复习资料

2012.06 一、名词解释。

★集团:也称总体或母体,是符合指定条件的所有个体所组成(有限与无限)。

☆集团参数:由集团的全部个体观测值按一定方法计算出来的、反应集团特征的数值。

☆个体:构成集团的基本单位;对每个个体的同一特征(性状)进行观测可得到1个观测数据。☆样本:按一定方法从集团中抽取出的一部分个体构成一个样本。

☆样本统计量:由样本中的全部个体观测值按一定方法计算出来的、反应样本特征的数值。

★偶然误差(机误):由非研究因素(环境条件)的随机波动对研究对象的影响而行成的试验指标的随机变化(实际观测值以真值为对称中心随机波动)。

☆系统误差:由非研究因素(环境条件)的趋势性(方向性)变化对研究对象的影响而行成的试验指标的方向性变化(实际观测值表现为普遍比真值大或小)。

☆准确度:实际观测值与真值间的符合程度。

☆精确度:实际观测值相互间的符合程度。

☆重复:每个处理在试验结束后能获得2个或更多的观测值。

★局部控制(区组化):将试验空间分范围地控制环境因素,使其对处理小区的影响达到最大程度的一致。

☆随机排列:各处理在小区中的位置由机会(而非主观意愿)决定且每个处理被安排在每个小区的机会要相等。

☆重复区:试验空间内人为根据环境变化情况划分的、各种非研究因素能够保持最大程度一致性的区域。

☆小区:安排试验处理的最小空间区域。

☆试验方案(狭义):根据试验目的和要求所拟定进行比较的一组试验处理的总称。

★试验因子:对试验对象在某方面的表现(试验指标)有影响的,试验过程中需要进行考查的条件。

★试验因素:有待比较的一组处理的因子。

★试验处理:预先设计好实施在试验单位上的一种具体措施。

☆试验水平:在试验中被人为设置的每种状态。

★试验指标:在某一项研究活动中,并不可能对所有的经济性状都进行研究,故而只能确定其中的某一个或某几个性状为需要进行研究和分析的目标性状,其余均为非目标性状,则相应的目标性状即为试验研究中的试验指标。

☆试验效应:试验指标因研究因子水平的不同而表现出的数量变化。

☆主效应:试验指标在单个因子水平间表现出的平均差异称为该因子的主效应。

☆交互效应:不同因子间的相互影响从而导致的试验指标的变化,即复因子试验中去除各因子主效应后的剩余效应则为因子间的交互效应。

☆试验空间:放置试验对象并实施研究活动的空间。

★适合性测验:根据X2值估计实际数据与预期理论值假设测验的统计方法。

★统计学第一类错误:统计假设μ=μ0为真,被判为假。

☆统计学第二类错误:统计假设μ=μ0为假,被判为真。

★显著水平:统计学中犯第一类型错误的最大概率。

★t0.05,12:自由度为12,显著水平为5%的相关系数t的值。

★正交实验:根据正交表来安排的试验。

★局部控制(区组化):将试验空间分范围地控制环境因素,使其对处理小区的影响达到最大程度的一致。

☆边缘效应:因试验小区或试验地边缘位置的试验对象由于受外部条件的影响而表现出来的试验指标观测数值异常现象。

☆随机变量:是一个取值具有随机性的变量,是抽象化的存在随机变量的概率分布:指随机变量的取值出现概率的。

★小机率原理:如果某事件发生的概率足够小,则在一次(实践)观察中,有理由相信这一事件将不发生。

★回归截距:a ,是x=0时,y 的值,即回归直线在y 轴上的截距。

★回归系数:n x x xy x xy SSx SPxy b /)(y/n x -)x -(y/n x -222∑-∑∑∑∑=∑∑∑∑==,是x 每增加一个单位数时,y 平均

地要增加或减少的单位数。 ★相关系数:SSy

SSx SPxy Sy

Sx df SP r ?=

?=/,表示X 和Y 相关密切程度。

☆回归分析:以计算回归方程为基础的统计方法。 ☆相关分析:以计算相关系数为基础的统计方法。

☆集团均数的区间估计:对集团均数在一定概率下的取值范围(下限,上限)进行估计。 ☆点估计:对集团均数用其相应的样本均数(是集团均数的无偏估计)进行估计。

★∑

1

2

2t

/2)1-|t -|(n i c a ==χ,近似程度随数据量及数值的增大而提高,故当数据量较少或数值较小时可对其作连续性矫正。(连续性矫正的卡平方值)

★相关关系是不同变量 (至少有一个是随机变量)间的关系,指当一个变量的值发生变化时,另一个变量的值与随之而发生变化的趋势。

★MS :均方。即多个总体或处理所提供的组内变异(或误差)的平均值。

★N (3,22

):平均数为3,标准差为2的标准正态分布。

二、填空题。

1.科学研究的方法有 定性研究 和 定量研究 。

2.试验设计的目标是避免 系统 误差,减小 随机 误差,以保证试验的 精确度 和 准确度 。

3.试验设计要贯彻 重复 、 局部控制 、 随机排列 等三大原则。

4.作为集团的代表,样本的 样本容量 和 样本自由度 决定了其代表性的大小。

5.反映资料中心位置的统计量有 样本平均数 ,反映数据变异度的统计量常用的有 样本平方和 、 样本方差 、 样本标准差 、 样本变异系数 、 样本极差 、 样本标准误 。

6.平均数的作用是 平均数是一组样本数据的代表值,可以与其他资料进行对比 ;样本容量的作用是 决定样本的大小与代表性(误差)的大小 ;样本自由度的作用是 决定样本的代表性大小,取代样本容量n 参与平均变异计算以获得对集团变异性的无偏估计 ;平方和的作用是 反应个体间差异的大小 ;方差的作用是 反应个体间的平均差异 ;标准差的作用是 反应个体间的平均差异的大小 ;变异系数的作用是 反应整齐性的大小 ;极差的作用是 反应变异的幅度 ;标准误的作用是 估计抽样误差(随机误差)的平均大小 。

7.统计分析的核心在于由 样本 的情况推断 总体 的信息。

8.某试验将A 因子的4水平控制为副处理(主要因子),B 因子的3水平控制为主处理(次要因子),重复2次。该试验的主处理数为 3 ,主区数为 6 ,副处理数为 4 ,副区数为 24 。若FA 显著,则A 因子水平间多重比较时用 机误b 。(机误a 或机误b )

9.某田间试验,A 因子有4个水平,B 因子有3个水平,采用随机区组设计重复两次。已知误差均方为4.82,因子主效应F 测验达显著,需作A 因子水平间的多重比较(用Duncan 测验,即

新复极差法),此时 = 0.896 。

x S

10.L8(4*24

)表示一张具有 具有4个水平1列,2个水平4列的8行 的混合型正交表。如采用该正交表安排试验,该试验的处理数有 8 个。

11.本课程学过的随机排列的试验设计方法主要有 随机区组设计 、 完全随机排列 、 拉丁方设计 、 裂区设计 、 条区设计 、 局部实验 等6种。 12.试验资料一定要满足 方差具有同质性 、 变异的可加性 、 变异的独立性 等三条件才能进行方差分析。若试验资料为可数资料,在进行方差分析时,常用的统计代换有 反正弦代换 、 平方根代换 、 对数代换 等三种。

13.方差分析时,进行均数间多重比较的标准常用的有 最小显著差数法 、 复极差法(q 法) 、 Duncan 氏新复极差法 等三种测验法。多重比较结果表示最常用 标记字母 法表示。

14.计数资料的X2测验应用于 适合性 测验、 独立性 测验和 联合分析 测验。 15.协方差分析是 回归 分析法和 方差 分析法的相结合的一种统计分析法,其主要功用有当(x ,y )为因果关系时,可利用y 依x 的回归系数矫正y 变数的处理平均数,提高精确度 和 当(x ,y )为相关关系时,可通过估计不同变异来源的总体方差和协方差,作出相应的相关分析 。

16.试验方案设计的过程就是 试验三原则 的贯彻过程。其具体步骤分别是 确定重复次数 、 按局部控制原则进行重复区的小区的划分 、 将各处理在每个重复区中按随机排列的原则安排到试验小区中 。(重复、局部控制、随机排列)

17.试验中保护行设置的作用是 边缘效应区域的试验对象的异常将会影响到试验观测结果的准确性,为解决此问题,可在进行数据观测时,将这部分区域排除在外,不参与数据的测量,以此提高观测结果的准确性,因此区域的存在对数据的准确性具有保护作用。

三、简单题&问答题。

1.请说明随机区组设计过程的各个步骤。 答:(1)确定重复次数。根据试验所允许的最大规模确定最高重复次数,根据误差的大小确定最低重复次数。(2)按局部控制原则进行重复区的小区的划分。重复区的划分方向与环境变异方面相垂直,小区方向与环境变异方面相平行。(3)将各处理在每个重复区中按随机排列的原则安排到试验小区中。可通过抽签或随机数字的方式进行。

2.解释用作区间估计的t 分布概率公式 的统计含义。 答:统计在95%的可靠度下样本平均数的上限和下限。

3.解释差异显著性测验中所计算出来的t 值、χ2值、F 处理值的含义。 答:如果随机变量y ~N(μ,σ),则其函数 所服从的概率分布称为t 分布。t

即为标准化离差。如果u1, u2, … un ~ N(μ,σ)(即来自相同集团)则χ2 =Σu i 2

所服从的概率分布为χ2分布。χ2即相互独立的多个正态离差平方值的总和。F 处理即为处理间差异平方与误差平方的比值。

4.写出本课程学过的5类型统计分析方法?简述各类统计分析法的作用和适用条件。 答:方差分析、相关分析、协方差分析、统计假设测验、卡平方分析。

5.请论述单因子试验与复因子试验的方差分析在计算过程上的主要区别。 答:(1)单因子试验与复因子试验的方差分析都要计算处理间的自由度,而复因子试验的方差分析还需要计算组间的自由度。(2)在进行平方和的分解时,单因子试验和复因子试验的方差分析都需要分解出处理的平方和和误差的平方和,而复因子试验的方差分析还需要分解出组间的平方和。(3)在进行F 测验时,单因子试验和复因子试验的方差分析都需要计算处理间均方对误差均方的比率,而复因子试验的方差分析还需要计算组间均方对误差均方的比率。

6.为什么多个处理平均数进行差异显著性测验,不宜用t 测验,而需采用方差分析法?在进行方差分析时,试验资料一定要满足什么条件才能直接进行分析?

%95)//(05.005.0=+≤≤-n S t y n S t y P μy )/S -(μy t =

答:若多个处理平均数进行差异显著性测验采用t 测验,会造成计算量加大,置信度降低,而方差分析法相对而言,计算量小,能够较精确地反应各处理间的差异。在进行方差分析时,试验资料要满足同质性、可加性、独立性才能直接进行分析。 7.解释正态分布概率公式 的含义。

答:有95%的样本x 落在

的范围内。 8.说明单因子试验设计的方法有哪几种及其适用条件。

答:单因子试验设计的方法有随机区组设计、完全随机排列和拉丁方设计。(1)随机区组设计。适用条件:当环境条件在1个方向上存在明显的变异时(二维平面空间)。(2)完全随机排列。适用条件:当环境条件在0个方向上存在明显的变异时(二维平面空间)----任何方向上的趋势性变异均不明显。(3)拉丁方设计。适用条件:当环境条件在2个方向上存在明显的变异时(二维平面空间)。

9.说明在试验设计中是如何对误差进行控制的? 答:控制误差之三大原则:(从含义;作用;实施方式三个方面进行掌握)(1)重复:每个处理在试验结束后能获得2个或更多的观测值。给每个处理安排2个或更多的小区,每个小区观测一个数据;只给每个处理安排一个小区,但在观测数据时先在每个小区内设置多个观测点,每个观测点观测一个数据。(2)局部控制:将试验空间分范围地控制环境因素,使其对处理小区的影响达到最大程度的一致。将有差异(方向性的)的整个试验空间划分成若干个相对最为一致的小区域(重复区),再在每个重复区内给每个处理均安排一个小区,从而使各处理能够在各个环境条件最为一致的重复区内进行公平的比较。重复区的划分方向与环境变异方向垂直,重复区内的小区划分方向与环境变异方向平行。(3)随机排列:各处理在小区中的位置由机会(而非主观意愿)决定且每个处理被安排在每个小区的机会要相等。 10.何谓试验设计(狭义)?简述试验设计三原则及其作用。

答:试验设计(狭义)是指根据试验目的和要求所拟定进行比较的一组试验处理的总称。试验设计的三原则是重复、局部控制、随机排列。其作用为对误差进行合理控制的前提下,将各处理安排到试验小区中,以分析试验指标的各项效应。

11.写出本课程学过的试验设计方法及各种方法的适合情况。 答:(1)随机区组设计。当环境条件在1个方向上存在明显的变异时(二维平面空间)。(2)完全随机排列。当环境条件在0个方向上存在明显的变异时(二维平面空间)----任何方向上的趋势性变异均不明显。(3)拉丁方设计。当环境条件在2个方向上存在明显的变异时(二维平面空间)。(4)裂区设计。1·当不同因子对小区的面积或分析结果的精确度有不同要求时;2·在原单因子试验基础上追加新的因子或单因子试验的连续多次观测结果。(5)条区设计。不同因子对小区的面积均要求较大时。(6)正交试验设计。当因子数较多、每个因子的水平数也较多从而导致复因子试验的规模过大(处理组合数太多)时。

四、计算器。

1.请计算以下某生物量的测量数据之:平均数;样本自由度;平方和;标准差;变异系数;标准误,并对该生物量作置信度为95%的区间估计。

数据:7,7,8,9,9,9,9,10,10,11(单位:毫克/毫升) 解: %95)96.196.1(=+≤≤-δμδx x P 228

.2;206.2;306.210,05.09,05.08,05.0===t t t %.%*y cv ....f ..-....-y -y .11...n y y i i =+≤≤-============++=∑==-=-==+++=∑=,798.910/287.1*206.29.8;002.810/287.1*206.29.8得,

%95)//(由.407.010/287.1/;标准误:4614100/变异系数:

;28716561;标准差:65619/914/方差:

;914)9811()987()(平方和:

91101;样本自由度:981077平均数:222

22n t y n t y P n S S S S S D SS S SS n Df y δμδ)96.1,96.1(δμδμ+-

2.现对2种不同的种子进行发芽试验得结果如下,试对其进行差异显著性分析。第一批种子为

87:13;第二批种子为82:18.( ) 解:

3.以下试验资料已计算出其SS 总=738.95,SS 处理=648.55,请完成F 测验。

解:(1)自由度和平方和的分解

(3)F 测验

解:

99.5;84.32

2,05.021,05.0==x x 1

1.36

2.349.312.5,05.0 4.12,05.012.3,05.0===F F F ;7.67.9355.63895.738;

7.9305.88624/)96...8189(/;

55.64895.738;

05.88624*54212222

2

=--=--==-∑+++=-=====B A T e j B A T SS SS SS SS C a T SS SS SS C 显著差异

有推断:组间、处理间均49

3423872639841处理间组间....>=>=F F 33.290.75x y ?,即33.29420.7456x y ?故2942.3357.18*7456.014.47;7456

.07143.539/4286.402/;8424.07259.4774286.402*))((*;4286

.4027/)330*130(6531/;8571

.4227/33015980/)(;

7143.5397/1302954/)(2

22+=+==-=-======--=

==-=-==-=-==-=-=∑∑∑∑∑∑∑∑x b y a SS SP b SS SS x x y y SS SS SP r n y x xy SP n y y SS x y

x y x xy y x 况无关

批次情况与种子发芽情,即05.0,故现实得611

.0100

*100*31*169002*)2/002-13*82-18*78(21,05.022

2><==P X X X c c

5.经对一果园进行调查,得其单株产量记录分别如下:23,23,27,21,20,28,40,32,20,22,17,15,25,28,22,26,30,25,17,20.试计算其变异系数,并对该园的平均单株产量作95%的区间估计。 已知: 解:

6.未使用药物进行防治时观测到感病植株数为145,正常植株数为13,使用某农药进行防治后观测得感病植株数为52,正常植株数为404,试分析该农药是否具有防治效果。

已查: 解:根据题意,其v=(2-1)(2-1)=1,故计算X 2值时,需要作连续性矫正。

首先建立统计假设,Ho :用药物处理与否与种子感病多少无关。HA :用药物处理与否与种子感病多少有关。因此,

7.有一牧草中耕次数A (2水平)和施肥量B (3水平)试验,采用随机区组设计重复4次,试验资料已算出:SS 总=1036,SS 区组=291.33,SS A =240.67,SS B =3.25,SS 处理组合=583。试完成该试验的方差分析表,计算各因子均方及作F 值。 解:

;168.2)19df (t ;788.2)18df (t ;093.2)19df (t ;101.2)18df (t 01.001.005.005.0========.221.314%0%.%*y cv f y -y n

y y i i

785.6且时,95置信度为该园的平均单株产量在所以,

785.2620/844.5*093.205.24;314.2120/844.5*093.205.24得,%95)//(由.324100/;变异系数:844.5156.34标准差:;156.3419/955.648/;方差:955.648)(平方和:;191;样本自由度:05.24平均数:05

.005.0222

≤≥=+=-=+≤≤-=========∑==-==∑=n t y n t y P S S S D SS S SS n Df δμδ有关理与否与种子感病多少应被否定,即用药物处o ,01.0,故现实得15.344456

*158*417*197614*)2/614-13*52-404*145(或15.34469.309)5.069.309404(

31

.146)5.031.14652(31.107)5.031.10713(69.50)5.069.50145(2

1,01.022

222222

H P X X X X c c

c <>===--+--+--+--=;635.6;841.32

1,01.021,05.0==X X

8.采用碘量法测定还原糖,用0.05mol/L 浓度硫代硫酸钠滴定标准葡萄糖溶液,记录耗用硫代

解:

9.橡胶苗圃肥料试验,A,B,C,D,E 五中肥料处理,小区面积为一个苗床,采用拉丁方设计,试验指标为平均茎围(略)

,用SAS 软件进行方差分析,其中五中肥料间的平均茎围多重比较结 、B 处理间差异显著性达到a=0.05水平。

(2)肥料A 与肥料D 无显著差异,与肥料E 、B 处理间差异显著性达到a=0.05水平。 (3)肥料D 与肥料E 无显著差异,与肥料B 处理间差异显著性达到a=0.05水平。 (4)肥料E 与肥料B 处理间差异显著性达到a=0.05水平。

0.671.5x y ?,即0.66531.5061x y ?故6653.087.4*5061.18;5061

.11943.50/6.75/;9976

.09784.748.74*))((*;6.757/)56*34(6.347/;112

7/56560/)(;1943

.507/1.3431.216/)(6.347;560;31.216;56;1.34;8;87.42222

2222+=+==-=-======--===-=-==-=-==-=-========∑∑∑∑∑∑∑∑∑∑∑∑∑x b y a SS SP b SS SS x x y y SS SS SP r n y x xy SP n y y SS n x x SS xy y x y x y x x y

x y x xy y x

生物统计学考试复习题库

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 122 --∑∑n n x x )(

2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 三 填空 1.如果事件A 和事件B 为独立事件,则事件A 与事件B 同时发生的概率P (AB )= P (A )?P (B )。 2.二项分布的形状是由( n )和( p )两个参数决定的。 3.正态分布曲线上,( μ )确定曲线在x 轴上的中心位置,( σ )确定曲线的展开程度。 4.样本平均数的标准误 =( )。 5.t 分布曲线与正态分布曲线相比,顶部偏( 低 ),尾部偏( 高 )。 n /σx σ

生物统计学课后习题解答-李春喜汇总

生物统计学课后习题解答-李春喜汇总

第一章概论 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 第二章试验资料的整理与特征数的计算习题 2.1 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下: 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.85 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 计算平均数、标准差和变异系数。 【答案】=4.7398, s=0.866, CV =18.27 % 2.2 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差和变异系数,并解释所得结果。 24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ; 金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。 【答案】 1 =20, s 1 =1.247, CV 1 =6.235% ; 2 =20, s 2 =3.400, CV 2 =17.0% 。 2.3 某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取 50 绳测其毛重(kg) ,结果分别如下:

生物统计学教案

《生物统计学》教案 第一章统计数据的收集和整理 教学时间:2学时 教学方法:课堂板书讲授 教学目的:重点掌握样本特征数平均数、样本方差、标准差的概念和计算方法,掌握数据类型及频数(率)分布,了解众数、中位数、变异系数。 讲授难点:样本方差、标准差的概念和计算方法 1.1 总体与样本 1.1.1 统计数据的不齐性 1、变异性是自然界存在的客观规律。 2、自然界如果没有变异,也就不需要统计学了。 3、生物学研究的对象都是很大的群体,不可能研究全部对象,只能通过研究其中的一部分,来推断全部对象,于是引出以下概念。 1.1.2 总体与样本 总体:研究的全部对象。 个体:总体中的每个成员。 样本:总体的一部分。 样本含量:样本所包含的个体数目。 1.1.3 抽样 抽样:从总体中获得样本的过程。 随机抽样:总体中的每一个个体被抽中的机会都相同的一种抽样方法。 放回式抽样:从总体中抽出一个个体,记下其特征后,放回原总体中,再做第二次抽样。 非放回式抽样:从总体中抽出个体后,不再放回,即做第二次抽样。 抽样的目的:从总体中获得一个有代表性的样本,以便通过样本推断总体。 应注意的问题:①样本必须有代表性。②样本含量与可实施性之间的平衡。 1.2 数据类型及频数(率)分布

1.2.1 连续型数据和离散型数据 连续型数据:与某种标准比较所得到的数据。又称为度量数据。 离散型数据:由记录不同类别个体的数目所得到的数据。又称为计数数据。 1.2.2 频数(率)分布表和频数(率)分布图的编绘 例1.1 调查每天出生的10名新生儿中体重超过3公斤的人数, 共调查120天,结果如下: 表 1-1 每10名新生儿中体重超过3Kg的人数的 频数(率)分布表 频数(率)分布:把频数(率)按组值的顺序排列起来,便得到离散型数据的频数(率)分布。 频数(率)分布还可以用图形表示,见图1-1。 图1-1 每10名新生儿中体重超过3Kg的人数的频数分布图 下面介绍连续型数据的频数(率)分布表和分布图的编绘方法。

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

生物统计学(第3版)杜荣骞 课后习题答案 第六章 参数估计

第六章参数估计 6.1以每天每千克体重52 μmol 5-羟色胺处理家兔14天后,对血液中血清素含量的影响如下表[9]: y/(μg · L-1)s/(μg · L-1)n 对照组 4.20 0.35 12 5-羟色胺处理组8.49 0.37 9 建立对照组和5-羟色胺处理组平均数差的0.95置信限。 答:程序如下: options nodate; data common; alpha=0.05; input n1 m1 s1 n2 m2 s2; dfa=n1-1; dfb=n2-1; vara=s1**2; varb=s2**2; if vara>varb then F=vara/varb; else F=varb/vara; if vara>varb then Futailp=1-probf(F,dfa,dfb); else Futailp=1-probf(F,dfb,dfa); df=n1+n2-2; t=tinv(1-alpha/2,df); d=abs(m1-m2); lcldmseq=d-t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1/n2)); ucldmseq=d+t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1/n2)); k=vara/n1/(vara/n1+varb/n2); df0=1/(k**2/dfa+(1-K)**2/dfb); t0=tinv(1-alpha/2,df0); lcldmsun=d-t0*sqrt(vara/n1+varb/n2); ucldmsun=d+t0*sqrt(vara/n1+varb/n2); cards; 12 4.20 0.35 9 8.49 0.37 ; proc print; id f; var Futailp alpha lcldmseq ucldmseq lcldmsun ucldmsun; title1 'Confidence Limits on the Difference of Means'; title2 'for Non-Primal Data'; run; 结果见下表: Confidence Limits on the Difference of Means for Non-Primal Data F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN 1.11755 0.42066 0.05 3.95907 4.62093 3.95336 4.62664 首先,方差是具齐性的。在方差具齐性的情况下,平均数差的0.95置信下限为3.959 07,置信上限为4.620 93。0.95置信区间为3.959 07 ~ 4.620 93。 6.2不同年龄的雄岩羊角角基端距如下表[27]: 年龄/a y/cm s/cm n

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

生物统计学教案(4)

生物统计学教案 第四章 抽样分布 教学时间:2学时 教学方法:课堂板书讲授 教学目的:重点掌握样本平均数的t 分布、F 分布和样本方差的X 2分布,掌握两个样 本标准差比的分布。 讲授难点:t 分布、F 分布和X 2分布 4.1 从一个正态总体中抽取的样本统计量的分布 4.1.1 样本平均数的分布 标准差已知时的平均数的分布 从平均数为μ,标准差为σ的正态总体中,独立随机地抽取含量为n 的样本,其样本平均数为一服从正态分布的随机变量。它的平均数和方差分别为: σ/n 称为标准误差。标准化的平均数 服从N (0,1)分布。 标准差未知时的平均数的分布-t 分布 若上述总体的标准差未知,可以用样本标准差代替总体标准差,标准化的平均数称为t 统计量t 不再服从N (0,1)分布,而服从n - 1自由度的t 分布。 S/n 称为样本标准误差。 n x x σ σμμ= =n x u σ μ -= n s x t μ-=

t 分布也是一种对称分布,在密度函数中只有自由度一个参数,随着自由度的增加,t 分布越来越接近于标准正态分布。 不同自由度下的t 分布 与标准正态分布类似,t 分布的上侧、下侧和双侧临界值,由以下各式给出: 对于给定的α从附表4中可以查出相应的上侧、下侧和双侧临界值。 4.1.2 样本方差的分布 从方差为σ2的正态总体中,随机抽取含量为n 的样本,计算出样本方差s 2, 标准化的s 2称为χ2。 ()()αα α α αα =??? ? ? ?≥=-≤ =≥2t t P t t P t t P ()2 2 2 2 2 1σσ χs n s df df -= =

生物统计学考试题及答案

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专 业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已 知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。

A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是 2、态分布不具有下列哪种特征( )。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 3、一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( )。 A 、 2MSe/6 , 3 B 、 MSe/6 , 3 C 、 2MSe/3 , 12 D 、 MSe/3 , 12 4、已知),N(~x 2σμ,则x 在区间]96.1,[σμ+-∞的概率为( )。 A 、0.025 B 、0.975 C 、0.95 D 、0.05 5、 方差分析时,进行数据转换的目的是( )。 A. 误差方差同质 B. 处理效应与环境效应线性可加 C. 误差方差具有正态性 D. A 、B 、C 都对 三、简答题;(每小题6分,共30分 ) 1、方差分析有哪些步骤? 2、统计假设是?统计假设分类及含义? 3、卡方检验主要用于哪些方面? 4、显著性检验的基本步骤? 5、平均数有哪些?各用于什么情况? 四、计算题;(共4题、50分) 1、进行大豆等位酶Aph 的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于下表。试分析大豆Aph 等位酶的等位基因型频率是否因物种而不同。( 99 .52 05.0,2=χ, 81 .7205.0,3=χ)(10分) 野生大豆和栽培大豆Aph 等位酶的等位基因型次数分布 物 种 等位基因型 1 2 3 野生大豆 29 68 96

生物统计学第四版知识点总结

一、田间试验的特点 1、田间试验具有严格的地区性和季节性,试验周期长。 2、田间试验普遍存在试验误差 3、研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研 究其生长发育规律、各项栽培技术或栽培条件的效果。 二、田间试验的基本要求 结果重演性、结果可靠性、条件先进代表性、目的明确性 三、单因素试验的处理数就是该因素的水平数。 四、例如:甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组 合数是? 3因素3水平的处理组合数是? 多因素试验的处理数是各因素不同水平数的所有组合。 五、如进行一个喷施叶面肥的试验,如果设置两个叶面肥浓度,对照应为 喷施等量清水。 六、简单效应的计算 N 的简单效应为40-30=10 在N1水平下,P2与P1的简单效应为38-30=8;在N2水平下,P2与P1的简单效应为54-40=14。 七、平均效应的计算 P的主效(8+14)/2=11; N的主效(10+16)/2=13; 八、互作的计算 N与P的互作为(16-10)/2=3或(14-8)/2=3 九、田间试验误差可分为系统误差和随机误差两种。(1、系统误差影响试 验的准确性,随机误差影响试验的精确性。2、准确度受系统误差影 响,也受随机误差影响;精确度受随机误差影响。3、若消除系统误 差,则精确度=准确度。) 十、小区面积扩大,误差降低,但扩大到一定程度,误差降低就不明显了。 适当的时候可以考虑增加重复次数来降低误差。小区面积一般在 6-60m2,而示范小区面积不小于330m2 。 十一、通常情况下,狭长小区误差比方形小区误差小。 小区的长边必须与肥力梯度方向平行,即与肥力变化最大的方向平行。一般小区长宽比为3-10:1,甚至达20:1 十二、何时采用方形小区?(1)肥水试验;(2)边际效应值得重视的试验。 十三、一般小区面积较小的试验,重复次数可相应增多,可设3-6次重复; 小区面积较大的试验可设2-4次重复。 十四、将对照或早熟品种种在试验田四周,一般4行以上。目的?(目的是防止外来因素破坏及边际效应的影响。) 十五、算术平均数的主要特征 ?1、样本各观测值与平均数之差的和为零,即离均差之和为0。 2、离均差的平方和最小。 十六、【例3·1】在1、2、3、…、20这20个数字中随机抽取1个,求下列随机事件的概率。 (1)A=“抽得1个数字≤4”;

生物统计学教案

生物统计学教案 第九章 两因素及多因素方差分析 教学时间:5学时 教学方法:课堂板书讲授 教学目的:重点掌握固定模型、随机模型两因素方差分析的方法步骤,掌握混合模型 的方差分析,了解多因素的方差分析方法。。 讲授难点:固定模型、随机模型两因素方差分析的方法步骤 9.1 两因素方差分析中的一些基本概念 9.1.1 模型类型 交叉分组设计:A 因素的a 个水平和B 因素的b 个水平交叉配合,共构成ab 个组合,每一组合重复n 次,全部实验共有abn 次。 固定模型:A 、B 两因素均为固定因素。 随机模型:A 、B 两因素均为随机因素。 混合模型:A 、B 两因素中,一个是固定因素,一个是随机因素。 9.1.2 主效应和交互作用 主效应:由于因素水平的改变所造成的因素效应的改变。 A 1 A 2 A 1 A 2 B 1 18 24 B 1 18 28 B 2 38 44 B 2 30 22 先看左边的表。A 因素的主效应应为A 2水平的平均效应减A 1水平的平均效应,B 的主效应类似。 当A 1B 1+A 2B 2=A 1B 2+A 2B 1时,A 、B 间不存在交互作用。这里A 1B 1+A 2B 2=62,A 1B 2+A 2B 1=62,因此A 、B 间不存在交互作用。 交互作用:若一个因素在另一因素的不同水平上所产生的效应不同,则它们之间存在交互作用。 20 2 241824438226 2361824424221211222121112212=+-+=+-+==+-+=+-+=B A B A B A B A B B A B A B A B A A

现在看右边的表。 A(在B1水平上)=A2B1-A1B1=28-18=10 A(在B2水平上)=A2B2-A1B2=22-30=-8 显然A的效应依B的水平不同而不同,故A、B间存在交互作用。交互作用的大小为AB=(A1B1+A2B2)-(A1B2+A2B1) 9.1.3 两因素交叉分组实验设计的一般格式 假设A因素有a水平,B因素有b水平,则每一次重复包含ab次实验,实验重复n次,总的实验次数为abn次。以x ilk表示A因素第i水平,B因素第j水平和第k次重复的观测值。一般格式见下表。 因素 B j=1,2,…,b B1B2…B b总计 A1x111x121x1b1 x112x122x1b2 x11n x12n x1b n x1. . 因 素A2x211x221x2b1 A x212x222x2b2 x21n x22n x2bn x2. . A a x a11x a21x ab1 x a12x a22x ab2 x a1n x a2n x abn x a. . 总计x.1. x.2.x.b.x. . .

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

《生物统计学》教学大纲

《生物统计学》教学大纲 课程名称:生物统计学 课程类型:范围选修课-基础课 学时:56学时,3.5学分 适用对象:农学、植物保护、生物技术、生物科学、草业科学等本科专业先修课程:高等数学、线性代数、概率论与数理统计、植物学、植物生理学、遗传学等课程 一、课程性质、目的与任务以及对先开课程要求 统计学是论述收集、分析并解释数字信息的科学,生物统计学则是一门运用统计学的原理和方法,研究生物学数据资料的一般统计学。统计方法是现代生物学研究不可缺少的工具。正确的统计分析能够帮助我们正确认识事物客观存在的规律性。 概率论与数理统计等先开课程的重点是讲述没有量纲或单位抽象的数量规律,为生物学科应用这些规律打基础。 二、教学重点及难点 本课程教学的全过程可以看成是一个生物信息搜集、处理、分析,从而提炼新的生物信息的过程。教学重点是通过生物现象的数量观察、对比、归纳和分析,揭示那些困惑费解的生物学问题,从偶然性的剖析中,发现事物的必然性,指导生物科学的理论和实践。本课程的难点是概念较多、理论抽象、系统严密、实践性强、公式复杂、符号繁多、计算量大,因此,教学安排上除精讲48学时外,有针对性的安排上机操作8学时。 三、与其他课程关系 生物统计学与数学有密切关系,现代统计学用到了较多的数学知识,研究理论生物统计学的人需要有较深的数学功底,应用统计方法的人也应具备良好的数学基础。统计学又是一门应用性很强的学科,几乎生物学科所有的门类都要研究和分析数据,掌握生物学类学科专业基础课和专业课程知识有利于对统计分析的结果做出合理的解释和分析。 四、教学内容、学时分配及基本要求 绪论(1学时) 基本要求:理解什么是统计?什么是统计学;统计数据与统计学的关系,描述统计与推断统计内涵;统计方法能解决生物学科中哪些问题,了解生物 统计学的产生与发展。

生物统计学教案(5)

生物统计学教案 第五章统计推断 教学时间:5学时 教学方法:课堂板书讲授 教学目的:重点掌握两个样本的差异显著性检验,掌握一个样本的差异显著性检验,了解二项分布的显著性检验。 讲授难点:一个、两个样本的差异显著性检验 统计假设检验:首先对总体参数提出一个假设,通过样本数据推断这个假设是否可以接受,如果可以接受,样本很可能抽自这个总体,否则拒绝该假设,样本抽自另外总体。 参数估计:通过样本统计量估计总体参数。 5.1 单个样本的统计假设检验 5.1.1 一般原理及两种类型的错误 例:已知动物体重服从正态分布N(μ,σ2),实验要求动物体重μ=10.00g。已知总体标准差σ=0.40g,总体平均数μ未知,为了得出对总体平均数μ的推断,以便决定是否接受这批动物,随机抽取含量为n的样本,通过样本平均数,推断μ。 1、假设: H 0: μ=μ 或H0: μ-μ0=0 H A : μ>μ μ<μ μ≠μ 三种情况中的一种。 本例的μ =10.00g,因此 H : μ=10.00 H A : μ>10.00或μ<10.00或μ≠10.00 2、小概率原理小概率的事件,在一次试验中几乎是不会发生的,若根据一定的假设条件计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而拒绝假设。 从动物群体中抽出含量为n的样本,计算样本平均数,假设该样本是从N(10.00,0.402)中抽取的,标准化的样本平均数

服从N (0,1)分布,可以从正态分布表中查出样本抽自平均数为μ的总体的概率,即 P (U >u ), P (U <-u ), 以及P (|U |>u )的概率。如果得到的值很小,则 x 抽自平均数 为μ0的总体的事件是一个小概率事件,它在一次试验中几乎是不会发生的,但实际上它发生了,说明假设的条件不正确,从而拒绝零假设,接受备择假设。 显著性检验:根据小概率原理建立起来的检验方法。 显著性水平:拒绝零假设时的概率值,记为α。通常采用α=0.05和α=0.01两个水平,当P < 0.05时称为差异显著,P < 0.01时称为差异极显著。 3、临界值 例 从上述动物群体中抽出含量n =10的样本,计算出 x =10.23g ,并已知 该批动物的总体平均数μ绝不会小于10.00g ,规定的显著水平α=0.05。根据以上条件进行统计推断。 H 0: μ=10.00 H A : μ>10.00 根据备择假设,为了得到x 落在上侧尾区的概率P (U > u ),将x 标准化,求 出u 值。 P (U >1.82)=0.03438,P < 0.05,拒绝H 0,接受 H A 。 在实际应用中,并不直接求出概率值,而是建立在α水平上H 0的拒绝域。从 正态分布上侧临界值表中查出P (U > u α)= α时的u α值,U > u α的区域称为在α水平上的H 0拒绝域,而U < u α的区域称为接受域。接受域的端点一般称为临界值。本例的u =1.82,从附表3可以查出u 0.05=1.645, u > u α,落在拒绝域内,拒绝H 0而接受H A 。 4、单侧检验和双侧检验 上尾单侧检验:上例中的H A :μ>μ0,相应的拒绝域为U > u α。对应于H A :μ>μ0时的检验称为上尾单侧检验。 下尾单侧检验:对应于H A :μ<μ0时的检验称为下尾单侧检验。 n x n x u 40 .000.100 -= -= σ μ82 .110 40 .000 .1023.100 =-= -= n x u σ μ

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

生物统计学课堂作业及答案

1. 资料可以分为哪几类?它们有何区别? 答:(1)资料一般可以分为数量性状资料、质量性状资料、半定量资料三大类,其中 数量性状资料又包括计量资料和计数资料。 (2)区别:数量性状资料是能够以量测或计数的方式获得的资料,质量性状资料是只能观察而不能直接测量的资料,半定量资料既有计数资料的特点又有程度或量的不同。联系 三种不同类型的资料有时可根据研究目的和统计方法的要求将一种类型资料转化成另一种类型的资料。 2. 为什么要对资料进行整理?对于计量资料,整理的基本步骤是什么? 答:(1)由调查或试验收集来的原始资料往往是零乱的,无规律可循。只有通过统计整理,才能发现其内部的联系和规律性,从而揭示事物的本质。资料整理是进行统计分析的基础。(2)计量资料整理的基本步骤包括:①求全距,全距即为资料中最大值与最小值之差。②确定组数,一般根据样本含量及资料的变动范围大小确定组数。③确定组距,通常根据等距离分组的原则,组距等于全距除以组数。④确定组限和组中值,各组的最大值为组上限,最小值为组下限 每一组的中点值称为组中值。⑤归组划线计数,作次数分布表。 3. 在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好?答:在对计量资料进行整理时,第一组的组中值以接近或等于资料中的最小值可以避免第一组中观察值过多的情况,同时也确保资料中最小值不会遗漏。 4. 统计表与统计图有何用途?常用统计表、统计图有哪些?列统计表、绘统计图时,应注意什么? 答:(1)统计表用表格形式来表示数量关系 统计图用几何图形来表示数量关 系。用统计表和统计图可以把研究对象的特征、内部构成、相互关系等简明、形 象地表达出来,便于比较分析。 (2)常用的统计图有长条图、圆图、线图、直方图和折线图等。 (3)常用的统计表有简单表和复合表两大类。 (4)列统计表的注意事项: ①标题要简明扼要、准确地说明表的内容,有时须注明时间、地点。 ②标目分横标目和纵标目两项,横标目列在表的左侧用以表示被说明事物的主要标志,纵标目列在表的上端说明横标目各统计指标内容,并注明计算单位。 ③数字一律用阿拉伯数字,数字小数点对齐,小数位数一致,无数字的用“—”表示,数字是“0”的须写“0”。 ④表的上下两条边线略粗、纵、横标目间及合计用细线分开 表的左右边线可以省去表的左上角一般不用斜线。 (5)绘统计图的注意事项: ①标题简明扼要并列于图的下方。 ②纵、横两轴应有刻度,注明单位。 ③横轴由左至右,纵轴由上而下,数值由小到大,图形长宽比例约为5:4或6:5。 ④图中需用不同颜色或线条表示不同事物时应有图例说明。 5. 生物统计中常用的平均数有几种?各在什么情况下应用? 答:生物统计中常用的平均数有算术平均数、几何平均数、调和平均数、中位数和众数。算术平均数较常用,简称平均数,当资料呈正态分布时可用算术平均数描述其中心位置。几何均数主要应用于畜牧、水产业的动态分析,畜禽疾病及药物效价的统计分析,如畜禽、水产养殖的增长率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等。调和均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。当所获得的数据资料呈偏态分布时中位数的代表性优于算术平均数。众数也适用于资料呈偏态分布的情况。

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

相关主题
文本预览
相关文档 最新文档