当前位置:文档之家› 生物统计学复习资料

生物统计学复习资料

生物统计学复习资料
生物统计学复习资料

第一章

1.生物统计学(Biostatistics)是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科。属于应用统计学的一个分支。是一门应用数学。

2.统计学(Statistics)是把数学的语言引入具体的科学领域,将所研究的问题抽象为数学问题的过程, 是收集、分析、列示和解释数据的一门科学。

3.生物统计学是研究生命过程中以样本推断总体的一门学科。

4.生物统计学的基本类容:

①试验设计:如何合理地进行调查或试验设计

②统计分析:如何科学地整理、分析所收集来的具有变异的资料,揭示出隐藏其内部的规律性。

5.生物统计学的基本作用:

①提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。

②运用显著检验,判断试验结果的可靠性或可行性。

③提供由样本推断总体的方法。

④提供试验设计的的一些重要原则。

6.常用的统计学术语:

一.总体与样本

具有相同性质的个体所组成的集合称为总体;总体有分为有限总体和无限总体。

组成总体的基本单元称为个体

从总体中抽出若干个体所构成的集合称为样本(sample);(总体中的一部分)

构成样本的每个个体称为样本单位;样本中所包含的个体数目叫样本容量或样本大小,

样本容量常记为n。一般在物学研究中,通常n<30的样本叫小样本,n ≥30的样本叫大样本。

二、参数与统计数

描述总体特征的数量称为参数,也称参量。常用希腊字母表示参数,例如用μ表示总体平均数,用σ表示总体标准差;

描述样本特征的数量称为统计数,也称统计量。常用英文字母表示统计数,例如用X-表示样本平均数,用S表示样本标准差。

三、变量与常数

变量,或变数,指相同性质的事物间表现差异性或差异特征的数据。

常数,表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。

变量包括定量变量和定性变量,定性变量又可分为连续变量(可以有任何小数出现)和非连续变量(只有整数出现)。

四、效应与互作

通过施加试验处理,引起试验差异的作用称为效应。效应有正效应与负效应之分。

互作,又叫连应,是指两个或两个以上处理因素间相互作用产生的效应。互作也有正效应(协同作用)与负效应(拮抗作用)之分。

五、误差与错误

效应

随机误差,抽样误差,偶然误差

变异

误差系统误差,片面误差

随机误差,也叫抽样误差,是由于试验中无法控制的内在和外在的偶然因素所造成的试验结果与真实结果之间的差异。是不可避免的。统计上的试验误差一般都指随机误差。随机误差越小,试验精确性越高。

系统误差,也叫片面误差,是由于试验处理以外的其他条件控制不一致所产生的带有倾向性的或定向性的偏差。系统误差主要由一些相对固定的因素引起的,如仪器调校的差异、各批药品间的差异、不同操作者操作习惯的差异等。系统误差影响试验的准确性。只要试验工作做得精细,系统误差是可以克服的。

错误 (mistake),是指在试验过程中,由于人为作用引起的差错。如测量仪器不准、试剂配制不当、试验人员粗心大意使称量、观测、记载、抄录、计算中出现错误等人为因素而引起的,只要以认真负责的态度和细心的工作作风,在试验中是完全可以避免的。原则上,试验中是不允许出现错误的。

六、准确性与精确性

准确性(accuracy),也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。设某一试验指标或性状的真值为μ,观测值为 x,若 x与μ相差的绝对值 |x-μ|越小,则观测值x的准确性越高;反之则低。

精确性(precision),也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。若观测值彼此接近,即任意二个观测值xi 、xj 相差的绝对值|xi -xj |越小,则观测值精确性越高;反之则低。

准确性不等于精确性。准确性是说明测定值对真值符合的程度大小,而精确性是说明多次测定值的变异程度大小。调查或试验的准确性、精确性合称为正确性。

七.因素与水平

八.处理与重复

章节小测验

1.变量按其性质可以分为___定量__变量和__定性____变量。

2.样本统计数是总体______的估计值。

3.生物统计学是研究生命过程中以__样本___来推断_总体____的一门学科。

4.生物统计学的内容包括______、______。

5.生物学研究中,一般将样本容量______称为大样本。

6.试验误差可以分为____、____两类。

1.对于有限总体不必用统计推断方法。()

2.资料的精确性高,其准确性也一定高。()

3.在试验设计中,随机误差只能减小,而不可能完全消除。()

4.统计学的试验误差,通常指随机误差。()

第二章

1.在生物学试验及调查中,通过对某种具体事物或现象观察获得的结果称为资料。

2.变量:相同性质的事物间表现差异性的某项特征或性状。

3.定量变量:通过测量所获得的,用具体的数值与特定计量单位表达的数据。

连续变量:表示在变量范围内可抽出某一范围的所有值,变量之间是连续,无限的,可以有任何小数出现。

非连续变量:表示在变量数列中仅能取得固定数值,并且通常是整数。

4.定性变量:也称为分类变量,名义变量,其变量值是定性的,表示某个体属于几种互不相容的类型中的一种。

5.数量性状是指能够以计数和测量或度量的方式表示其特征的性状。观察测定数量性状而获得的数据就是数量性状资料。数量性状资料的获得有计数和测量两种方式,因而数量性状资料又分为计数资料和计量资料两种。

6.计数资料指用计数方式获得的数量性状资料。该类资料也称为非连续变量资料或间断变量资料或离散变量资料。

7.计量资料指用测量或度量法获得的数量性状资料,即用度、量、衡等计量工具直接测定获得的数据资料。其数据是用长度、重量、容积、温度、浓度等来表示,要带单位。两个相邻的整数间可以有带小数的任何数值出现,其小数位数的多少由度量工具的精确度而定,计量资料也称为连续变量资料。

8.质量性状资料:质量性状是指能观察到而不能直接测量的性状。观察质量性状而获得的数据就是质量性状资料,也称为属性性状资料。这类性状本身不能直接用数值表示,

要获得这类性状的数据资料,须对其观察结果作数量化处理,其方法有以下两种:统计次数法;评分法

9.资料收集的方法:调查;试验。

调查是对已经存在的事情的资料按某种方案进行收集的方法。资料的调查又可以分为两种:普查和抽样调查。

普查是对研究对象的全部个体逐一进行调查的方法。

抽样调查是根据一定的原则从研究对象中抽取一部分具有代表性的个体进行调查的方法。

试验是对已有的或没有的事物加以处理的方法。

10.试验设计须遵循的三大原则是:随机、重复和局部控制。

11.常见的试验设计方法有:对比设计、随机区组设计、平衡不完全区组设计、裂区设计、拉丁方设计、正交设计、正交旋转设计等。

12.检查和核对原始资料的目的:确保原始资料的完整性和正确性。

13.计量资料的整理一般采用组距式分组发

全距→组数→组距→组限→归组→制表

全距:样本数据资料中最大观测值与最小观测值之间的差值。R=Xmax- Xmin

组数:是根据观测值的多少及组距的大小来确定的。

组距:组距=全距/组数

组限:是指每个组变量值的起止界限。包括上限和下限。

组中值:是指每个组变量值的起止界限。第一组的组中值最好接近于资料的最小值。临界值就高不就低。

分组是计数的方法:卡片法和唱票法(画正字法和画川字法。)。

14.变量的分布具有两种明显的基本特征:集中性和离散性。

集中性:是变量在趋势上有着向某一中心聚集,或者说以某一数值为中心而分布的性质。 离散性:是变量有着离中分散变异的性质。

表示集中性的特征数:平均数(算术平均数,中位数,众数,集合平均数,调和平均数) 表示离散性的特征数:极差,方差,标准差,变异系数

①算术平均数 总体或样本资料中所有观测数的总和除以观测数的个数所得的商,简称平均数、均数或均值。 总体:

样本:

②中位数Md

资料中所有观测数依大小顺序排列,居于中间位置的观测数称为中位数或中数。 1、当观测值个数n 为奇数时,(n+1)/2位置的观测值,即 Md =x(n+1)/2为中位数 2、当观测值个数为偶 数 时,n/2和(n/2+1)位置的两个观测值之和的1/2为中位数 ③众数M0

资料中出现次数最多的那个观测值或次数最多一组的组中值或中点值。 注意:

∑==

+++=N

i i

N x

N

N x x x 1211...μ∑==+++=n

i i

n x n n x x x x 1

211

...

(1)对于某些数据而言,如均匀分布,并不存在众数; (2)对于某些数据存在两个或两个以上的众数; (3)主要用来描述频率分布。

④极差:是数据分布的两端变异的最大范围,即样本变量值最大值和最小值之差,用R 表示。一定程度上说明样本波动幅度,但只受两个极端值大小的影响,不能反映样本中各个观测值的变异程度.

离均差:各个观测值与平均数的离差。离均差可以反映出一个观测值偏离平均数的性质和程度。 平方和(SS )

估计量必须符合一个特性:无偏性 15.算术平均数的重要性质 离均差之和等于零。 离均差平方和最小。

16.自由度:指当以样本的统计量来估计总体的参数时,样本中可以自由变动的变量的个数。自由度 = 样本个数 - 样本数据受约束条件的个数 df=n-k

17.方差:刻画了随机变量的取值对于其数学期望的离散程度方差越大,离散程度越大 样本:

1

)(2

2

--=

∑n x x s

总体:

18:标准差 样本:

总体:

标准差特性

标准差的大小,受多个观测数影响,如果观测数与观测数间差异较大,则离均差也大,因而标准差也大,反之则小

各观测数加上或减去一个常数,其标准差不变;

各观测数乘以或除以一个常数a (不为0),其标准差扩大或缩小a 倍。 标准差作用

N

x ∑-=

2

2

)(μσ

1

)

(2

--=

∑n x x s N

x ∑-=

2

)

(μσ

表示变量分布的离散程度。

可以概括估计出变量的次数分布及各类观测数在总体中所占的比例。

估计平均数的标准误。

进行平均数的区间估计和变异系数计算。

19.变异系数

定义:样本的标准差除以样本平均数,所得到的比值就是变异系数。CV=s / x × 100% 特点:是样本变量的相对变异量,不带单位。可以比较不同样本相对变异程度的大小。

自我测验

资料按生物的性状特征可分为______和______。

直方图适用于表示______资料的次数分布。

变量的分布具有两个明显基本特征,即______和_______。

反映变量集中性的特征数是_______,反映变量离散性的特征数是______.

样本标准差的计算公式 s =_________

计数资料也称连续性变量资料,计量资料也称非连续性变量资料。

资料中出现最多的那个观测值或最多一组的中点值,称为众数。

变异系数是样本变量的绝对变异量

下面变量中属于非连续性变量的是_____

A.身高

B.体重

C.血型

D.血压

对某鱼塘不同年龄鱼的尾数进行统计分析时,可作成_____图来表示。

A.条形

B.直方

C.多边形

D.折线

1.事件

必然事件(U ):一定条件下必然出现。 不可能事件(V ):一定条件下必然不出现。 随机事件(A ):一定条件下可能出现。 2.频率

设事件A 在n 次重复试验中发生了m 次,其比值m/n 称为事件A 发生的频率,记为: W(A)=m/n 。

3.概率

事件A 在n 次重复试验中,发生了m 次,当试验次数n 不断增大时,事件A 发生的频率W(A)就越来越接近某一确定值p ,于是定义p 为事件A发生的概率(probability ),记为

P(A) = p=

4.大数定律:概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称。 样本容量越大,样本统计数与总体参数之差越小。

5.简单的概率计算。

1

)(0≤≤A W n

m n ∞

→lim

1.统计推断:把试验的表面效应与误差大小相比较并由表面效应可能属误差的概率而作出推论的方法。

由一个样本或一系列样本所得的结果来推断总体的特征。

2.统计推断的任务:

分析误差产生的原因

确定差异的性质

排除误差干扰

对总体特征做出正确判断

3假设检验

又叫显著性检验,是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。

4.小概率原理

概率很小的事件在一次抽样试验中实际是几乎不可能发生的。

5.假设检验的步骤:

分析问题→提出假设→确定显著水平→计算检验统计量→做出推断

6.双尾检验与单尾检验

7.成组数据:将试验单位完全随机分为两组,再随机各实施一处理,这样得到的数据称为成组数据,以组的平均数作为比较的标准。成组数据平均数比较的假设检验和配对数据平均数比较的假设检验都是检验两个样本平均数和。所属总体平均数和是否相等的检验方法。成组数据两个样本抽自不同总体,两个样本之间的变量没有任何

关联。这样,不论两样本的容量是否相同,所得数据皆为成组数据。

8.将性质相同的两个样本(供试单位)配成对,每一对除随机地给予不同处理外,其他试验条件应尽量一致,以检验处理的效果,所得的观测值称为成对数据。

9.点估计:以样本统计量直接估计总体的相应参数。

估计总体参数的统计量称为估计量

一般来说,一个好的估计量应满足以下三个条件:无偏性、有效性和相容性。

10.区间估计

按一定的概率估计总体参数在哪个范围。

11.具体区间估计与点估计看书和ppt。

第五章

1.所谓χ2卡方,是指相互独立的多个正态离差平方值的总和,

O 为观察次数,E 为理论次数,i=1,…,k 为计数资料的分组数,自由度为 df=k-1,

依分组数及其相互独立的程度决定。

2.独立性测验是测验两个变数之间是相互独立还是彼此相关的统计方法,是次数资料的一种相关研究。

3.独立性检验:

测验实际结果与理论比例是否符合;测验产品质量是否合格;测验实验结果是否符合某一理论分布。

应用卡方进行独立性测验的无效假设是:

H0:两个变数相互独立,对HA :两个变数彼此相关。 计算过程:

(1)将所得次数资料按两个变数作两向分组,排列成相依表; (2)根据两个变数相互独立的假设,算出每一组格的理论次数;

(3)由∑-=i

E E O 2

2

)(χ(基本公式)或者变形公式算得卡方值。

(4)这个x2的自由度随两个变数各自的分组数而不同,设横行分r 组,纵行分c 组,

则 df=(r -1)(c -1)。

当观察的 时,便接受H0,即两个变数相互独立;当观察的

-=i E

E O 2

2

)

时,便否定H0,接受HA ,即两个变数相关。

根据以上判断写统计结论。(第五章ppt28)

2×2列联表的x2(卡方)独立性测验 2×2表的一般形式: 结果1 结果2 合计 处理1 处理2 O11 O12 O21 O22 R1 R2 合计 C1 C2

T

df=(2-1)(2-1)=1

(1)基本公式,需连续矫正 (ppt30页补充)

(2)变形公式

二、2×C 表的独立性测验

2×C 表是指横行分为两组,纵行分为C ≥3组的相依表资料。在作独立性测验时,其 =(2-1)(c -1)=c -1。由于c ≥3,故不需作连续性矫正。

Oi-Ei

-0.5)2 c2

=

Σ

1

k

i Ei

c

(

1.试验因素:试验中所研究的影响试验指标的原因或原因组合

2.因素水平:每个试验因素的不同状态(处理的某种特定状态或数量上的差别)简称为水平。

3.试验处理对受试对象给予的某种外部干预或措施,是试验实施因子水平的一个组合

单因素处理

处理多因素处理

4.试验单位:在试验中能接受不同试验处理的独立的试验载体。实际上就是根据研究目的而确定的观测总体。

5.重复:在试验中,将一个处理实施在两个或两个以上的试验单位上。处理实施的试验单位数即为处理的重复数。

6.

1.抽样需遵循的总的原则是:

样本必须来自于所研究的总体

样本必须能代表所研究的总体

抽样方法必须与抽样目的相一致

2.试验、调查的目的不同,试验、调查的方法不同、抽样的方法也不同

随机抽样

简单随机抽样

整群抽样

分层抽样

双重抽样

顺序抽样

典型抽样

3.(一)随机抽样法

总体比较整齐、变异程度小、群体分布均匀,可用随机抽样法

随机抽样法的原则是:

总体内每一个体(数据)都有同等的机会进入样本

样本中每一个体(数据)进入任何一个组的机会也是相等的

随机抽样法可以完全排除个人的主观性

随机抽样法是最简单、最常用的抽样方法

4.随机抽样法有以下几种方法:

抓阄法

随机数字法

伪随机数字法

通过随机抽样法得到样本后,一般需计算样本的特征数,用以估计总体参数。几乎所有调查和试验都可以采用随机抽样法进行抽样。

5.整群抽样和多层次抽样法

从总体中抽取数个样本单位群,对单位群内的全部个体作全面调查,或用整个单位群进行试验

样本单位群的抽取既可以用随机抽样法得到,也可以有选择地取得

5.在整群抽样的基础上,对抽得的样本单位群不作全面调查,或不是整个样本单位群进入试验,而是在样本单位中继续抽取一定量的个体(数据)组成样本,这就是二级抽样如果二级抽样得到的不是个体(或数据),而是更小的单位群,再从中进行抽样,这就是三级抽样

以此类推

二级及二级以上的抽样就称为多层次抽样

多层次抽样方法适合于资源调查、传染病(寄生虫病)调查、流行病学调查、经济学调查、遗传学试验、育种学试验,等

6.双重抽样法

当所研究的性状比较复杂,或所需经费较多,或须将试验动物宰杀后才能测定,因而不大可能进行重复性试验,或采用直接抽样试验,或试验有较大的难度,可采用双重抽样法

7.采用双重抽样法,首先需将所需要进行研究的性状定为目标性状(或称为靶性状),用 y 表示,然后根据文献或其他方法确定一个或几个简单易测、不具破坏性、与靶性

状相关性比较紧密的性状,这些性状称为辅助性状,用 xi 表示。从总体中抽取两个样本,一个大样本,一个小样本

先对小样本进行调查,或先用小样本进行试验,对这一小样本既测 y 性状,同时也测 xi 性状,获得n 对 y 和 xi,并建立 xi 与 y 的回归方程,最简单的回归方程就是只有一个 xi 的简单回归方程,也可以是曲线回归方程,也可以建立多元回归方程

建立回归方程的原则是其 r(或其绝对值)或 R 必须很大,以表明用 x 或 xi 估测 y 其效果比较好。而较大的样本在调查或试验中仅测 xi 性状,并将这一样本中所有被测个体的 xi 代入上述回归方程中以求得相应的 y 估计值,这样获得的较大样本 y 的估计值,能达到一定的精度,这一抽样方法即为双重抽样法。

8.双重抽样法的适用范围:

遗传学试验、育种学试验、繁殖学试验、生理生化学试验、疾病防治试验,等

双重抽样法的优点是:

对于复杂性状的调查或试验仅需破坏较小的样本即能获得较大样本的精确性

当目标性状为破坏性性状时,这是唯一行之有效的方法

生物统计学复习

生物统计学复习 一、选择题(在每小题给出的四个选项中,选择正确的一项。每小题2分,共计20分) 1.某一变数Y 服从正态分布()10,10N ,当以10n =进行随机抽样时,样本平均数大于12 的概率为( B )。 A 、0.005 B 、0.025 C 、0.05 D 、0.01 2.偏态分布资料的集中趋势描述宜用( C )。 A 、算术均数 B 、标准差 C 、中位数 D 、四分位数间距 3.单个方差的假设测验用( B )测验。 A 、u B 、2χ C 、t D 、F 4.两样本均数不一致,t 检验时P>0.05,可以说这种差异是( A )。 A 、抽样误差 B 、总体均数不同 C 、样本均数不同 D 、样本数不同 5.正态分布曲线与横轴之间的总面积等于( D )。 A 、次数总和n B 、次数总和n +1 C 、0.95 D 、1 6.对一批棉花种子做发芽试验,抽样1000粒,得发芽种子850粒,若规定发芽率达90% 为合格,测验这批种子是否合格的显著性为( A )。 A 、不显著 B 、显著 C 、极显著 D 、不好确定 7.对于一组呈正态分布的计量资料,若对每一个个体同减去一个不为零的数,则( B )。 A 、均数、标准差均不变 B 、均数变、标准差不变 C 、均数、标准差均改变 D 、均数不变、标准差改变 8. 下列哪个P 值通常推论为差异有统计意义( D )。 A 、P>0.1 B 、P>0.05 C 、P<0.5 D 、 P<=0.05 9. 方差分析的主要目的是比较( A )。 A 、总体均数之间的差异性 B 、样本均数之间的差异性 C 、总体方差之间的差异性 D 、总体变异系数之间的差异性 10. 对于同一组资料,哪个指标没有考虑到每个观察值的变异( D )。 A 、方差 B 、总体标准差 C 、变异系数 D 、四分位差 11. 在统计分析中,最常用的反映变量集中趋势的统计数是( A )。 A 、算术平均数 B 、几何平均数 C 、调和平均数 D 、众数 12. 试验误差主要是由( D )的差异引起。 A 、水平 B 、处理 C 、供试因素 D 、非试验因素

生物统计学考试复习题库

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 122 --∑∑n n x x )(

2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 三 填空 1.如果事件A 和事件B 为独立事件,则事件A 与事件B 同时发生的概率P (AB )= P (A )?P (B )。 2.二项分布的形状是由( n )和( p )两个参数决定的。 3.正态分布曲线上,( μ )确定曲线在x 轴上的中心位置,( σ )确定曲线的展开程度。 4.样本平均数的标准误 =( )。 5.t 分布曲线与正态分布曲线相比,顶部偏( 低 ),尾部偏( 高 )。 n /σx σ

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

生物统计学考试题及答案

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专 业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已 知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。

A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是 2、态分布不具有下列哪种特征( )。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 3、一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( )。 A 、 2MSe/6 , 3 B 、 MSe/6 , 3 C 、 2MSe/3 , 12 D 、 MSe/3 , 12 4、已知),N(~x 2σμ,则x 在区间]96.1,[σμ+-∞的概率为( )。 A 、0.025 B 、0.975 C 、0.95 D 、0.05 5、 方差分析时,进行数据转换的目的是( )。 A. 误差方差同质 B. 处理效应与环境效应线性可加 C. 误差方差具有正态性 D. A 、B 、C 都对 三、简答题;(每小题6分,共30分 ) 1、方差分析有哪些步骤? 2、统计假设是?统计假设分类及含义? 3、卡方检验主要用于哪些方面? 4、显著性检验的基本步骤? 5、平均数有哪些?各用于什么情况? 四、计算题;(共4题、50分) 1、进行大豆等位酶Aph 的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于下表。试分析大豆Aph 等位酶的等位基因型频率是否因物种而不同。( 99 .52 05.0,2=χ, 81 .7205.0,3=χ)(10分) 野生大豆和栽培大豆Aph 等位酶的等位基因型次数分布 物 种 等位基因型 1 2 3 野生大豆 29 68 96

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

《生物统计学-2019》复习题

《生物统计学》复习题 1.变量之间的相关关系主要有两大类:(因果关系),(平行关系) 2.在统计学中,常见平均数主要有(算术平均数)、(几何平均数) 3.样本标准差的计算公式( 1 ) (2 --= ∑n X X S ) 4.小概率事件原理是指(某事件发生的概率很小,人为的认为不会发生) 5.在分析变量之间的关系时,一个变量X 确定,Y 是随着X 变化而变化,两变量呈因果关系,则X 称为(自变量),Y 称为(因变量) ADCAA BABCB DADBB ADBCB 1、下列数值属于参数的是: A 、总体平均数 B 、自变量 C 、依变量 D 、样本平均数 2、 下面一组数据中属于计量资料的是 A 、产品合格数 B 、抽样的样品数 C 、病人的治愈数 D 、产品的合格率 3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是 A 、12 B 、10 C 、8 D 、2 4、变异系数是衡量样本资料 程度的一个统计量。 A 、变异 B 、同一 C 、集中 D 、分布 5、方差分析适合于, 数据资料的均数假设检验。 A 、两组以上 B 、两组 C 、一组 D 、任何 6、在t 检验时,如果t = t 0、01 ,此差异是: A 、显著水平 B 、极显著水平 C 、无显著差异 D 、没法判断 7、 生物统计中t 检验常用来检验 A 、两均数差异比较 B 、两个数差异比较 C 、两总体差异比较 D 、多组数据差异比较 8、平均数是反映数据资料 性的代表值。 A 、变异性 B 、集中性 C 、差异性 D 、独立性 9、在假设检验中,是以 为前提。 A 、 肯定假设 B 、备择假设 C 、 无效假设 D 、有效假设 10、抽取样本的基本首要原则是 A 、统一性原则 B 、随机性原则 C 、完全性原则 D 、重复性原则 11、统计学研究的事件属于 事件。 A 、不可能事件 B 、必然事件 C 、小概率事件 D 、随机事件 12、下列属于大样本的是 A 、40 B 、30 C 、20 D 、10 13、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是 A 、0.11 B 、8.64 C 、2.88 D 、0.32 14、在假设检验中,计算的统计量与事件发生的概率之间存在的关系是 。 A 、正比关系 B 、反比关系 C 、加减关系 D 、没有关系 15、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是 A 、18 B 、12 C 、10 D 、5 16、已知数据资料有10对数据,并呈线性回归关系,它的总自由度、回归自由度和残差自由度分别是 A 、9、1和8 B 、1、8和9 C 、8、1和9 D 、 9、8和1 18、下列那种措施是减少统计误差的主要方法。 A 、提高准确度 B 、提高精确度 C 、减少样本容量 D 、增加样本容量 19、相关系数显著性检验常用的方法是

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

生物统计学复习题库新编完整版

生物统计学复习题库新 编 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 1.如果事件A 和事件B 为独立事件,则事件A 与事件B 同时发生的概率P (AB )= P (A )?P (B )。 2.二项分布的形状是由( n )和( p )两个参数决定的。 3.正态分布曲线上,( μ )确定曲线在x 轴上的中心位置,( σ )确定曲线的展开程度。 4.样本平均数的标准误 =( )。 5.t 分布曲线与正态分布曲线相比,顶部偏( 低 ),尾部偏( 高 )。 1.统计推断主要包括(假设检验)和(参数估计)两个方面。 2.参数估计包括(点)估计和(区间)估计。 3.假设检验首先要对总体提出假设,一般要作两个:(无效)假设和(备择)假设。 4.在频率的假设检验中,当np 或nq (<)30时,需进行连续性矫正。 1.根据对处理效应的不同假定,方差分析中的数学模型可以分为(固定模型)、(随机模型)和(混合模型)3类。 2.在进行两因素或多因素试验时,通常应设置(重复),以正确估计试验误差,研究因素间的交互作用。 3.在方差分析中,对缺失数据进行弥补2时,应使补上来数据后,(误差平方和)最小。 4.方差分析必须满足(正态性)、(可加性)和(方差同质性)3个基本假定。 5.如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有(平方根转换)、(对数转换)、(反正弦转换)等。 6.一个试验的总变异依据变异来源分为相应的变异,将总平方和分解为:(处理间平方和)与(处理内平方和)。 变量之间的关系分为(函数关系)和(相关关系),相关关系中表示因果关系的称为回归。 2、一元线性回归方程 中,a 的含义是(样本回归截距),b 的含义是(样本回归系数)。 可用个体间的(相似程度)和(差异程度)来表示亲疏程度。 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 1.事件A 的发生和事件B 的发生毫无关系,则事件A 和事件B 为互斥事件。(× ) 2.二项分布函数C n x p x q n-x 恰好是二项式(p+q )n 展开式的第x 项,故称二项分布。( × ) 1 2 2--∑∑n n x x )(n /σx σ?y a bx =+

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

生物统计学试题及答案

生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() A.31 - x ~N(0,1) B.11 - x ~N(0,1) C.91 - x ~N(0,1) D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 C.前者比后者小 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() A.应用标准正态概率表查出u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 D.置信水平 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计 上称为( )。 A.方差的齐性检验 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 在一个有限总体中要随机抽样应采用放回式抽样方法。 12. 在实际抽样工作中,为了减小标准误,最常用的办法就是增大样品容量。 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F分布的临界值为 0.25 14. 衡量优良估计量的标准有无偏性、有效性和相容性。 15. 已知随机变量x服从 N (8,4),P(x < 4.71)= 0.05 。(填数字) 四.综合分析题(共60分) 16.何谓“小概率原理”?算术平均数有两条重要的性质,是什么? 小概率的事件,在一次试验中,几乎是不会发生的。若根据一定的假设条件,计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而否定假设。 算术平均数的性质: 1.离均差之和为零 2. 离均差平方之和最小 17.计算5只山羊产绒量:450, 450,500, 550, 550(g)的标准差。 标准差 18.一农场主租用一块河滩地,若无洪水则年终可获利20000元,若发洪水则会损失12000

生物统计学复习题库

填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 ) 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 1.如果事件A 和事件B 为独立事件,则事件A 与事件B 同时发生的概率P (AB )= P (A )?P (B )。 2.二项分布的形状是由( n )和( p )两个参数决定的。 3.正态分布曲线上,( μ )确定曲线在x 轴上的中心位置,( σ )确定曲线的展开程度。 [ 4.样本平均数的标准误 =( )。 5.t 分布曲线与正态分布曲线相比,顶部偏( 低 ),尾部偏( 高 )。 1.统计推断主要包括(假设检验)和(参数估计)两个方面。 2.参数估计包括(点)估计和(区间)估计。 3.假设检验首先要对总体提出假设,一般要作两个:(无效)假设和(备择)假设。 4.在频率的假设检验中,当np 或nq (<)30时,需进行连续性矫正。 1.根据对处理效应的不同假定,方差分析中的数学模型可以分为(固定模型)、(随机模型)和(混合模型)3类。 2.在进行两因素或多因素试验时,通常应设置(重复),以正确估计试验误差,研究因素间的交互作用。 】 3.在方差分析中,对缺失数据进行弥补2时,应使补上来数据后,(误差平方和)最小。 4.方差分析必须满足(正态性)、(可加性)和(方差同质性)3个基本假定。 5.如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有(平方根转换)、(对数转换)、(反正弦转换)等。 6.一个试验的总变异依据变异来源分为相应的变异,将总平方和分解为:(处理间平方和)与(处理内平方和)。 变量之间的关系分为(函数关系)和(相关关系),相关关系中表示因果关系的称为回归。 2、一元线性回归方程 中,a 的含义是(样本回归截距),b 的含义是(样本回归系数)。 可用个体间的(相似程度)和(差异程度)来表示亲疏程度。 1.对于有限总体不必用统计推断方法。(×) ' 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 1 2 2--∑∑n n x x )(n /σx σ?y a bx =+

《生物统计学》期末考试试卷

《生物统计学》期末考试试卷 一 单项选择(每题3分,共21分) 1.设总体服从),(2 σμN ,其中μ未知,当检验0H :220σσ=,A H :220σσ≠时,应选 择统计量________。 A. 2 (1)n S σ- B. 2 20(1)n S σ- X X 2.设123,,X X X 是总体2 ( , )N μσ的样本,μ已知,2 σ未知,则下面不是统计量的是_____。 A. 123X X X +- B. 41i i X μ=-∑ C. 2 1X σ+ D. 4 2 1 i i X =∑ 3.设随机变量~(0,1)X N ,X 的分布函数为()x Φ,则( 2)P X >的值为_______。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4.假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布,则每升饮水中有3个大肠杆菌的概率是________。 A.63e μ μ- B.36e μ μ- C.36e μ μ- D. 316 e μ μ- 5.在假设检验中,显著性水平α的意义是_______。 A. 原假设0H 成立,经检验不能拒绝的概率 B. 原假设0H 不成立,经检验不能拒绝的概率 C. 原假设0H 成立,经检验被拒绝的概率 D. 原假设0H 不成立,经检验被拒绝的概率 6.单侧检验比双侧检验的效率高的原因是________。 A .单侧检验只检验一侧 B .单侧检验利用了另一侧是不可能的这一已知条件 C .单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7.比较身高和体重两组数据变异程度的大小应采用_____。 A .样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数

《生物统计学》试题A

《生物统计学》基本知识题 一、填空题 第一章 1.填写下列符号的统计意义:①SS ②S x ③ S2 ④ SP xy。 2.t检验、u检验主要用于____ 组数据的差异显著性检验; F 检验主要用于____ _ 组数据的差异显著性检验。 3.试验误差指由因素引起的误差,它不可,但可 以和。 4.参数是由____计算得到的,统计量是由____计算得到的。 5.由样本数据计算得到的特征数叫,由总体数据计算 得到的特征数叫。 9.一般将原因产生的误差叫试验误差,它避免, 但可以和。 第二章 4.变异系数可用于当两个样本的、不同时 变异程度的比较。变异系数的计算公式为。 5.变异系数可用于当两个样本的、不同时 的比较。变异系数的计算公式为。 7.连续性随机变量等组距式次数分布表的编制方法步骤为: ①_____、②____、③____、④____、⑤___。 8.计算标准差的公式是S=。 9.变异系数的计算公式是CV=。 10. 标准差的作用是①、②、③。 12.算术平均数的两个重要性质是①②。 13.样本平均数的标准差叫。它与总体标准差的关系 是。 第三章 1.若随机变量x~N(μ,σ2),欲将其转换为u~N(0,1),则 标准化公式为u=。 第四 1.统计量与参数间的误差叫,其大小受①② ③的影响,其大小可以用来描述,计算公式 为。 2.抽样误差是指之差。抽样误差的大小可用来表 示。影响抽样误差的因素有、和。 6.在两个均数的显著性检验中,若检验结果是差异显著,则说 明。 7.在显著性检验时,当H0是正确的,检验结果却否定了H0,这 时犯的错误是:型错误。 8. 显著性检验时,犯Ⅰ型错误的概率等于。 9.显著性检验分为_______ 检验和______检验。 10.显著性检验的方法步骤为:、、。 12.若服从N(, 2)分布,则值服从分布, 值服从分布。 第五章 1.方差分析是以为检验对象的。在实际分析时常常以 作为它的估计值。 2.多重比较的方法有①和②两类;①一般适用于 组均数的检验,②适用于组均数间的检验。 3.多重比较的LSD法适用于组均数比较;LSR法适用于 组均数间的比较。 4.多重比较的方法有和两类。前者一般用于 组均数检验,后者又包含和法,适用于组 均数的比较。第六章 1.χ2 检验中,连续性矫正是指用性分布检验性数据所产生的差异,当或时,必须进行矫正。 2.在χ2检验时,当和时必须进行连续性矫正。3.χ2检验中,当或时,必须进行连续性矫正,矫正方法有_____ 和_____ 两种。 4.χ2检验的计算公式为χ2=,当、时,必须矫正,其矫正方法为、。 第七章 1.在直线相关回归分析中,相关系数显著,说明两变量间直线相关关系。 2.相关系数的大小,说明相关的紧密程度,其说明相关的性质。 相关系数r是用来描述两变量之间相关的和的指标,r 的正负号表示相关的,r的绝对值大小说明相关的。 3.变量间存在的关系,统计上称为相关关系。 4.回归分析中表示,byx表示,。 5.在回归方程中,表示依变量的,b表示,a表示。 6.已知r=-0.589*,则变量间存在的直线相关关系。 7.统计分析中,用统计量来描述两个变量间的直线相关关系,其取值范围为,其绝对值的大小说明相关的,其正负符号说明相关的。 第九章 1.试验设计的基本原则是、和。 二、单选题 1.比较胸围与体重资料的变异程度,以最好。 a.标准差b.均方c.全距d.变异系数 2.比较身高与体重两变量间的变异程度,用统计量较合适。 ①CV ②S ③R ④S2 4.若原始数据同加(或同减)一个常数,则。 a不变,S改变b.S不变,改变 c.两者均改变d.两者均不改变 5.比较身高和体重资料的变异程度,以指标最好。 a.CV b.Sc.Rd.S2 6.离均差平方和的代表符号是。 a.∑(x- )2 b.SP c.SS 7 .样本离均差平方和的代表符号是。 ①S2 ②③ ④SS 8. 愈小,表示用该样本平均数估计总体均数的可靠性愈大。 ①变异系数②标准差 ③全距④标准误 1.二项分布、Poisson分布、正态分布各有几个参数:() A、 (1,1,1 ) B、 (2,2,2) C、 (2,1, 2) D、 (2,2,1 ) 2.第一类错误是下列哪一种概率:()

生物统计学期末复习资料(推荐文档)

第一章概论 1.1什么事生物统计学?生物统计学的主要内容和作用是什么? 答:生物统计学(biostatistics)是用数理统计的原理和方法来分析和解释生物界各种现象和实验调查资料,是研究生命过程中以样本来推断总体的一门学科。 生物统计学主要包括实验设计和统计分析两答部分的内容。其基本作用表现在以下四个方面:a.提供整理和描述数据资料的科学方法;确定某些性状和特性的数量特征;b.判断实验结果的可靠性;c.提供由样本推断总体的方法;d.提供实验设计的一些重要原则。 1.2解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、实验误差。 答:总体(populatian)是具有相同性质的个体所组成的集合,是研究对象的全体。 个体(individual)是组成总体的基本单元。 样本(sample)是从总体中抽出的若干个个体所构成的集合。 样本容量(sample size)是指样本个体的数目。 变量(variable)是相同性质的事物间表现差异性的某种特征。 参数(parameter)是描述总体特征的数量。 统计数(statistic是由样本计算所得的数值,)是描述样本特征的数量。 效应(effection)试验因素相对独立的作用称为该因素的主效应,简称效应。 互作(interaction)是指两个或两个以上处理因素间的相互作用产生的效应。 实验误差(experimental error)是指实验中不可控因素所引起的观测值偏离真值的差异,可以分为随机误差和系统误差。 1.3随机误差和系统误差有何区别? 答:随机误差(random)也称抽样误差或偶然误差,他是有实验中许多无法控制的偶然因素所造成的实验结果与真实结果之间产生的差异,是不可避免的。随机误差可以通过增加抽样或试验次数降低随机误差,但不能完全消除随机误差。 系统误差(systematic)也称为片面误差,是由于实验处理以外的其他条件明显不一致所差生的倾向性的或定向性的偏差。系统误差主要有一些相对固定的因素引起,在某种程度上是可控制的,只要试验工作做得精细,在试验过程中是可以避免的。 1.4准确性与精确性有何区别? 答:准确性(accuracy)也称为准确度,指在调查或实验中某一实验指标或性状的观测值与其真值接近的程度。 精确性(precision)也称精确度,指调查或实验中同一实验指标或性状的重复观测值彼此接近程度的大小。 准确性是说明测定值堆真值符合程度的大小,用统计数接近参数真值的程度来衡量。精确性是反映多次测定值的变异程度,用样本间的各个变量间变异程度的大小来衡量。 第二章试验资料整理与特征数的计算 2.3平均数与标准差在统计分析中有什么作用?它们各有哪些特性? 答:平均数(mean)的用处:①平均数指出了一组数据资料内变量的中心位置,标志着资料所

相关主题
文本预览
相关文档 最新文档