生物统计学作业答案完善版
第一章
习题1.1
答:生物统计学是用数理统计的原理和方法来分析和解释生物界各种现象和实验调查资料,是研究生命过程中以样本来推断总体的一门科学。
生物统计学的主要容包括实验设计和统计分析。基本作用有以下四个方面:①提供整理和描述数据资料的科学方法,确定某些数性状和特性的数理特征;②判断实验结果的可靠性;③提供有样本推断总体的方法;③提供实验设计的一些重要原则。
习题1.2
总体:总体是具有相同性质的个体所组成的集合,是研究对象的全体。
样本:是从总体中抽出来的若干个体所组成的集合。
样本容量:样本中所含个体总数。
变量:相同性质的事物间表现的差异性的某些特征。
参数:是描述总体特征的数量。
统计数:是描述样本特征的数量。
效应:是由因素而引起的实验差异的作用。
互作:是指两个或两个处理因素间的相互作用产生的效应。
实验误差:实验中不可控因素所引起的观测值和真实值之间的差异。
习题1.3
答:随机误差:它是由实验中许多无法控制的因素所造成的实验结果和真实值之间的误差,是不可避免的。
系统误差:是由于实验处理以外的其他条件明显不一致所造成的带有倾向性的或定向的偏差,是可控的。
习题1.4
答:准确性指在调查和实验中某一实验指标或性状的观测值和真实值接近程度。精确性指调查和实验中同一实验指标或性状的重复观察值彼此接近的程度。
准确性是说明测定值和真实值之间符合程度的大小;精确性是反映多次测定值的变异程度。
第二章
习题2.3
答:平均数的用处:①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其他资料进行比较。
平均数的特征:①离均差之和为零;②离均差平方和为最小。
标准差的用处:①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;②在计算标准差是如果对观察值加上一个或减去一个a,
标准差不变;如果给各观测值乘以或除以一个常数a ,所得的标准差就扩大或缩小a 倍; ③在正态分布中,X+-S 的观测值个数占总个数的68.26%,X-+2s 的观测值个数占总个数的95.49%,x-+3s 的观测值个数占总个数的99.73%。
标准差的特征: ①表示变量分布的离散程度; ②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例; ③估计平均数的标准差; ④进行平均数区间估计和变异数的计算。
习题2.4
答:总体平均数μ=∑x/N,式中分母为总体观察个数N ; 样本平均数x=∑x/n ,公式中n 是样本容量; 样本平均数是总体平均数的无偏估计值。
总体和样本标准差都等于离均差的平方和除以样本容量; 而总体标准差σ= ,分母上是总体观测值个数N; 而样本标准差是s= ,分母上是样本自由度n-1. 样本标准差s 是总体标准差σ的无偏估计值。
习题2.5
解:(1)极差:
R=7.22—2.70=4.52
(2)样本容量n=100,组数为10组,则:
组距=4.52/10=0.452≈0.5
(3)列次表如下表。
习题2.6解:样本总和=473.98
平均数=4.7398
标准差s=0.866164
变异系数=cv=18.2743
习题2.9
解:单养平均数为: x =n x
∑=5046
...4545+++=42.70(kg )
单养极差为:
R=55-25=30(kg )
单养标准差为: S=
1n x x 2-∑-)
(=7.078(kg )
单养系数为: CV=x s
×100%=16.58%
混养平均数为: x =∑x /n=52.10(kg )
混养极差为:
R=69-39=30(kg )
混养标准差为: S=
1n x x 2-∑-)
(=6.335(kg )
混养变异系数为: CV=x s
×100%=12.16%
从单养和混养的贻贝重量数据可以看出,混养贻贝平均重量大于单养。二者稽查相等,说明最大值、最小值差距相等。但单养的标准差和变异系数都打与混养,说明单养贻贝的重量的整齐度没有与海带混养整齐度高。以上结果表明,贻贝与海带混养效果较好。
第三章
习题3.1
答:在一定条件下必然出现的时间叫必然事件;相反,在一定条件下必然不出现的事件叫不可能事件;而在某些确定条件下可能出现,也可能不出现的事件,叫随机事件。例如,发育正常的鸡蛋,在39°C 下21天会孵出小鸡,这是必然事件;太阳从西边出来,这是不可能事件;给病人做血样化验,结果可能为阳性,也可能为阴性,这是随机事件。
习题3.2
答:事件A 和事件B 不能同时发生,即A ·B=V ,那么称事件A 和事件B 为互斥事件,如人的ABO 血型中,某个人血型可能是A 型、B 型、O 型、AB 型4中血型之一,但不可能既是A 型又是B 型。事件A 和事件B 必有一个发生,但二者不能同时发生即A+B=U,A ×B=V,则称事件A 与事件B 为对立事件,如抛硬币时向上的一面不是正面就是反面。事件A 与事件B 的发生毫无关系。反之事件B 的发生与事件A 的发生毫无关系,则称事件A 与事件B 为独立事件,如第二胎生男生女与第一台生男生女毫无关系。
习题3.3
答:事件A 在n 次重复试验中发生了m 次,则比值m /n 称为事件A 发生的频率,记为W(A);事件A 在n 次重复试验中发生了m 次,当试验次数n 不断增加时,事件A 发生的频率W(A)就越来越接近某一确定值p ,则p 即为事件A 发生的概率。二者的关系是:当试验次数n 充分大时,频率转化为概率 。
习题3.4
答:正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。
U=0,σ2=1的正态分布为标准正态分布。
正态分布具有以下特点:标准正态分布具有以下特点:①、正态分布曲线是以平均数μ为峰
值的曲线,当x=μ时,f(x)取最大值πσ21
;②、正态分布是以μ为中心向左右两侧对称
的分布 ③、σu
x -的绝对值越大,f(x)值就越小,但f(x)永远不会等于0,所以正态分布以x 轴为渐近线,x 的取值区间为(-∞,+∞); ④、正态分布曲线完全由参数μ和σ来决定 ⑤、正态分布曲线在x=μ±σ处各有一个拐点;⑥、正态分布曲线与x 轴所围成的面积必定等于1。
正态分布具有两个参数μ和σ,μ决定正态分布曲线在x 轴上的中心位置,μ减小曲线左移,增大则曲线右移;σ决定正态分布曲线的展开程度,σ越小曲线展开程度越小,曲线越陡,σ越大曲线展开程度越大,曲线越矮宽。
习题3.7
解:(1)F1代非糯杂合体Ww 与糯稻亲本ww 回交,后代非糯杂合体Ww 与糯稻纯合体ww 各占一半,即概率均为0.5,故在后代N=200株中预期糯稻和非糯稻均为0.5×200=100(株)。
(2)F1代非糯杂合体Ww 自交,后代非糯杂合体WW :非糯杂合体Ww :糯稻杂合体ww=1:2:1,但表型非糯:糯稻=3:1,即非糯和糯稻的概率分别为0.75和0.25,故在后代N=2000株中,糯稻应为0.25×2000=500(株),非糯稻应为0.75×2000=1500(株)。
习题3.8
解: 根据研究的目的基因,可将F2代分为纯合正常抗绣植株和非纯合正常抗绣植株,且不同大麦出现该目的基因为独立的,同时出现纯合正常抗绣植株的概率p=0.0036,非常小,故该题可用二项分布或泊松分布的概率函数公式计算。
(1)λ= np=200*0.0036=0.72,代入泊松分布概率函数公式:
P (X )=!x *72.0e
x 72.0-X=0,1,2 (200)
F2代出现纯合正常抗锈植株的各种可能株数的概率分别为:
P (0)=0.487
P (1)=0.350
P (2)=0.126
P (3)=0.030
P (4)=0.005
P (5)=0.001
P (X ≥6)=1- P (0)- P (1)- P (2)- P (3)- P (4)-P (5)
=1-0.487-0.350-0.126-0.030-0.005-0.001=0.001
出现6或6株以上纯合正常抗锈植株的概率总共为0.001,已经非常小了,不必再一一计算。
(2)欲求P (X ≥1)=0.99.则P (0)=0.01,即
P (X )=!00e λ
λ-=0.01,
对两边求对数,则有:
n =4.605/0.0036=1279株
因此,希望有0.99的概率保证获得1株或1株以上纯合正常抗锈植株,则F2代至少应种1279株。
习题3.9
解:小白鼠接种病菌后,要么生存要么死亡,个体间又相互独立,故服从二项分布。设时间A为接种病菌后生存,由已知得ρ=0.425,n=5,x=4,则“四生一死”的概率为:
Ρ(4)=
q45
4
4
5
P
C
=5×
425
.04×(1-0.425)1=0.0938
第四章
习题4.1
答:统计推断是根据理论分布由一个样本或一系列样本所得的结果来推断总体特征的过程。统计推断主要包括参数统计和假设检验两个方面。假设检验是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,进过一定的计算,作出在一定概率水平(或显著水平)上应该接受或否定的那种假设的推断。参数估计则是由丫根本结果对总体参数在一定概率水平下所做出的估计。参数估计包括点估计和区间估计。
习题4.2
答:小概率原理是指概率很小的事件再一次试验中被认为是几乎不可能会发生的,一般统计学中常把概率概率小于0.05或0.01的时间作为小概率事件。他是假设检验的依据,如果在无效假设H0成立的条件,某事件的概率大于0.05或0.01,说明无效假设成立,则接受H0,否定HA;,如果某时间的概率小于0.05或0.01,说明无效假设不成立,则否定H0,接受HA。
习题4.3
答::在假设检验中如果H。是真实的,检验后却否定了它,就犯了第一类错误,即α错误或弃真错误;如果H。不是真实的,检验后却接受了它,就犯了第二类错误,即β错误或纳伪错误。为了减少犯两类错误的概率,要做到以下两点:一是显著水平α的取值不可太高也不可太低,一般取0.05作为小概率比较合适,这样可使得犯两类错误的概率都比较小;二是尽量增加样本容量,并选择合理的实验设计和正确的实验技术,以减少标准误,减少两类错误。
假设检验中的两类错误是取证错误和取伪错误。为了减少犯两类错误的概率要做到:①显著水平a的取值不可以太高也不可太低,一般去0.05作为小概率比较合适,这样可以使犯两类错误的概率都比较小;②尽量增加样本容量,并选择合理的实验设计和正确的实验技术,以减小标准误,减少两类错误。
习题4.4
答:区间估计指根据一个样本的观测值给出总体参数的估计围给出总体参数落在这一区间的
概率。点估计是指从总体中抽取一个样本,根据样本的统计量对总体的未知参数作出一个数值点的估计。置信度与区间估计的关系为;对于同一总体,置信度越大,置信区间就越小,置信度越小,置信区间越大。
第五章
习题5.1
答:x2检验主要有三种用途:一个样本方差的同质性检验,适合性检验和独立性检验。一个样本方差的同质性检验用于检验一个样本所属总体方差和给定总体方差是否差异显著,适合性检验是比较观测值与理论值是否符合的假设检验;独立性检验是判断两个或两个以上因素间是否具有关联关系的假设检验。
习题5.2
答:x2检验的步骤为:
(1)提出无效假设H0:观测值与理论值的差异由抽样误差引起即观测值=理论值
备择假设HA:观测值与理论值的差值不等于0,即观测值≠理论值
(2)确定显著水平a.一般可确定为0.05或0.01
(3)计算样本的x2,求得各个理论次数Ei,并根据各实际次数Oi,代入公式,计算出样本的x2。
(4)进行统计推断
第六章
习题6.1
答:(1)方差分析是对两个或多个样本平均数差异显著性检验的方法。
(2)方差分析的基本思想是将测量数据的总变异按照变异来源分为处理效应和误差效应,并作出数量估计,在一定显著水平下进行比较,从而检验处理效应是否显著。
(3)方差分析的基本步骤如下:
a.将样本数据的总平方和与自由度分解为各变异因素的平方和与自由度。
b.列方差分析表进行F检验,分析各变异因素在总变异中的重要程度。
c.若F检验显著,对个处理平均数进行多重比较。
习题6.2
答:(1)多个平均数两两间的相互比较称为多重比较。
(2)多重比较常用的方法有最小显著差数法和最小显著极差法,其中最小显著极差法又有新复极差检验和q检验法。
(3)多重比较的结果常以标记字母法和梯形法表示。标记字母法是将全部平均数从大到小依次排列,然后再最大的平均数上标字母a,将该平均数与以下各平均数相比,凡相差不显著的都标上字母a,直至某个与之相差显著的则标以字母b。再以该标有b的平均数为标准,
与各个比它大的平均数比较,凡差数差异不显著的在字母a的右边加标字母b。然后再以标b的最大平均数为标准与以下未曾标有字母的平均数比较,凡差数不显著的继续标以字母b,直至差异显著的平均数标以字母c,再与上面的平均数比较。如此重复进行,直至最小的平均数有了标记字母,并与上面的平均数比较后为止。这样各平均数间,凡有一个相同标记的字母即为差异不显著,凡具不同标记的字母即为差异显著。差异极显著标记方法同上,用大写字母标记。
梯形法是将各处理的平均数差数按梯形列于表中,并将这些差数进行比较。差数>LSD(LSR)0.05说明处理平均数间的差异达到显著水平,在差数的右上角标上“*”号;差数>LSD(LSR)0.01说明处理平均数间的差异达到极显著水平,在差数的右上角标上“**”号。差数< LSD(LSR)0.05,说明差异不显著。
习题6.3
答:方差分析有3个基本假定,即正态性、可加性和方差同质性。方差分析有效性是建立在3个基本假定的基础上的。
第七章
习题7.1
答:回归分析是用来研究呈因果关系的相关变量间的关系的统计分析方法,其中表示原因的变量为自变量,表示结果的变量为因变量。回归截距是当自变量为零时,因变量的取值,即回归线在y轴上的截距;回归系数是回归直线的斜率,其含义是自变量改变一个单位,因变量y平均增加或减少的单位数。
习题7.3
答:相关分析是用来研究呈平行关系的相关变量之间的关系的统计方法。相关系数表示变量x与变量y相关的程度和性质,决定系数是相关系数的平方,表示变量x引起y变异的回归平方和和占y变异总平方和的比率,它只能表示相关的程度而不能表示相关的性质。
第九章
习题9.1
答:抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并对全部调查研究对象作出估计和推断的一种调查方法。
常用的抽样调查方法有随机抽样,顺序抽样和典型抽样。
随机抽样是指在抽样过程中,总体所有个体都具有相同的被抽取的概率。由于抽样的随机性,可以正确的估计试验误差,从而推出科学合理的结论。随机抽样可分为以下几种方法:简单随机抽样,分层随机抽样,整体抽样和双重抽样。
⑴简单随机抽样的结果可用统计方进行分析,从而对总体作出推断,并对推断的可靠性作出
度量。适用于个体间差异较小,所需抽取的样本单位数较小的情况。对于那些具有某种趋向或差异明显和点片式差异的总体不宜使用。
⑵分层随机抽样是一种混合抽样。其特点是将总体按变异原因或程度划分成若干区层,然后再用简单随机抽样方法,从各区层按一定的抽样分数抽选抽样单位。分层随机抽样具有以下优点:①若总体各抽样单位间的差异比较明显,可以把总体分为几个比较同质的区层,从而提高抽样的准确度;②分层随机抽样类似于随机区组设计,既运用了随机原来,也运用了局部控制原理,这样不仅可以降低抽样误差,也可以运用统计方法来估算抽样误差。
⑶整体抽样是把总体分成若干群,以群为单位,进行随机抽样,对抽到的样本作全面调查,因此也称为整群抽样。整体抽样具有以下优点:①一个群只要一个编号,因而减少了抽样单位编号数,且因调查单位数减少,工作方便;②与简单随机抽样相比较,它常常提供较为准确的总体估计值,特别是害虫危害作物这类不均匀的研究对象,采用整体抽样更为有利;③只要各群抽选单位相等,整体抽样也可提供总体平均数的无偏估计。
⑷双重抽样是在抽样调查时要求随机抽出两个样本,涉及两个变量。双重抽样具有以下两个优点:①对于复杂性状的调查研究可以通过仅测量少量抽样单位而获得相应于大量抽样单位的精确度;②当复杂性状必须通过破坏性测定才能调查时,则仅有这种双重抽样方法可用。 顺序抽样是按某种既定顺序从总体中抽取一定数量的个体构成样本。抽样顺序的优点表现在:①可避免抽样时受人们主观偏见的影响,而简便易行;②容易得到一个按比例分配的样本;③如果样本的观察单位在总体分布均匀,其取样个体在总体分布较均匀,这时采用顺序抽样的抽样误差较小。其缺点表现在:①如果总体存在周期性变异或单调增﹙减﹚趋势时,则很可能会得到一个偏差很大的样本,产生明显的系统误差;②顺序抽样得到的样本并不是彼此独立的,因此,对抽样误差的估计只是近似的。通过顺序抽样的方法,不能计算抽样误差,估计总体平均数的置信区间。
典型抽样是根据初步资料或经验判断,有意识,有目的的选取一个典型群体作为样本进行调查记载,以估计整个总体。这种抽样方法完全依赖于调查工作者的经验和技能,结果不稳定,且没有运用随机原理,因而无法估计抽样误差。典型抽样多用于大规模社会经济调查,而在总体相对较小或要求估算抽样误差时,一般不采用这种方法。
习题9.2 解:L 22205
.0s t =L 22s 4=5.02.322
*4=174.24≈174(头)
该结果表明,随机调查174头仔猪,就有95%的概率保证体重误差不超过0.5kg 。
9.3为 研究某地区鸡的球虫感染率,预测感病率为 15% ,希望调查的感染率与该地区普查的感染率相差不超过 3% ,且置信概率为 95% ,问应调查多少只鸡才能达到目的 ? 习题9.3
解:根据题意,p=15%=0.15,则q=1-0.15=0.85.,允许误差L=3%=0.03。
计算样本容量: n=L 2pq 4=03.0285
.0*15.0*4=566.67≈567(只)
结果表明,需要调查567只鸡,才有95%的可靠性达到允许误差为3%的要求。
习题9.4
解 : n=d
s
t 22d 205.0=3
65.322*4=5.92≈6(对) 以n=6,自由度df=6-1=5,t 5,05.0)(=2.571,计算得: n=d
s t 22d 25,05.0)(=365.3571.2222*=9.78≈10 以n=10,自由度df=10-1=9,t 9,05.0)
(=2.262,计算得: n=d
s t 22d 29,05.0)(=365.3262.2222*=7.57≈8 以n=8,自由度df=8-1=7,t 7,05.0)
(=2.,365,计算得: n=d s t 22
d
27,05.0)(=365.3365.2222*=8.27≈8
因此,需要8对实验鸡,才有95%的可靠度使平均数d 在3枚以。
习题9.5
解:以a=0.05,n >30,t 05.0≈2计算,则: n=)(x x s t 21222
205.0-=)(x x s 21822
-=5.1422
*8=56.89≈57
结果表明,每组实验需要57尾鱼,才有95%的把握使两组增重差值在1.5kg 能测出差异显著性。
第十章
习题10.1
答:试验设计包括广义的试验设计和狭义的试验设计。广义的试验设计是指整个研究课题的设计,包括试验方案的拟订,试验单位的选择,分组的排列,试验过程中试验指标的观察记载,试验资料的整理,分析等容;而狭义的试验设计则仅是指试验单位的选择,分组与排列方法。生物统计学中的试验设计主要指狭义的试验设计。
生物学试验的基本要:①试验目的要明确;②试验条件要有代表性;③试验结果要可靠;④试验结果要重演。
习题10.2
答:处理是指对受试对象给予的某种外部干预,是试验中实施的因子水平的一个组合,又称为处理因素。处理因素是指处理因素作用于受试对象的反应,是研究结果的最终体现。主效应是指由于因素水平的改变而造成因素效应的改变。互作是指两个或两个以上处理因素间的相互作用产生的效应。
试验误差的来源主要有:①试验材料固有的差异;②试验条件不一致;③操作技术不一致;④偶然性因素的影响。针对试验误差来源,控制试验误差的途径主要有:①选择纯合一一致的试验材料;②改进操作管理制度,使之标准化;③精心选择试验单位;④采用合适的试验设计。
习题10.3
答:试验设计有3项基本原则:重复,随机和局部控制。重复原则的主要作用是估计试验误差,降低试验误差;随机原则的主要作用是提供无偏的试验误差估计。局部控制原则的主要作用是降低试验误差。总之,只有遵循重复,随机,局部控制3项基本原则的试验设计,才能由试验获得真实的处理效应和无偏的,最小的试验误差估计,从而对各处理间的比较得出可靠的结论来。
第十一章
习题11.1
答:协方差分析是将乘积和与平方和同时按照变异来源进行分解,从而将直线回归于方差分析结合应用的一种统计方法。它用于比较一个变量y在一个或几个因素不同水平上的差异,但y在受这些因素影响的同时,还受到另一个变量x的影响,而且x变量的取值难以人为控制,不能作为方差分析中的一个因素处理。此时,如果x与y之间可以建立回归关系,则可以用回归分析的方法对y值进行矫正,在排除x对y的影响后用方差分析的方法对各因素的影响作出统计推断。
协方差分析的主要作用表现在3个方面:①利用协变量可以降低试验误差,矫正处理平均数,实现统计控制;②分析不同变异来源的相关关系;③对缺失数据进行估计。
生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?
重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]
贵州大学《生物统计学》考试试卷(含答案) 一 单项选择题(每题3分,共21分) 1.在假设检验中,显著性水平α的意义是___C___。 A. 原假设0H 成立,经检验不能拒绝的概率 B. 原假设0H 不成立,经检验不能拒绝的概率 C. 原假设0H 成立,经检验被拒绝的概率 D. 原假设0H 不成立,经检验被拒绝的概率 2.设123,,X X X 是总体2( , )N μσ的样本,μ已知,2 σ未知,则下面不是统计量的是__C___。 A. 123X X X +- B. 4 1 i i X μ=-∑ C. 2 1X σ+ D. 4 21 i i X =∑ 3.设随机变量~(0,1)X N ,X 的分布函数为()x Φ,则( 2)P X >的值为___A____。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4.比较身高和体重两组数据变异程度的大小应采用__D___。 A .样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数 5.设总体服从),(2 σμN ,其中μ未知,当检验0H :220σσ=,A H :220σσ≠时,应选择统计量___B_____。 A. 2 (1)n S σ- B. 2 2 (1)n S σ- X X 6.单侧检验比双侧检验的效率高的原因是___B_____。 A .单侧检验只检验一侧 B .单侧检验利用了另一侧是不可能的这一已知条件 C .单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7.假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布,则每升饮水中有3个大肠杆菌的概率是____D____。 A.63e μ μ- B.36e μμ- C.36e μ μ- D. 316 e μμ-
李春喜《生物统计学》第三版课后作 业答案
《生物统计学》第三版课后作业答案 (李春喜、姜丽娜、邵云、王文林编著) 第一章概论(P7) 习题1.1 什么是生物统计学?生物统计学的主要内容和作用是什么? 答:(1)生物统计学(biostatistics)是用数理统计的原理和方法来分析和解释生物界各种现象和实验调查资料,是研究生命过程中以样本来推断总体的一门学科。 (2)生物统计学主要包括实验设计和统计推断两大部分的内容。其基本作用 表现在以下四个方面:①提供整理和描述数据资料的科学方法;②确定某些性状和特性的数量特征;③判断实验结果的可靠性;④提供由样本推断总体的方法;⑤提供实验设计的一些重要原则。 习题1.2 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 答:(1)总体(populatian)是具有相同性质的个体所组成的集合,是研究对象的全体。 (2)个体(individual)是组成总体的基本单元。 (3)样本(sample)是从总体中抽出的若干个个体所构成的集合。 (4)样本容量(sample size)是指样本个体的数目。 (5)变量(variable)是相同性质的事物间表现差异性的某种特征。 (6)参数(parameter)是描述总体特征的数量。
(7)统计数(statistic)是由样本计算所得的数值,是描述样本特征的数量。 (8)效应(effection)试验因素相对独立的作用称为该因素的主效应,简称效应。 (9)互作(interaction)是指两个或两个以上处理因素间的相互作用产生的效应。 (10)实验误差(experimental error)是指实验中不可控因素所引起的观测值偏 离真值的差异,可以分为随机误差和系统误差。 (11)随机误差(random)也称抽样误差或偶然误差,它是有实验中许多无法控 制的偶然因素所造成的实验结果与真实结果之间产生的差异,是不可避 免的。随机误差可以通过增加抽样或试验次数降低随机误差,但不能完 全消。 (12) 系统误差(systematic)也称为片面误差,是由于实验处理以外的其他 条件明显不一致所产生的倾向性的或定向性的偏差。系统误差主要由一 些相对固定的因素引起,在某种程度上是可控制的,只要试验工作做得 精细,在试验过程中是可以避免的。 (13) 准确性(accuracy)也称为准确度,指在调查或实验中某一实验指标或 性状的观测值与其真值接近的程度。 (14) 精确性(precision)也称精确度,指调查或实验中同一实验指标或性状 的重复观测值彼此接近程度的大小。 (15)准确性是说明测定值堆真值符合程度的大小,用统计数接近参数真值 的程度来衡量。精确性是反映多次测定值的变异程度,用样本间的各 个变量间变异程度的大小来衡量。
生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() x N(0,1)B.11 - x ~N(0,1)C.91 - x ~N(0,1)D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为 ( )。 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 12. 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F 14. 15.已知随机变量x服从N (8,4),P(x < 4.71)(填数字) 四.综合分析题(共60分)
第一章 统计数据的收集与整理 1.1 算术平均数是怎样计算的?为什么要计算平均数? 答:算数平均数由下式计算:,含义为将全部观测值相加再被观测值的个数 除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点, 或是说是样本数据的代表。 1.2 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差? 答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 1.3 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同? 答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。 1.4 完整地描述一组数据需要哪几个特征数? 答:平均数、标准差、偏斜度和峭度。 1.5 下表是我国青年男子体重(kg )。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。 66 69 64 65 64 66 68 65 62 64 69 61 61 68 66 57 66 69 66 65 70 64 58 67 66 66 67 66 66 62 66 66 64 62 62 65 64 65 66 72 60 66 65 61 61 66 67 62 65 65 61 64 62 64 65 62 65 68 68 65 67 68 62 63 70 65 64 65 62 66 62 63 68 65 68 57 67 66 68 63 64 66 68 64 63 60 64 69 65 66 67 67 67 65 67 67 66 68 64 67 59 66 65 63 56 66 63 63 66 67 63 70 67 70 62 64 72 69 67 67 66 68 64 65 71 61 63 61 64 64 67 69 70 66 64 65 64 63 70 64 62 69 70 68 65 63 65 66 64 68 69 65 63 67 63 70 65 68 67 69 66 65 67 66 74 64 69 65 64 65 65 68 67 65 65 66 67 72 65 67 62 67 71 69 65 65 75 62 69 68 68 65 63 66 66 65 62 61 68 65 64 67 66 64 60 61 68 67 63 59 65 60 64 63 69 62 71 69 60 63 59 67 61 68 69 66 64 69 65 68 67 64 64 66 69 73 68 60 60 63 38 62 67 65 65 69 65 67 65 72 66 67 64 61 64 66 63 63 66 66 66 63 65 63 67 68 66 62 63 61 66 61 63 68 65 66 69 64 66 70 69 70 63 64 65 64 67 67 65 66 62 61 65 65 60 63 65 62 66 64 答:首先建立一个外部数据文件,名称和路径为:E:\data\exer1-5e.dat 。所用的SAS 程序和计算结果如下: proc format; value hfmt 56-57='56-57' 58-59='58-59' 60-61='60-61' 62-63='62-63' 64-65='64-65' 66-67='66-67' 68-69='68-69' 70-71='70-71' 72-73='72-73' 74-75='74-75'; run; n y y n i i ∑== 1
第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(
考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128
生物统计学 姓名: 班级: 学号:
第一章概论 一、填空 1 变量按其性质可以分为_______变量和_______变量。 2 样本统计数是总体_______的估计量。 3 生物统计学是研究生命过程中以样本来推断_______的一门学科。 4 生物统计学的基本内容包括_______、_______两大部分。 5 统计学的发展过程经历了_______、_______、_______3个阶段。 6 生物学研究中,一般将样本容量_______称为大样本。 7 试验误差可以分为_______、_______两类。 二、判断 ()1 对于有限总体不必用统计推断方法。 ()2 资料的精确性高,其准确性也一定高。 ( ) 3 在试验设计中,随机误差只能减少,而不可能完全消除。()4 统计学上的试验误差,通常指随机误差。 三、名词解释 样本 总体 连续变量 非连续变量 准确性 精确性
第二章试验资料的整理与特征数的计算 一、填空 1 资料按生物的性状特征可分为_______变量和_______变量。 2 直方图适合于表示_______资料的次数分布。 3 变量的分布具有两个明显基本特征,即_______和______。 4 反映变量集中性的特征数是_______,反映变量离散性的特征数是_______。 5 样本标准差的计算公式s=_______。 二、判断 ( ) 1 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。( ) 2 条形图和多边形图均适合于表示计数资料的次数分布。 ()3 离均差平方和为最小。 ()4 资料中出现最多的那个观测值或最多一组的中点值,称为众数。()5 变异系数是样本变量的绝对变异量。 三、名词解释 资料 数量性状资料 质量性状资料 计数资料 计量资料 普查 抽样调查 全距(极差) 组中值 算数平均数 中位数 众数 几何平均数 方差 标准差 变异系数
第一章统计数据的收集与整理1.1 算术平均数是怎样计算的?为什么要计算平均数? 答:算数平均数由下式计算:n y y n i i ∑ = =1 ,含义为将全部观测值相加再被观测值的个数 除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点,或是说是样本数据的代表。 1.2 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差? 答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 1.3 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同? 答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。 1.4 完整地描述一组数据需要哪几个特征数? 答:平均数、标准差、偏斜度和峭度。 1.5 下表是我国青年男子体重(kg)。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。 66 69 64 65 64 66 68 65 62 64 69 61 61 68 66 57 66 69 66 65 70 64 58 67 66 66 67 66 66 62 66 66 64 62 62 65 64 65 66 72 60 66 65 61 61 66 67 62 65 65 61 64 62 64 65 62 65 68 68 65 67 68 62 63 70 65 64 65 62 66 62 63 68 65 68 57 67 66 68 63 64 66 68 64 63 60 64 69 65 66 67 67 67 65 67 67 66 68 64 67 59 66 65 63 56 66 63 63 66 67 63 70 67 70 62 64 72 69 67 67 66 68 64 65 71 61 63 61 64 64 67 69 70 66 64 65 64 63 70 64 62 69 70 68 65 63 65 66 64 68 69 65 63 67 63 70 65 68 67 69 66 65 67 66 74 64 69 65 64 65 65 68 67 65 65 66 67 72 65 67 62 67 71 69 65 65 75 62 69 68 68 65 63 66 66 65 62 61 68 65 64 67 66 64 60 61 68 67 63 59 65 60 64 63 69 62 71 69 60 63 59 67 61 68 69 66 64 69 65 68 67 64 64 66 69 73 68 60 60 63 38 62 67 65 65 69 65 67 65 72 66 67 64 61 64 66 63 63 66 66 66 63 65 63 67 68 66 62 63 61 66 61 63 68 65 66 69 64 66 70 69 70 63 64 65 64 67 67 65 66 62 61 65 65 60 63 65 62 66 64 答:首先建立一个外部数据文件,名称和路径为:E:\data\exer1-5e.dat。所用的SAS程序和计算结果如下: proc format; value hfmt 56-57='56-57' 58-59='58-59' 60-61='60-61' 62-63='62-63' 64-65='64-65' 66-67='66-67'
生物统计学课后习题解答-李春喜汇总
第一章概论 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 第二章试验资料的整理与特征数的计算习题 2.1 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下: 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.85 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 计算平均数、标准差和变异系数。 【答案】=4.7398, s=0.866, CV =18.27 % 2.2 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差和变异系数,并解释所得结果。 24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ; 金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。 【答案】 1 =20, s 1 =1.247, CV 1 =6.235% ; 2 =20, s 2 =3.400, CV 2 =17.0% 。 2.3 某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取 50 绳测其毛重(kg) ,结果分别如下:
生物统计学期末复习题 库及答案 https://www.doczj.com/doc/cf9353034.html,work Information Technology Company.2020YEAR
第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 122--∑∑n n x x )(
判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1.下列变量中属于非连续性变量的是( C ). A.身高 B.体重 C.血型 D.血压 2.对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A.条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A.正态分布的算术平均数和几何平均数相等. B.正态分布的算术平均数和中位数相等. C.正态分布的中位数和几何平均数相等. D.正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a,其标准差(D)。 A.扩大√a倍 B.扩大a倍 C.扩大a2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是(C)。 A.标准差 B.方差 C.变异系数 D.平均数 第三章 填空
一、填空 变量按其性质可以分为连续变量和非连续变量。 样本统计数是总体参数的估计量。 生物统计学是研究生命过程中以样本来推断总体的一门学科。 生物统计学的基本内容包括试验设计、统计分析两大部分。 统计学的发展过程经历了古典记录统计学、近代描述统计学、现代推断统计学3 个阶段。 生物学研究中,一般将样本容量n >30称为大样本。 试验误差可以分为随机误差、系统误差两类。 资料按生物的性状特征可分为数量性状资料变量和质量性状资料变量。 直方图适合于表示连续变量资料的次数分布。 变量的分布具有两个明显基本特征,即集中性和离散性。 反映变量集中性的特征数是平均数,反映变量离散性的特征数是变异数。 林星s= 样本标准差的计算公式s= 如果事件A和事件B为独立事件,则事件A与事件B同时发生地概率P (AB) = P(A)*P(B)。 二项分布的形状是由n和p两个参数决定的。 正态分布曲线上,卩确定曲线在x轴上的中心位置,c确定曲线的展开程度。样本平均数的标准误等于c Wi。 t分布曲线和正态分布曲线相比,顶部偏低,尾部偏高。
统计推断主要包括假设检验和参数估计两个方面。
参数估计包括点估计和区间估计假设检验首先要对总体提出假设,一般应作两个假设,一个是无效假设,一个是备择假设。 对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作卩-U a^x_ 卩+U a c x 在频率的假设检验中,当np或nq v30时,需进行连续性矫正。 2检验主要有3种用途:一个样本方差的同质性检验、适应性检验和独立性检验。 2检验中,在自由度df = (1)时,需要进行连续性矫正,其矫正的2 = ( p85 )。 2分布是连续型资料的分布,其取值区间为[0.+ %)。 猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合 孟德尔第一遗传规律应采用适应性检验法。 独立性检验的形式有多种,常利用列联表进行检验。 根据对处理效应的不同假定,方差分析中的数学模型可以分为固定模型、随机模型和混合模型混合模型3类。 在进行两因素或多因素试验时,通常应该设置重复,以正确估计试验误差,研究因素间的交互作用。 在方差分析中,对缺失数据进行弥补时,应使补上来数据后,误差平方和最小。方差分析必须满足正态性、可加性、方差同质性3个基本假定。 如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有平方根转换、对数转换、正反弦转换等。 相关系数的取值范围是[-1,1]O
2.2试计算下列两个玉米品种10个果穗长度(cm)的标准差和变异系数,并解释所得结果。24号:19,21,20,20,18,19,22,21,21,19; 金皇后:16,21,24,15,26,18,20,19,22,19。 【答案】1=20,s1=1.247,CV1=6.235%;2=20,s2=3.400,CV2=17.0%。 2.3某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取50绳测其毛重(kg),结果分别如下: 单养50绳重量数据:45,45,33,53,36,45,42,43,29,25,47,50,43,49,36,30,39,44,35,38,46,51,42,38,51,45,41,51,50,47,44,43,46,55,42,27,42,35,46,53,32,41,4,50,51,46,41,34,44,46; 第三章概率与概率分布 3.3已知u服从标准正态分布N(0,1),试查表计算下列各小题的概率值: (1)P(0.3<u≤1.8);(2)P(-1<u≤1);(3)P(-2<u≤2);(4)P(-1.96<u≤1.96; (5)P(-2.58<u≤2.58)。 【答案】(1)0.34617;(2)0.6826;(3)0.9545;(4)0.95;(5)0.9901。 3.4设x服从正态分布N(4,16),试通过标准化变换后查表计算下列各题的概率值: (1)P(-3<x≤4);(2)P(x<2.44);(3)P(x>-1.5);(4)P(x≥-1)。 【答案】(1)0.4599;(2)0.3483;(3)0.9162;(4)0.8944。 3.5水稻糯和非糯为一对等位基因控制,糯稻纯合体为ww,非糯纯合体为WW,两个纯合亲本杂交后,其F1为非糯杂合体Ww。 (1)现以F1回交于糯稻亲本,在后代200株中试问预期有多少株为糯稻,多少株为非糯稻?试列出糯稻和非糯稻的概率; (2)当F1代自交,F2代性状分离,其中3/4为非糯,1/4为糯稻。假定F2代播种了2000株,试问糯稻株有多少?非糯株有多少? 课后答案网https://www.doczj.com/doc/cf9353034.html,1=42.7,R=30,s1=7.078,CV1=16.58%;2=52.1,R=30,s2=6.335,CV2=12.16%。 第四章统计推断 课后答案网https://www.doczj.com/doc/cf9353034.html,=0=21g,4.5接受HA:≠0;95%置信区间:(19.7648,20.2352)。 4.6核桃树枝条的常规含氮量为2.40%,现对一桃树新品种枝条的含氮量进行了10次测定,其结果为:2.38%、2.38%、2.41%、2.50%、2.47%、2.41%、2.38%、2.26%、2.32%、2.41%,试问该测定结果与常规枝条含氮量有无差别。 【答案】t=-0.371,接受H0:=0=2.40%。 4.7检查三化螟各世代每卵块的卵数,检查第一代128个卵块,其平均数为47.3粒,标准差为2 5.4粒;检查第二代69个卵块,其平均数为74.9粒,标准差为4 6.8粒。试检验两代每卵块的卵数有无显著差异。 【答案】u=-4.551,否定H0:1=2,接受HA:1≠2。 4.8假说:“北方动物比南方动物具有较短的附肢。”为验证这一假说,调查了如下鸟翅长(mm)资料:北方的:120,113,125,118,116,114,119;南方的:116,117,121,114,116,118,123,120。试检验这一假说。 【答案】t=-0.147,接受H0:1=2。 4.9用中草药青木香治疗高血压,记录了13个病例,所测定的舒张压(mmHg)数据如下:序
《生物统计学》基本知识题 一、填空题 第一章 1.填写下列符号的统计意义:①SS ②S x ③ S2 ④ SP xy。 2.t检验、u检验主要用于____ 组数据的差异显著性检验; F 检验主要用于____ _ 组数据的差异显著性检验。 3.试验误差指由因素引起的误差,它不可,但可 以和。 4.参数是由____计算得到的,统计量是由____计算得到的。 5.由样本数据计算得到的特征数叫,由总体数据计算 得到的特征数叫。 9.一般将原因产生的误差叫试验误差,它避免, 但可以和。 第二章 4.变异系数可用于当两个样本的、不同时 变异程度的比较。变异系数的计算公式为。 5.变异系数可用于当两个样本的、不同时 的比较。变异系数的计算公式为。 7.连续性随机变量等组距式次数分布表的编制方法步骤为: ①_____、②____、③____、④____、⑤___。 8.计算标准差的公式是S=。 9.变异系数的计算公式是CV=。 10. 标准差的作用是①、②、③。 12.算术平均数的两个重要性质是①②。 13.样本平均数的标准差叫。它与总体标准差的关系 是。 第三章 1.若随机变量x~N(μ,σ2),欲将其转换为u~N(0,1),则 标准化公式为u=。 第四 1.统计量与参数间的误差叫,其大小受①② ③的影响,其大小可以用来描述,计算公式 为。 2.抽样误差是指之差。抽样误差的大小可用来表 示。影响抽样误差的因素有、和。 6.在两个均数的显著性检验中,若检验结果是差异显著,则说 明。 7.在显著性检验时,当H0是正确的,检验结果却否定了H0,这 时犯的错误是:型错误。 8. 显著性检验时,犯Ⅰ型错误的概率等于。 9.显著性检验分为_______ 检验和______检验。 10.显著性检验的方法步骤为:、、。 12.若服从N(, 2)分布,则值服从分布, 值服从分布。 第五章 1.方差分析是以为检验对象的。在实际分析时常常以 作为它的估计值。 2.多重比较的方法有①和②两类;①一般适用于 组均数的检验,②适用于组均数间的检验。 3.多重比较的LSD法适用于组均数比较;LSR法适用于 组均数间的比较。 4.多重比较的方法有和两类。前者一般用于 组均数检验,后者又包含和法,适用于组 均数的比较。第六章 1.χ2 检验中,连续性矫正是指用性分布检验性数据所产生的差异,当或时,必须进行矫正。 2.在χ2检验时,当和时必须进行连续性矫正。3.χ2检验中,当或时,必须进行连续性矫正,矫正方法有_____ 和_____ 两种。 4.χ2检验的计算公式为χ2=,当、时,必须矫正,其矫正方法为、。 第七章 1.在直线相关回归分析中,相关系数显著,说明两变量间直线相关关系。 2.相关系数的大小,说明相关的紧密程度,其说明相关的性质。 相关系数r是用来描述两变量之间相关的和的指标,r 的正负号表示相关的,r的绝对值大小说明相关的。 3.变量间存在的关系,统计上称为相关关系。 4.回归分析中表示,byx表示,。 5.在回归方程中,表示依变量的,b表示,a表示。 6.已知r=-0.589*,则变量间存在的直线相关关系。 7.统计分析中,用统计量来描述两个变量间的直线相关关系,其取值范围为,其绝对值的大小说明相关的,其正负符号说明相关的。 第九章 1.试验设计的基本原则是、和。 二、单选题 1.比较胸围与体重资料的变异程度,以最好。 a.标准差b.均方c.全距d.变异系数 2.比较身高与体重两变量间的变异程度,用统计量较合适。 ①CV ②S ③R ④S2 4.若原始数据同加(或同减)一个常数,则。 a不变,S改变b.S不变,改变 c.两者均改变d.两者均不改变 5.比较身高和体重资料的变异程度,以指标最好。 a.CV b.Sc.Rd.S2 6.离均差平方和的代表符号是。 a.∑(x- )2 b.SP c.SS 7 .样本离均差平方和的代表符号是。 ①S2 ②③ ④SS 8. 愈小,表示用该样本平均数估计总体均数的可靠性愈大。 ①变异系数②标准差 ③全距④标准误 1.二项分布、Poisson分布、正态分布各有几个参数:() A、 (1,1,1 ) B、 (2,2,2) C、 (2,1, 2) D、 (2,2,1 ) 2.第一类错误是下列哪一种概率:()
生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现 代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变 量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). 12 2--∑∑n n x x )(