第四章统计推断
- 格式:ppt
- 大小:464.50 KB
- 文档页数:15
.. 生物统计学习题集参考答案第一章概论一、填空1 变量按其性质可以分为 连续 变量和 非连续 变量。
2 样本统计数是总体 参数 的估计量。
3 生物统计学是研究生命过程中以样本来推断 总体 的一门学科。
4 生物统计学的基本内容包括_试验设置、统计分析_两大部分。
5 统计学的发展过程经历了 古典记录统计学、 近代描述统计学现代推断统计学 3个阶段。
6 生物学研究中,一般将样本容量 n大于等于 30称为大样本。
7 试验误差可以分为__随机误差 、系统误差 两类。
二、判断(-)1 对于有限总体不必用统计推断方法。
(-)2 资料的精确性高,其准确性也一定高。
(+) 3 在试验设计中,随机误差只能减少,而不可能完全消除。
(+)4 统计学上的试验误差,通常指随机误差。
三、名词解释样本:从总体中抽出的若干个体所构成的集合称为样本。
总体:具有相同的个体所构成的集合称为总体。
连续变量:是指在变量范围内可抽出某一范围的所有值。
非连续变量:也称离散型变量,表示变量数列中仅能取得固定数值并且通常是整数。
准确性:也称准确度指在调查或试验中某一试验指标或性状的观测值与真实值接近的程度。
精确性:也称精确度指在调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。
第二章 试验资料的整理与特征数的计算一、填空1 1 资料按生物的性状特征可分为资料按生物的性状特征可分为资料按生物的性状特征可分为_________数量性状资料数量性状资料数量性状资料__变量和变量和______变量性变量性状资料状资料__变量。
2 2 直方图适合于表示直方图适合于表示直方图适合于表示______计量计量计量 、、 连续变量连续变量__资料的次数分布。
3 3 变量的分布具有两个明显基本特征,即变量的分布具有两个明显基本特征,即变量的分布具有两个明显基本特征,即__集中性集中性__和____离散性离散性离散性__。
4 4 反映变量集中性的特征数是反映变量集中性的特征数是反映变量集中性的特征数是______平均数平均数平均数______,反映变量离散性的特征,反映变量离散性的特征数是数是______变异数(标准差)变异数(标准差)变异数(标准差)__。
第一章概论解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。
第二章试验资料的整理与特征数的计算习题2.1 某地100 例30 ~40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.124.56 4.375.396.30 5.217.22 5.54 3.93 5.21 6.515.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.694.38 4.89 6.255.32 4.50 4.63 3.61 4.44 4.43 4.254.035.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.975.16 5.10 5.85 4.79 5.34 4.24 4.32 4.776.36 6.384.885.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.094.52 4.38 4.31 4.585.726.55 4.76 4.61 4.17 4.034.47 3.40 3.91 2.70 4.60 4.095.96 5.48 4.40 4.555.38 3.89 4.60 4.47 3.64 4.34 5.186.14 3.24 4.90计算平均数、标准差和变异系数。
【答案】=4.7398, s=0.866, CV =18.27 %2.2 试计算下列两个玉米品种10 个果穗长度(cm) 的标准差和变异系数,并解释所得结果。
24 号:19 ,21 ,20 ,20 ,18 ,19 ,22 ,21 ,21 ,19 ;金皇后:16 ,21 ,24 ,15 ,26 ,18 ,20 ,19 ,22 ,19 。
【答案】 1 =20, s 1 =1.247, CV 1 =6.235% ; 2 =20, s 2 =3.400, CV 2 =17.0% 。
统计推断第二版课后习题答案(下)第一章估计与检验的基本概念习题1a.样本均值的估计是样本观测值的算术平均数。
b.估计量的偏差是指样本估计值与总体参数值之间的差异。
c.偏差的绝对估计误差是指估计量与总体参数的差异的绝对值。
习题2a.确定估计量的抽样分布的方法有:–数理统计方法–模拟方法b.方差是指估计量在多次抽样中估计误差的离散程度。
c.中位数是指有50%的估计值小于该值,50%的估计值大于该值。
习题3a.均方根误差衡量了估计方法的总体误差。
b.样本均值的均方误差是样本均值与总体均值之间的差异的平方。
c.均方误差是样本估计量的方差和偏差之和。
习题4a.一个无偏估计的特点是其期望值等于被估计参数的真实值。
b.偏差是指估计量从真实参数值偏离的程度。
c.便宜的估计方法在不同样本下估计值的平均值与总体参数的差异接近于零。
习题5a.置信区间是指总体参数一个区间估计的结果。
b.置信水平是指置信区间的覆盖总体参数的概率。
c.通过增加置信水平,置信区间的宽度将增加。
第二章单样本推断习题1a.在单样本问题中,当总体的分布未知且样本容量较小时,通常使用t分布。
b.当总体的分布未知且样本容量较大时,通常使用标准正态分布。
c.当总体的分布已知时,可以根据总体分布选择相应的抽样分布。
习题2a.在单样本问题中,使用z统计量时,需要知道总体的标准差。
b.当总体的标准差未知且样本容量较小时,通常使用t统计量。
c.t统计量的分布在自由度较大时趋向于标准正态分布。
习题3a.当总体的分布为正态分布时,使用样本均值的标准差作为总体标准差的估计。
b.对于非正态分布的总体,使用样本的中位数可以作为总体位置参数的估计。
c.样本观测值的众数可以作为总体分布的估计。
习题4a.在单样本问题中,使用z统计量时可以构造置信区间。
b.置信水平是指在多次抽样中,置信区间覆盖总体参数的概率。
c.置信区间的宽度与样本容量无关。
a.当总体的分布未知且样本容量较小时,假设检验通常使用t检验。
第四章 推断统计概述第一部分 概率论基本知识← 一、概率的定义;二、概率的性质;三、概率的加法定理和乘法定理← 四、概率分布类型四、概率分布类型← 概率分布(probability distribution )是指对随机变量取不同值时的概率的描述,一般用概率分布函数进行描述。
← 依不同的标准,对概率分布可作不同的分类。
1、离散型分布与连续型分布← 依随机变量的类型,可将概率分布分为离散型概率分布与连续型概率分布。
← 教育统计学中最常用的离散型分布是二项分布,最常用的连续型分布是正态分布。
2、经验分布与理论分布← 依分布函数的来源,可将概率分布分为经验分布与理论分布。
← 经验分布(empirical distribution )是指根据观察或实验所获得的数据而编制的次数分布或相对频率分布。
← 理论分布(theoretical distribution )是按某种数学模型计算出的概率分布。
3、基本随机变量分布与抽样分布← 依所描述的数据的样本特性,可将概率分布分为基本随机变量分布与抽样分布(sampling distribution )。
← 基本随机变量分布是随机变量各种不同取值情况的概率分布,← 抽样分布是从同一总体内抽取的不同样本的统计量的概率分布。
第二部分 几种常见的概率分布← 一、二项分布← 二项分布(binomial distribution )是一种具有广泛用途的离散型随机变量的概率分布,它是由贝努里创始的,因此又称为贝努里分布。
← 2.二项分布函数← 二项分布是一种离散型随机变量的概率分布。
← 用 n 次方的二项展开式来表达在 n 次二项试验中成功事件出现的不同次数(X =0,1…,n )的概率分布,叫做二项分布函数。
← 二项展开式的通式(即二项分布函数):← ←← ← ←← 成功概率 p ;样本容量 n← 在成功概率为p 的总体中随机抽样,抽取样本容量为n 的样本中,有X 次为成()011111100q p C q p C q p C q p C q p n n n n n n n n n n n ++++=+---Λ()Xn X X n X q p C P -⋅⋅=()X n X q p X n X n -⋅-=!!!功的概率: ←(X =0,1…,n ) ←称X 服从参数为n ,p 的二项分布,记为: ←X ~B(n ,p ) 其中,0<p<1 ←二项分布的性质 ←二项分布有如下性质: ←①当p=q 时,图形是对称的。
第四章统计推断第四章统计推断⼀、单项选择题1.⽆偏估计是指()。
A、本统计量的值恰好等于待估的总体参数B、所有可能样本估计值的数学期望等于待估总体参数C、样本估计值围绕待估参数使其误差最⼩D、样本量扩⼤到和总体单元相等时与总体参数⼀致2.当样本容量⼀定时,置信区间的宽度()。
A、随着置信⽔平的增⼤⽽减⼩B、随着置信⽔平的增⼤⽽增⼤C、与置信⽔平的⼤⼩⽆关D、与置信⽔平的平⽅成反⽐3.95%的置信⽔平是指()。
A、总体参数落在置信区间内的概率为95%B、总体参数落在置信区间内的概率为5%C、总体参数落在⼀个特定的样本所构造的区间内的概率为5%D、在⽤同样⽅法构造的总体参数的多个区间中,包含总体参数的⽐率为5%4.从⼀个正态总体中随机抽取⼀个容量为n的样本,其均值和标准差分别为50和8。
当n=25 时,构造总体均值µ的95%置信区间为()。
A、50±3.14B、50±3.3C、50±0.63D、50±3.295、将由显著性⽔平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性⽔平的⼆分之⼀,这是()。
A.单侧检验B.双侧检验C.右单侧检验D.左单侧检验6.在假设检验问题中,原假设为H0,给定显著性⽔平为α,则正确的是()。
A、P(接受H0|H0正确)=αB、P(拒绝H0|H0正确)=αC、P(接受H0|H0不正确)=1-αD、P(拒绝H0|H0不正确)=1-α7.下列说法正确的是()。
A、原假设正确的概率为αB、如果原假设被拒绝,就可以证明备择假设是正确的C、如果原假设未被拒绝,就可以证明原假设是正确的D、如果原假设未被拒绝,也不能证明原假设是正确的8.若检验的假设为H0:µ=µ0,H1:µ≠µ0,则拒绝域为()。
A、z>zαB、zC、z>zα/2或z<-zα/2D、z>zα或z<-zα9.若假设形式为H0:µ≥µ0,H1:µ<µ0,当随机抽取⼀个样本,其均值⼤于µ0,则__________()。
第四章统计推断(statistical inference)第四章统计推断统计推断由一个样本或一糸列样本所得的结果来推断总体的特征假设检验参数估计任务分析误差产生的原因确定差异的性质排除误差干扰对总体特征做出正确判断第四章第一节第二节第三节第四节第五节假设检验的原理与方法样本平均数的假设检验样本频率的假设检验参数的区间估计与点估计方差的同质性检验第一节假设检验一概念:假设检验(hypothesis test)又称显著性检验(significance test),就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际原理,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。
小概率原理概率很小的事件在一次抽样试验中实际是几乎不可能发生的。
如果假设一些条件,并在假设的条件下能够准确地算出事件A出现的概率α 为很小,则在假设条件下的n次独立重复试验中,事件A将按预定的概率发生,而在一次试验中则几乎不可能发生。
=0.05/0.01假设检验参数检验非参数检验平均数的检验频率的检验方差的检验秩和检验符号检验游程检验秩相关检验二、假设检验的步骤治疗前μ0=126σ2 =240N ( 126,240 )治疗后n =6 x =136 μ未知那么μ=μ0? 即克矽平对治疗矽肺是否有效?例:设矽肺病患者的血红蛋白含量具平均数μ0=126(mg/L),σ 2 =240(mg/L)2的正态分布。
现用克矽平对6位矽肺病患者进行治疗,治疗后化验测得其平均血红蛋白含量x =136(mg/L)。
1 、提出假设对立无效假设/零假设/检验假设备择假设/对应假设μ0=μμ0≠μ误差效应处理效应H0H A例:克矽平治疗矽肺病是否能提高血红蛋白含量?平均数的假设检验检验治疗后的总体平均数μ是否还是治疗前的126(mg/L)?x-μ0=136-126=10(mg/L)这一差数是由于治疗造成的,还是抽样误差所致。
第四章统计推断第四章统计推断第五章统计推断一、填空题5.1.1设置样本x1、X2、,?,Xn来自n(M采用的检验数量为1.69),那么对于检验H0:M=35,z=x-35。
1.3n5。
1.2组x1,X2,?,Xn是来自总体x的样本,设e(x)=m,D(x)=S2,然后2总体均值m的无偏估计为x(样本均值);总体方差s的无偏估计为s(样本方差)5.1.3如果测试统计量的观察值落在拒绝域内,则应拒绝H0。
21n25.1.4设x=?xi为来自正态总体n(m,s)的样本均值,m未知,欲检验Ni=1h0:S=s220,测试统计为(n-1)s2s20。
2已知S12=S25 1.5两个正常群体(H0:m)平均值的假设检验,检验量为1=M2(t=X-Y),排斥域为t>ta(N1+n2-2)。
11sp+n1n25.1.6若其他条件不变,置信度越高,则置信区间的长度越长。
二、单选题(从每个子题的三个备选答案中选择一个正确答案,并在题干后的括号中填写其字母)5.2.1对总体参数进行抽样估计的首要前提是必须(b)a、提前对人口进行初步分析。
B.根据随机原则取样c.保证调查数据的准确性、及时性5.2.2如果其他条件相同,在以下测试的P值中,拒绝原始假设的最充分理由是(a)a.2%b.10%c.25%5.2.3一所学校有8000名学生,然后随机抽取100名学生。
其中20人对学生管理有意见校学生中对学校后勤管理有意见的人数的点估计值为(c)a、 20%b.20c.16005.2.4如果总体服从正态分布,但总体均值和方差未知,样本量为n,则用于构造总体方差置信区间的随机变量的分布是(c)a、 n(0,1)b.n(m,s2)c.c2(n-1)5.2.5其他条件相同时,要使抽样误差减少1/4,样本量必须增加(c)a、 1/4B。
4x c.7/95.2.6影响区间估计质量的因素不包括(b)a、置信度B.总体参数C.样本量5.2.7某企业最近几批产品的优质品率分别为88%,85%,91%,为了对下一批产品在确定必要的抽样数时,P应选择(a)a.85%b.87%c.90%5.2.8设置X~n(m,s)力矩(a)A.估22则未知参数s的(x1,x2,?,xn)是x的一个简单随机样本,),米22量为1.n(xi-x)b。