双样本假设检验与区间估计练习题
- 格式:doc
- 大小:184.00 KB
- 文档页数:8
医用统计学-总体均数的估计与假设检验练习题二、是非题1.即使变量偏离正态分布,只要样本含量相当大,样本均数也近似正态分布。
()3.两次t检验都是对两样本均数的差别做统计检验,一次P<0.01,另一次0.01<P<0.05,就表明前者两样本均数差别大,后者两样本均数差别小。
()4.对两样本均数的差别做统计检验,两组数据具有方差齐性,但与正态分布相比略有偏离,样本含量都较大,因此仍可做t检验。
()三、最佳选择题2、两样本均数比较的t检验,差别有统计学意义时,P越小,说明()。
A、两样本均数差别越大B、两总体均数差别越大C、越有理由认为两总体均数不同D、越有理由认为两样本均数不同E、越有理由认为两总体均数不同3、甲乙两人分别随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得X1和S12,X2和S22,则理论上()。
A、X1=X 2B、S12= S22C、作两样本均数的t检验,必然得出无差别的结论D、作两方差齐性的F检验,必然方差齐E、由甲、乙两样本均数之差求出的总体均数的95%可信区间,很可能包括04、在参数未知的正态总体中随机抽样,∣X-μ∣≥()的概率为5%。
A、1.96σB、1.96C、2.58D、t0.05,v SE、t0.05,vsx5、某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L,标准差为4g/L,则其95%的参考值范围()。
A、74±4×4B、74±1.96×4C、74±2.58×4D、74±2.58×4÷10E、74±1.96×4÷106、关于以0为中心的t分布,错误的是()。
A、t分布是一簇曲线B、t分布是单峰分布C、当ν∝时,t uD、t分布以0为中心,左右对称E、相同ν时,∣t∣越大,P越大7、在两样本均数比较的t检验中,无效假设是()A、两样本均数不等B、两样本均数相等C、两总体均数不等D、两总体均数相等E、两样本均数等于总体均数8、两样本均数比较时,分别取以下检验水准,以()所取第二类错误最小。
1.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件,测得平均重量为820克,标准差为60克,试以显著性水平α=0.01与α=0.05,分别检验这批产品的平均重量是否是800克。
解:假设检验为800:,800:0100≠=μμH H (产品重量应该使用双侧 检验)。
采用t 分布的检验统计量nx t /0σμ-=。
查出α=0.05和0.01两个水平下的临界值(df=n-1=15)为2.131和2.947。
667.116/60800820=-=t 。
因为t <2.131<2.947,所以在两个水平下都接受原假设。
2.某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10 150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)?解:假设检验为10000:,10000:0100>=μμH H (使用寿命有无显著增加,应该使用右侧检验)。
n=100可近似采用正态分布的检验统计量nx z /0σμ-=。
查出α=0.01水平下的反查正态概率表得到临界值2.32到2.34之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。
计算统计量值3100/5001000010150=-=z 。
因为z=3>2.34(>2.32),所以拒绝原假设,无故障时间有显著增加。
3.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。
问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600?解: 01:1600, :1600,H H μμ=≠标准差σ已知,拒绝域为2Z z α>,取0.05,α=26,n =0.0250.9752 1.96z z z α===,由检验统计量1.25 1.96Z ===<,接受0:1600H μ=, 即,以95%的把握认为这批产品的指标的期望值μ为1600.4.某电器零件的平均电阻一直保持在2.64Ω,改变加工工艺后,测得100个零件的平均电阻为2.62Ω,如改变工艺前后电阻的标准差保持在O.06Ω,问新工艺对此零件的电阻有无显著影响(α=0.05)?解: 01: 2.64, : 2.64,H H μμ=≠已知标准差σ=0.16,拒绝域为2Z z α>,取0.02520.05, 1.96z z αα===,100,n =由检验统计量3.33 1.96Z ===>,接受1: 2.64H μ≠, 即, 以95%的把握认为新工艺对此零件的电阻有显著影响.5.某食品厂用自动装罐机装罐头食品,每罐标准重量为500克,每隔一定时间需要检查机器工作情况。
假设检验练习题在统计学中,假设检验是一种常用的数据分析方法,用于通过样本数据对总体参数的假设进行验证。
通过进行假设检验,我们可以确定样本数据是否足够支持对总体参数的某种特定假设。
一、背景介绍假设检验的基本思想是:假设总体参数服从某种特定的概率分布,然后利用样本数据对这一假设进行检验。
在进行假设检验时,我们通常会提出原假设(H0)和备择假设(H1),其中原假设是我们要进行检验的假设,备择假设则是对原假设的否定或补充。
二、假设检验的步骤1. 提出假设:根据问题的需求和背景,明确原假设和备择假设。
2. 选择显著性水平:显著性水平α代表我们对假设检验结果的接受程度,通常选择0.05或0.01。
3. 计算检验统计量:根据样本数据和所选的假设检验方法,计算出相应的检验统计量。
4. 确定拒绝域:根据显著性水平和假设检验的方法,确定拒绝域的临界值。
5. 判断结论:将计算得到的检验统计量与拒绝域进行比较,根据比较结果作出结论。
三、假设检验的类型1. 单样本检验:当我们只有一个样本数据,想要对总体参数是否符合某个特定值进行判断时,可以使用单样本检验。
2. 独立样本检验:当我们有两个独立的样本数据,并且希望比较两个总体参数是否有差异时,可以使用独立样本检验。
3. 配对样本检验:当我们有两组相关的样本数据,并且希望比较两个总体参数的差异时,可以使用配对样本检验。
四、常见的假设检验方法1. t检验:用于对总体均值进行假设检验,可以进行单样本t检验、独立样本t检验和配对样本t检验。
2. 方差分析(ANOVA):用于比较多个样本均值是否有差异,适用于有两个以上样本的情况。
3. 卡方检验:用于对分类变量的比例进行假设检验,适用于两个或更多分类变量的情况。
4. 相关分析:用于检验两个变量之间是否存在线性相关性。
五、实例分析为了更好地理解假设检验的应用,我们举一个实际例子。
假设一个制药公司研发了一种新药,声称该药物的疗效显著优于市场上已有的药物。
第5章 假设检验思考与练习参考答案一、最佳选择题1. 样本均数比较作t 检验时,分别取以下检验水准,以( E )所取Ⅱ类错误最小。
A.0.01α=B. 0.05α=C. 0.10α=D. 0.20α=E. 0.30α=2. 在单组样本均数与一个已知的总体均数比较的假设检验中,结果t =3.24,t 0.05,v =2.086, t 0.01,v =2.845。
正确的结论是( E )。
A. 此样本均数与该已知总体均数不同B. 此样本均数与该已知总体均数差异很大C. 此样本均数所对应的总体均数与该已知总体均数差异很大D. 此样本均数所对应的总体均数与该已知总体均数相同E. 此样本均数所对应的总体均数与该已知总体均数不同3. 假设检验的步骤是( A )。
A. 建立假设,选择和计算统计量,确定P 值和判断结果B. 建立无效假设,建立备择假设,确定检验水准C. 确定单侧检验或双侧检验,选择t 检验或Z 检验,估计Ⅰ类错误和Ⅱ类错误D. 计算统计量,确定P 值,作出推断结论E. 以上都不对4. 作单组样本均数与一个已知的总体均数比较的t 检验时,正确的理解是( C )。
A. 统计量t 越大,说明两总体均数差别越大B. 统计量t 越大,说明两总体均数差别越小C. 统计量t 越大,越有理由认为两总体均数不相等D. P 值就是αE. P 值不是α,且总是比α小5. 下列( E )不是检验功效的影响因素的是:A. 总体标准差σB. 容许误差δC. 样本含量nD. Ⅰ类错误αE. Ⅱ类错误β二、思考题1.试述假设检验中α与P 的联系与区别。
答:α值是决策者事先确定的一个小的概率值。
P 值是在0H 成立的条件下,出现当前检验统计量以及更极端状况的概率。
P ≤α时,拒绝0H 假设。
2. 试述假设检验与置信区间的联系与区别。
答:区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法。
置信区间用于说明量的大小,即推断总体参数的置信范围;而假设检验用于推断质的不同,即判断两总体参数是否不等。
解决概率与统计的假设检验的推断练习题假设检验是概率与统计学中一种常见的推断方法,用于判断样本数据是否提供了对总体参数的有力证据。
在解决概率与统计的假设检验问题时,我们需要进行一系列推断性练习题,通过实际操作来加深对假设检验的理解。
以下是一些假设检验的推断练习题,通过解答这些题目,可以更好地掌握假设检验的思考方式和应用技巧。
1. 某汽车制造公司声称其生产的轿车平均寿命超过5年。
现随机抽取30辆轿车,得到样本的平均寿命为5.2年,标准差为0.8年。
可以使用一个总体均值的单样本t检验来判断该声称是否正确。
请计算t统计量,给出相应的假设检验过程,并得出结论。
2. 一项研究声称,男性和女性在记忆力方面的得分没有显著差异。
为了验证这一假设,我们进行了一项实验,随机抽取了50名男性和50名女性,并给予他们记忆力测试。
男性组的平均得分为65分,标准差为10分;女性组的平均得分为68分,标准差为9分。
请进行一个总体均值的双样本t检验,判断男性和女性的记忆力是否存在显著差异。
3. 一家电商公司声称其网站的点击率达到了10%以上。
为了验证这一声称,我们随机抽取了1000次点击记录,其中有110次点击。
请使用一个二项分布的单样本比例检验,判断该声称是否正确。
4. 一项调查研究声称,在某大城市中,80%的居民认为旅游业是当地经济的重要支柱。
为了验证这一声称,我们进行了一项抽样调查。
在500份调查问卷中,有420份回答认同该观点。
请使用一个比例的单样本z检验,判断该声称是否正确。
5. 某项研究声称,接受特定训练的员工较未接受训练的员工在工作效率方面有显著差异。
为了验证该声称,我们从公司员工中随机抽取了两组员工,一组接受了训练,另一组未接受训练。
接受训练组的平均工作效率为80%,标准差为5%;未接受训练组的平均工作效率为75%,标准差为4%。
请进行一个总体均值的双样本z检验,判断是否存在显著差异。
通过以上的推断练习题,我们可以加深对假设检验的理解和应用。
第十章双样本假设检验及区间估计第一节两总体大样本假设检验两总体大样本均值差的检验·两总体大样本成数差的检验第二节两总体小样本假设检验两总体小样本均值差的检验·两总体小样本方差比的检验第三节配对样本的假设检验单一试验组的假设检验·一试验组与一控制组的假设检验·对实验设计与相关检验的评论第四节双样本区间估计σ2和σ22已知,对双样本均数差的区间估计·σ12和σ22未知,对对双样本均1值差的区间估计·大样本成数差的区间估计·配对样本均值差的区间信计一、填空1.所谓独立样本,是指双样本是在两个总体中相互()地抽取的。
2.如果从N(μ1,σ12)和N(μ2,σ22)两个总体中分别抽取容量为n1和n2的独立随机样本,那么两个样本的均值差(1X―2X)的抽样分布就是N()。
3.两个成数的差可以被看作两个()差的特例来处理。
4.配对样本,是两个样本的单位两两匹配成对,它实际上只能算作()样本,也称关联样本。
5.配对样本均值差的区间估计实质上是()的单样本区间估计6.当n1和n2逐渐变大时,(1X―2X)的抽样分布将接近()分布。
7.使用配对样本相当于减小了( )的样本容量。
8. 在配对过程中,最好用( )的方式决定“对”中的哪一个归入实验组,哪一个归入控制组。
9. 单一实验组实验的逻辑,是把实验对象前测后测之间的变化全部归因于( )。
10. 方差比检验,无论是单侧检验还是双侧检验,F 的临界值都只在( )侧。
二、单项选择1.抽自两个独立正态总体样本均值差(1X ―2X )的抽样分布是( )。
A N (μ1―μ2,121n σ―222n σ)B N (μ1―μ2,121n σ+222n σ)C N (μ1+μ2,121n σ―222n σ) D N (μ1+μ2,121n σ+222n σ)2.两个大样本成数之差的分布是( )。
A N (∧1p -∧2p ,111n q p ―222n q p ) B N (∧1p -∧2p ,111n q p +222n qp )C N (∧1p +∧2p ,111n q p ―222n q p ) D N (∧1p +∧2p ,111n q p +222n qp )3.为了检验两个总体的方差是否相等,所使用的变量抽样分布是( )。
A F 分布B Z 分布C t 分布D 2χ分布 4.配对小样本的均值d 的抽样分布是( )。
A Z 分布B 自由度为n 的t 分布C 自由度为(n —1)的t 分布D 自由度为(n —1)的2χ分布5.若零假设中两总体成数的关系为p 1=p 2,这时两总体可看作成数p 相同的总体,它们的点估计值是( )。
A p 1 + p 2B p 1p 2C p 1 -p 2 D212211n n p n p n ++∧∧6.在σ12和σ22未知,但可假定它们相等的情况下,σ的无偏估计量∧S 是( )。
A22122211-++n n nS S n B22122211-++n n nS S n •2121n n n n +C 2121n n n n +σD 222121n n σσ+三、多项选择1.两个成数之差的假设检验所使用的测量尺度包括( )。
A 定类尺度B 定序尺度C 定距尺度D 定比尺度2.在单一实验组与一控制组的实验设计之中,对前测后测之间的变化,消除额外变量影响的基本做法包括( )。
A 前测B 试验刺激C 中测D 计算试验效应E 后侧3.下列关于配对样本假设检验的陈述正确的是( )。
A 两个样本在其他方面相同,经检验后测不同于前测的变化,是由于实验刺激所造成。
B 对于 “前—后”对比型配对样本的假设检验,是用均值差检验的。
C 单一实验组实验的逻辑,是把实验对象前测后测之间的变化全部归因于实验刺激D 配对样本的一实验组与一控制组之假设检验,要设法把实验变量的作用和额外变量的作用区分开来E 否定零假设,即说明该实验刺激有效 4.下列关于配对的陈述正确的是( )。
A 配对的目的在于减小无关变量引起的差异B 使用配对样本相当于减小了一半样本容量C 与损失的样本容量比较,S d 减小得更多D 在配对过程中,最好用掷硬币的方式决定“对”中的哪一个归入实验组,哪一个归入控制组E 对许多未知的变量,依赖于匹配过程“对”的内随机化,期望未被控制的变量的作用被中和。
5. 对于大样本,σ12和σ22未知,对均数和的估计区间是( )。
A 上限 (1X +2X )―Z α/2222121n n σσ+B 下限(1X +2X ) + Z α/2222121n n σσ+C 上限 (1X +2X )―t α/2(n 1+ n 2 ―2))(21X X -σ D 下限(1X +2X ) + t α/2(n 1+ n 2 ―2))(21X X -σE [(1X ―2X )―t α/2(n 1+ n 2 ―2))(21X X-σ,(1X ―2X ) + t α/2(n 1+ n 2 ―2))(21X X-σ]6.进行方差比检验时,()。
A 计算F值时,21∧S、22∧S大者在分母上B 计算F值时,21∧S、22∧S小者在分母上C 双侧检验,F的临界值在右侧D 单侧检验,F的临界值在左侧E 单侧检验,F的临界值在右侧四、名词解释1.独立双样本2.配对样本3.单一试验组的试验4.一试验组与一控制组的试验五、判断题1.均值差的抽样误差比各个均值的抽样误差大,是因为它多了一个误差来源。
()2.对于小样本,σ12和σ22未知,两样本均值差的抽样服从Z分布。
()3.匹配的目的就在于尽可能对实验变量以外的其他独立变量进行控制。
()4.σ12和σ22未知时,可以利用样本的信息检验他们是否可能相等。
()5.把22∧S和21∧S中的较大者放在分子上,那么无论是单侧检验还是双侧检验,F的临界值都只在右侧,这样就可以统一使用右侧检验的方法得出检验的结论。
()6. 两个样本在其他方面相同,经检验后测不同于前测的变化,是由于实验刺激所造成。
()7. 配对样本的一实验组与一控制组之假设检验,要设法把实验变量的作用和额外变量的作用区分开来。
()8. 两个成数的差的检验适用于各种量度层次的数据。
()9. 配对样本均值差的区间估计是两个的单样本区间估计。
()10.配对样本是由两个样本中的个体按序组合而成的。
()六、计算题1.独立随机样本取自均值未知,标准差已知的两个正态总体。
如果第一个总体的标准差为0.73,抽出的样本容量为25,样本均值为6.9;第二个总体的标准差为0.89,抽出的样本容量为20,样本均值为6.7。
试问,两个总体的均值是否显著相等(α=0.05)?2.对两所学校学生组织的社会活动获奖情况进行调查,发现甲校共组织60次,有18次获奖;乙校共组织40次,有14次获奖。
据此,能否认为乙校获奖次数的比例高于甲校(α=0.05)?3.为研究睡眠对记忆的影响,在两种条件下对人群进行了试验。
(1)在早7点放电影,被测者晚上睡眠正常,第二天晚上就电影的50项内容进行测试;(2)在早7点放电影,被测者白天情况正常,同一天晚7点就电影的50项内容进行测试。
样本是独立的,每组人数15人,测试结果为:1X =37.2个正确, S 1=3.33,n 1=15;2X =35.6个正确, S 2=3.24,n 2=15。
假定两种条件下总体均服从正态分布,且方差相等,是否认为睡眠对记忆有显著影响(α=0.05)?4.某公司调查了甲居民区的网民(21户)和乙居民区的网民(16户)的平均上网小时数。
对这两个独立样本得到的数据是:1X =16.5小时, S 1=3.7小时;2X =19.5小时, S 2=4.5小时。
要求(α=0.10):(1)两个居民区网民每天上网时间的方差是否相等?(2)是否认为甲居民区的网民(21户)比乙居民区的网民(16户)的平均上网小时数少。
5.某项研究对10名高血压患者进行心理治疗。
下表中给出了每人在治疗前后的血压6.一个研究小组想知道城市家庭和农村家庭每月购物次数是否不同。
假定两个总体的购物次数服从正态分布,调查员选取了城市家庭(1X =8.6次/月, σ1=2.3次/月,n 1=50)和农村家庭(2X =7.4次/月,σ2=2.8次/月,n 2=50)的独立样本。
试求城市家庭每月购物次数和农村家庭每月购物次数之差的置信区间(α=0.05)。
8.在第1题中,试求两个总体均值之差的范围(α=0.05)。
9.在第3题中,试求μ1―μ2的95%的置信区间。
10.在第4题中,试求μ1―μ2的95%的置信区间。
11.在第5题中,试求μd的95%的置信区间。
12.在第6题中,试以95%的置信水平检验城市家庭是否显著地多于农村家庭每月购物次数?13.在第7题中,试求μd的95%的置信区间。
14.为了了解居民对银行加息的看法。
对200名城市居民的抽样调查,有90人赞成;对200名农村居民年的抽样调查,有126人反对。
问城市居民和农村居民对加息赞成的比例是否存在显著差异?七、问答题1、什么是配对样本?配对的目的是什么?2、简述配对样本的一试验组与一控制组的实验设计中消除额外变量影响的基本方法。
参考答案一、填空1.独立 2.(μ1―μ2,121n σ+222n σ) 3.均值 4.一个 5.μd 6.正态 7.一半8.掷硬币9.实验刺激10.右二、单项选择1.B 2.B 3.A 4.C 5.D 6.A三、多项选择1. ABCD 2.ABDE 3.ACDE 4.ACBDE 5. CD 6.ACE四、名词解释1.独立双样本:所谓独立样本,指双样本是在两个总体中相互独立地抽取的。
2.配对样本:所谓配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产生的。
3.单一试验组的试验:单一实验组实验是对同一对象在某种措施实行前后进行观察比较的一种简单实验,它只有实验组而没有控制组。
或者说,同一个组在实施实验刺激之前是实验中的“控制组”,在实施实验刺激之后就成了“实验组”。
4.一试验组与一控制组的试验:配对样本的一实验组与一控制组之假设检验,要设法把实验变量的作用和额外变量的作用区分开来,然后就像对待单一实验组实验一样,把问题转化为零假设μd =0的单样本检验来处理。
五、判断题1.( √ )2.( × )3.( √ ) 4.( √ )5.( √ )6.( √ )7.( √ )8.( √ )9.( × )10.( × )六、计算题1.Z=0.81<1.96, 不能否定H 0:μ1―μ2=0 2.Z= —0.5253<1.96, 不能否定H 0:μ1―μ2=03.)(21X X -∧σ=0.6618,t=2.4176>2.048,拒绝H 0:μ1―μ2=0 ,认为平均的睡眠组的得分较高。