统计学习题 第七章 假设检验
- 格式:doc
- 大小:152.00 KB
- 文档页数:7
旗开得胜1第七章 假设检验与方差分析 习题答案一、名词解释用规范性的语言解释统计学中的名词。
1. 假设检验:对总体分布或参数做出某种假设,然后再依据抽取的样本信息,对假设是否正确做出统计判断,即是否拒绝这种假设。
2. 原假设:又叫零假设或无效假设,是待检验的假设,表示为 H 0,总是含有等号。
3. 备择假设:是零假设的对立,表示为 H 1,总是含有不等号。
4. 单侧检验:备择假设符号为大于或小于时的假设检验。
5. 显著性水平:原假设为真时,拒绝原假设的概率。
6. 方差分析:是检验多个总体均值是否相等的一种统计分析方法。
二、填空题根据下面提示的内容,将适宜的名词、词组或短语填入相应的空格之中。
1. u ,nx σμ0-,标准正态; ),(),(2/2/+∞--∞nz nz σσααY2. 参数检验,非参数检验3. 弃真,存伪4. 方差旗开得胜25. 卡方, F6. 方差分析7. t ,u8. nsx 0μ-,不拒绝9. 单侧,双侧10.新产品的废品率为5% ,0.01 11.相关,总变异,组间变异,组内变异12.总变差平方和=组间变差平方和+组内变差平方和 13.连续,离散 14.总体均值 15.因子,水平 16.组间,组内 17.r-1,n-r18. 正态,独立,方差齐三、单项选择从各题给出的四个备选答案中,选择一个最佳答案,填入相应的括号中。
1.B 2.B 3. B 4.A 5.C 6.B 7.C 8.A 9.D 10.A 11.D 12.C四、多项选择从各题给出的四个备选答案中,选择一个或多个正确的答案,填入相应的括号中。
1.AC 2.A 3.B 4.BD 5. AD五、判断改错对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。
1. 在任何情况下,假设检验中的两类错误都不可能同时降低。
( ×)样本量一定时2. 对于两样本的均值检验问题,若方差均未知,则方差分析和t检验均可使用,且两者检验结果一致。
第七章思考与练习参考答案1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。
2.答:相关和回归都是研究现象及变量之间相互关系的方法。
相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。
3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数,样本相关系数。
复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。
偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。
4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。
根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:tt X Y 10ˆˆˆββ+=。
总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。
两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。
第二,总体回归函数中的0β和1β是未知的参数,表现为常数;而样本回归直线中的0ˆβ和1ˆβ是随机变量,其具体数值随所抽取的样本观测值不同而变动。
第七章 假设检验一、填空1、 在大样本情况下,检验总体均值所使用的统计量是___________。
2、 在小样本情况下,当总体方差未知时,检验总体均值所使用的统计量是___________。
3、 在小样本情况下,当总体方差已知时,检验总体均值所使用的统计量是___________。
4、 检验一个正态总体的方差时所使用的分布为___________。
5、 某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要检验该说法是否正确,则原假设为___________,备择假设为___________。
6、 一项新的减肥计划声称:在计划实施的第一周内,参加者的体重平均至少可以减轻8磅。
随机抽取40位参加该项计划的样本,结果显示:样本的体重平均减少了7磅,标准差为3.2磅,则其原假设和备择假设是___________。
7、某企业每月发生事故有平均次数为5次,企业准备制定一项新的安全生产计划,希望新计划能减少事故次数。
用来检验这一计划有效性的原假设和备择假设是___________。
8、环保部门想检验餐馆一天所用的快餐盒平均是否超过600个,建立的原假设和备择假设是___________。
9、设c z 为检验统计量的计算值,检验的假设为,:00μμ≤H ,:01μμ>H 当645.1=c z 时,计算出的P 值为___________。
10、设c z 为检验统计量的计算值,检验的假设为,:00μμ≤H ,:01μμ>H 当67.2=c z 时,计算出的P 值为___________。
二、单项选择题1、在假设检验中,不拒绝原假设意味着( )。
A 、原假设肯定是正确的B 、原假设肯定是错误的C 、没有证据证明原假设是正确的D 、没有证据证明原假设是错误的2、在假设检验中,原假设和备择假设( )。
A 、都有可能成立B 、都有可能不成立C 、只有一个成立而且必有一个成立D 、原假设一定成立,备择假设不一定成立3、在假设检验中,第一类错误是指( )。
一、判断题1对假设H 0,从子样提供的信息,作出判断接受H 0,我们可以认为假设H 0客观上一定是正确的。
() 2在假设检验中,因为显著性水平α是犯第一类错误的概率,所以它越少越好。
()3、当n 充分大时,T 检验的临界值也可以查正态分布得到。
( ) 二、填空题1、假设检验的基本原理是2、假设检验中,显著性水平α的意义是3、假设检验中第一类错误是指 ,第二类错误是指 。
4、总体X~N (μ,σ2),且σ2已知,检验假设H 0:μ=μ0,H 1:μ≠μ0应选用 检验,相应的统计量为 式中X 为 ,n 为 ,查 表找临界值 ,当 时,拒绝原假设。
5、设总体X~N (μ,σ2),μ未知,检验H 0:σ2≤σ2,H 1:σ2>σ2应选用 检验,相应的统计量为 ,当 时,拒绝原假设H 0。
三、计算题1、已知某炼铁厂铁水含碳量服从正态分布N (4.55,0.1082),现测定了9炉铁水,其平均含碳量为4.484,如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为4.55?(α=0.05) 解:H 0:μ=4.55,H 1:μ≠4.55对α=0.05,查表可得2αz =1.96若H 0为真时,则|Z |=|3/108.055.4484.4|/0-=-nX σμ|=1.83|Z|<1.96,故接受H 0 即可承认现在生产铁水的平均含碳量为4.552、已知某一试验,其温度服从正态分布N (μ,σ2),现在测量了温度的5个值为:1250,1265,1245,1260,1275,求得X =1259,S 2=11.942问是否可认为μ=1277?(α=0.05)解:由题目已知条件, 对于H 0:μ=1277 H 1:μ≠1277 对于α=0.05,查表可得2αt (4)=2.776若H0为真时,则|T|=||| 3.37==∵3.37>2.776,故拒绝H 0即不可认为μ=1277三、计算题某种导线的电阻服从正态分布N (μ,0.0052),今从新生产的一批导线中抽取9根,测其电阻,得S=0.008Ω,对于α=0.05,能否认为这批导线的电阻的标准差为0.005?解:设H 0:σ2=0.0052,H 1:σ2≠0.0052对于α=0.005,查表可得22αχ(8)=17.5若H 0为真时,则χ2=22202005.0008.0)19()1(⨯-=-σSn =20.48∵20.48>17.5,故否定H 0,即认为这批导线电阻的标准差不等于0.005。
第七章假设检验实例:一项新的减肥产品在广告中声称:服用该产品的第一周内,参加者的体重平均至少可以减轻8磅。
现随机抽取40位服用该减肥产品的样本,结果显示:样本的体重平均减少7磅,标准差为3.2磅。
假定显著性水平为0.05.问:该广告是否是属实的?消费者该不该信赖它呢?有人说大学中男生的学习成绩比女生好。
现从一个学校中随机抽取了25名男生和16名女生,对他们进行同样题目的测试,测试结果表明,男生的平均成绩为82分,标准差为10分;女生的平均成绩为78分,标准差为7分。
假定显著性水平为0.05,问:调查数据能否支持该人的结论?回答这些问题我们需要进行假设检验!一、假设检验的基本问题(一)假设检验的定义假设检验—也称显著性检验,它是先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。
(二)假设检验的基本思想假设检验的基本思想即小概率事件原理。
小概率事件原理——即小概率事件在一次试验中是几乎不可能发生的。
也就是说,如果提出的总体的某个假设是真实的,那么不利于或不可能支持这一假设的小概率事件A在一次试验中几乎是不可能发生的,要是在一次试验中事件A发生了,我们就有理由怀疑这一假设的真实性,并拒绝这一假设。
(三)假设检验的基本形式假设:1、原假设:通常将研究者想收集证据予以反对的假设,也称为零假设,用H0表示。
2、备择假设:通常将研究者想收集证据予以支持的假设,或称为研究假设,用H1表示。
根据备择假设有无特定的方向,可将假设检验的形式分为双侧检验和单侧检验。
(1)双侧检验——备择假设没有特定的方向性,并含有符号“”的假设检验;(2)单侧检验——备择假设具有特定的方向性,并含有符号“<”或“>”的假设检验; 在单侧检验中,根据研究者感兴趣的方向不同: 左侧检验:研究者感兴趣的备择假设方向为“<”的假设检验;右侧检验:研究者感兴趣的备择假设方向为“>”的假设检验。
单侧检验单侧检验左侧检验右侧检验假设检验的表达式假设原假设备择假设双侧检验00:θθ=H 01:θθ≠H 00:θθ≥H 01:θθ<H 00:θθ≤H 01:θθ>H例1:消费者协会接到消费者投诉,指控某品牌纸包装茶叶存在重量不足,有欺骗消费者之嫌。
第七章参数估计和假设检验一、填空题1.在抽样推断中,常用的总体指标有、和。
2.在抽样推断中,按随机原则从总体中抽取的部分单位叫,这部分单位的数量叫。
3.整群抽样是对总体中群内的进行的抽样组织形式。
4.若总体单位的标志值不呈正态分布,只要,全部可能样本指标也会接近于正态分布。
5.抽样估计的方法有和两种。
6.扩大误差范围,可以推断的可靠程度,缩小误差范围则会推断的可靠程度。
7.对总体的指标提出的假设可以分为和。
8.如果提出的原假设是总体参数等于某一数值,这种假设检验称为,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为。
二、单项选择题1.所谓大样本是指样本单位数在()及以上。
A.50个B.30个C.80个D.100个2.总体平均数和样本平均数的关系是()。
A.总体平均数是确定值,样本平均数是随机变量B.总体平均数是随机变量,样本平均数是确定值C.总体平均数和样本平均数都是随机变量D.总体平均数和样本平均数都是随机变量3.先对总体按某一标志分组,然后再在各组中按随机原则抽取一部分单位构成样本,这种抽样组织方式称为()。
A.简单随机抽样B.机械抽样C.类型抽样D.整群抽样4.用样本指标对总体指标作点估计时,应满足4点要求,其中无偏性是指()。
A.样本平均数等于总体平均数B.样本成数等于总体成数C.样本指标的平均数等于总体的平均数 D.样本指标等于总体指标5.在其它条件不变的情况下,提高抽样估计的可靠程度,其精确度将()。
A.保持不变B.随之扩大C.随之缩小D.无法确定6.在抽样估计中,样本容量()。
A.越小越好B.越大越好C.有统一的抽样比例D.取决于抽样估计的可靠性要求。
7.假设检验中的临界区域是指()。
A.接受域B.拒绝域C.检验域D.置信区间三、多项选择题1.在抽样推断中,抽取样本单位的具体方法有()。
A.重复抽样B.不重复抽样C.分类抽样D.等距抽样E.多阶段抽样2.在抽样推断中,抽取样本的组织形式有()。
第七章假设检验第一节二项分布二项分布的数学形式·二项分布的性质第二节统计检验的基本步骤建立假设·求抽样分布·选择显著性水平和否定域·计算检验统计量·判定第三节正态分布正态分布的数学形式·标准正态分布·正态分布下的面积·二项分布的正态近似法第四节中心极限定理抽样分布·总体参数与统计量·样本均值的抽样分布·中心极限定理第五节总体均值和成数的单样本检验σ已知,对总体均值的检验·学生t分布(小样本总体均值的检验)·关于总体成数的检验一、填空1.不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分布就趋于(正态)分布。
2.统计检验时,被我们事先选定的可以犯第一类错误的概率,叫做检验的( 显著性水平),它决定了否定域的大小。
3.假设检验中若其他条件不变,显著性水平的取值越小,接受原假设的可能性越(大),原假设为真而被拒绝的概率越(小)。
4.二项分布的正态近似法,即以将B(x;n,p)视为N( np ,npq) 查表进行计算。
二、单项选择1.关于学生t分布,下面哪种说法不正确( B )。
A要求随机样本 B 适用于任何形式的总体分布C 可用于小样本D 可用样本标准差S代替总体标准差2.二项分布的数学期望为( C )。
A n(1-n)pB np(1- p)C npD n(1- p)。
3.处于正态分布概率密度函数与横轴之间、并且大于均值部分的面积为( D )。
A大于0.5 B -0.5 C 1 D 0.5。
4.假设检验的基本思想可用( C )来解释。
A中心极限定理 B 置信区间C 小概率事件D 正态分布的性质5.成数与成数方差的关系是(D)。
A成数的数值越接近0,成数的方差越大B 成数的数值越接近0.3,成数的方差越大C 成数的数值越接近1,成数的方差越大D 成数的数值越接近0.5,成数的方差越大6.在统计检验中,那些不大可能的结果称为( D )。
如果这类结果真的发生了, 我们将否定假设。
A 检验统计量B 显著性水平C 零假设D 否定域7.对于大样本双侧检验,如果根据显著性水平查正态分布表得Z α/2=1.96,则当零假设被否定时,犯第一类错误的概率是( C )。
A 20%B 10%C 5%D .1%8.关于二项分布,下面不正确的描述是( A )。
A 它为连续型随机变量的分布;B 它的图形当p =0.5时是对称的,当p ≠ 0.5时是非对称的,而当n 愈大时非对称性愈不明显;C 二项分布的数学期望)(X E =μ=np ,变异数)(XD =2σ=npq ;D 二项分布只受成功事件概率p 和试验次数n 两个参数变化的影响。
三、多项选择1.关于正态分布的性质,下面正确的说法是( AB )。
A 正态曲线以μ=x 呈钟形对称,其均值、中位数和众数三者必定相等。
B 对于固定的σ值,不同均值μ的正态曲线的外形完全相同,差别只在于曲线在横轴方向上整体平移了一个位置。
C 对于固定的μ值,不同均值σ的正态曲线的外形完全相同,差别只在于曲线在横轴方向上整体平移了一个位置。
D 对于固定的μ值, σ值越大,正态曲线越陡峭。
2.下列概率论定理中,两个最为重要,也是统计推断的数理基础的是( CD )A 加法定理B 乘法定理C 大数定律D 中心极限定理E 贝叶斯定理。
3.统计推断的具体内容很广泛,归纳起来,主要是( BE )问题。
A 抽样分布B 参数估计C 方差分析D 回归分析E 假设检验4.下列关于假设检验的陈述正确的是( ACDE )。
A 假设检验实质上是对原假设进行检验;B 假设检验实质上是对备择假设进行检验;C 当拒绝原假设时,只能认为肯定它的根据尚不充分,而不是认为它绝对错误;D 假设检验并不是根据样本结果简单地或直接地判断原假设和备择假设哪一个更有可能正确;E 当接受原假设时,只能认为否定它的根据尚不充分,而不是认为它绝对正确5.选择一个合适的检验统计量是假设检验中必不可少的一个步骤,其中“合适”实质上是指(ACE )A选择的检验统计量应与原假设有关;B 选择的检验统计量应与备择假设有关;C 在原假设为真时,所选的检验统计量的抽样分布已知;D 在备择假设为真时,所选的检验统计量的抽样分布已知;E 所选的检验统计量的抽样分布已知,不含未知参数。
6.关于t检验,下面正确的说法是(BD )。
A t检验实际是解决大样本均值的检验问题;B t检验实际是解决小样本均值的检验问题;C t检验适用于任何总体分布;D t检验对正态总体适用;E t检验要求总体的σ已知。
四、名词解释1.零假设:概率分布的具体形式是由假设决定的,假设肯定不止一个。
在统计检验中,通常把被检验的那个假设称为零假设(或称原假设,用符号H0表示),并用它和其他备择假设(用符号H1表示)相对比。
2.第一类错误:零假设Ho实际上是正确的,却被否定了。
3.第二类错误:零假设Ho实际上是错误的,却没有被否定。
4.显著性水平:能允许犯第一类错误的概率叫做检验的显著性水平,它决定了否定域的大小。
5.总体参数:6.检验统计量:检验统计量是关于样本的一个综合指标,但与参数估计中讨论的统计量有所不同,它不用作估测,而只用作检验。
7.中心极限定理:σ的如果从一个具有均值μ和方差2量为n 的随机样本,那么当n 变得很大时,样本均值的抽样分布接近正态,并具有均σ/n 。
值μ和方差2五、判断题1.在同样的显著性水平的条件下,单侧检验较之双侧检验,可以在犯第一类错误的危险不变的情况下,减少犯第二类错误的危险。
(√)2.统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。
(√)3.检验的显著性水平(用α表示)被定义为能允许犯第一类错误的概率,它决定了否定域的大小。
(√)4.第一类错误是,零假设H 0实际上是错的,却没有被否定。
第二类错误则是,零假设H 0实际上是正确的,却被否定了。
( × )5.每当方向能被预测的时候,在同样显著性水平的条件下,双侧检验比单侧检验更合 适。
( × )六、计算题1.根据统计,北京市初婚年龄服从正态分布,其均值为25岁,标准差为5岁,问25岁到30岁之间结婚的人;其百分数为多少? 【84.13%】2.共有5000个同龄人参加人寿保险,设死亡率为0.1%。
参加保险的人在年初应交纳保险费10元,死亡时家属可领2000元。
求保险公司一年内从这些保险的人中,获利不少于30000元的概率。
【98.75%】3.为了验证统计报表的正确性,作了共50人的抽样调查,人均收入的结果有:,871元=X 元,21=S 问能否证明统计报表中人均收入μ=880元是正确的(显著性水平α=0.05)。
【不能,因为Z=-3.03<-1.96,所以否定原假设μ=880】4.某单位统计报表显示,人均月收入为3030元,为了验证该统计报表的正确性,作了共100人的抽样调查,样本人均月收入为3060元,标准差为80元,问能否说明该统计报表显示的人均收入的数字有误(取显著性水平α=0.05)。
【可以,因为Z=3.75〉1.96,所以可以拒绝原假设μ=3030,即可以认为统计报表有误】5.已知初婚年龄服从正态分布,根据9个人的抽样调查有:5.23=X (岁),3=S (岁)。
问是否可以认为该地区平均初婚年龄已超过20岁(α=0.05)?【可以,因为t=3.2998〉2.821,所以可以拒绝原假设μ=20,可以认为平均初婚年龄已超过20岁】6.某地区成人中吸烟者占75%,经过戒烟宣传之后,进行了抽样调查,发现了100名被调查的成人中,有63人是吸烟者,问戒烟宣传是否收到了成效?(α=0.05)【1H 0.75,H 0.75︒=<。
=0.05,Z 1.65αα=。
Z ==-2.77<-1.65.所以拒绝原假设,接受备择假设。
】7.据原有资料,某城市居民彩电的拥有率为60%,现根据最新100户的抽样调查,彩电的拥有率为62%。
问能否认为彩电拥有率有所增长?(α=0.05)【不能,因为Z=0.408<1.65,所以接受原假设p=60%,不能认为彩电拥有率有所增长】8.一个社会心理学家试图通过实验来表明采取某种手段有助于增加群体的凝聚力。
但有16个小组,将它们配对成一个实验组和控制组,实验组和控制组各有8个小组,问怎样用二项分布去检验无效力的零假设,列出检验所需的零假设,计算抽样分布,用显著水平0.05,请指出否定域。
【在社会研究的实验法中,此为“双组实验设计”,其步骤是:1)用匹配或随机指派的方法将实验对象一半分到控制组一半分到实验组;2)对实验组实施实验刺激但不对控制组实施这种刺激;3)然后同时对控制组和实验组进行测量,即后测;4)在比较和分析两个组后测结果之间的差别,得出实验刺激的影响。
由此,我们先将16个组两两匹配,得到8个配对组(要使每个配对组在除实验变量之外的其他方面尽量相似)。
然后在每个配对组中任取一组安排于实验组,另一组安排于控制组。
接着,在4-8年的时间内,让分到实验组的8组人接受某种手段,如共同游戏,而控制组的8组人则没有这样做。
而后对每个配对组分别进行后度测量,并用“+”号表示实验组比控制组好的那些配对组,用“-”表示实验组比控制组差的那些配对组。
除非度量方法很粗燥,每配对组应该都能判断出差异。
这样便可以用二项分布做实验无效的检验了。
0H :p=0.5,1H :p>0.5,选用0.1的显著性水平。
()()78P P 0.03910.1+=<,()()()678P P P 0.1836>0.1++=,所以否定域由7个“+”和8个“+”组成,即对每配对组进行后测度量,如出现7个“+”和或8个“+”时,在0.1的显著性水平上,我们将否定零假设,说明实验有效。
否则就不能否定零假设,也就是说实验无效】9.孟德尔遗传定律表明:在纯种红花豌豆与白花豌豆杂交后所生的,子二代豌豆中,红花对白花之比为3:1。
某次种植试验的结果为:红花豌豆352株,白花豌豆96株。
试在α=0.05的显著性水平上,检定孟德尔定律。
【3:p 4H ︒=,13:p 4H ≠。
20.05,Z 1.96αα==,3523Z -==1.75<1.96,所以保留原假设】10.一个样本容量为50的样本,具有均值10.6和标准差2.2,要求:1)请用单侧检验,显著性水平0.05检验总体均值为10.0的假设;【1.65<1.928,所以否定原假设,接受备择假设均值为10.6】2)请用双侧检验,显著性水平0.05检验总体均值为10.0的假设;【1.928<1.96,所以不能否定原假设,仍接受总体均值为10.0】3)请比较上述单、双侧检验犯第一类错误和犯第二类错误的情况。