第6章假设检验
- 格式:doc
- 大小:176.50 KB
- 文档页数:6
第六章参数假设检验假设检验(test of hypothesis)亦称显著性检验(test of statistical significance),就是先对总体的参数或分布做出某种假设,如假设两个总体均数相等,总体服从正态分布或两总体分布相同等,然后用适当的统计方法计算某检验统计量,根据检验统计量的大小来推断此假设应当被接受或拒绝,它是统计推断的另一重要方面。
假设检验可以分为两类:一类是已知总体分布类型,对其未知总体参数的假设作假设检验,称为参数检验(parametric test),主要讨论总体参数(均值、方差、总体率等)的检验;另一类是对未知总体分布类型的总体假设作假设检验,称为非参数检验(non-parametric test),主要包括总体分布形式的假设检验、随机变量独立性的假设检验等。
本章主要介绍有关总体参数(均值、方差、总体率等)的参数检验问题。
第一节假设检验的基本概念一、假设检验问题及基本原理(一)假设检验问题我们先来看个具体的例子。
例6.1某药厂用自动包装机包装葡萄糖,按规定每袋葡萄糖的标准重量为500克,若已知包装机包装的每袋葡萄糖重量服从正态分布,且按以往标准知总体方差σ2=6.52,某日开工后,为检验包装机工作是否正常,随机抽取6袋葡萄糖,测得其平均重量x=504.5(克),问该日自动包装机包装的平均重量是否还是500克?某日随机抽取的6袋葡萄糖的平均重量x=504.5(克),与标准重量500克相比差4.5克,造成该差异的原因有两种可能:①这日自动包装机工作正常,其包装的总体平均重量μ=500克,此6袋葡萄糖的平均重量这一样本均值与总体均值不同,是随机抽样误差造成的;②这日自动包装机工作不正常,其包装的总体平均重量μ≠500克,故从此总体中随机抽取的6袋葡萄糖的平均重量与标准重量存在实质性差异,而不仅仅是抽样误差造成的。
上述两种可能是相互对立的、互不相容的,究竟哪一种可能是对的,可用假设检验的方法来判断。
第6章假设检验一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为小时,标准差为小时。
据报道,10年前每天每个家庭看电视的平均时间是小时。
取显着性水平,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”?详细答案:,=,,拒绝,如今每个家庭每天收看电视的平均时间显着地增加了。
为监测空气质量,某城市环保部门每隔几周对空气烟尘质量进行一次随机测试。
已知该城市过去每立方米空气中悬浮颗粒的平均值是82微克。
在最近一段时间的检测中,每立方米空气中悬浮颗粒的数值如下(单位:微克):根据最近的测量数据,当显着性水平时,能否认为该城市空气中悬浮颗粒的平均值显着低于过去的平均值详细答案:,=,,拒绝,该城市空气中悬浮颗粒的平均值显着低于过去的平均值。
安装在一种联合收割机的金属板的平均重量为25公斤。
对某企业生产的20块金属板进行测量,得到的重量数据如下:假设金属板的重量服从正态分布,在显着性水平下,检验该企业生产的金属板是否符合要求?详细答案:,,,不拒绝,没有证据表明该企业生产的金属板不符合要求。
在对消费者的一项调查表明,17%的人早餐饮料是牛奶。
某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。
为验证这一说法,生产商随机抽取550人的一个随机样本,其中115人早餐饮用牛奶。
在显着性水平下,检验该生产商的说法是否属实详细答案:,,,拒绝,该生产商的说法属实。
某生产线是按照两种操作平均装配时间之差为5分钟而设计的,两种装配操作的独立样本产生如下结果:操作A操作B=100=50====对=,检验平均装配时间之差是否等于5分钟。
详细答案:,=,,拒绝,两种装配操作的平均装配时间之差不等于5分钟。
某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。
样本中每个人都分别在看过该产品的新的电视广告之前与之后打分。
潜在购买力的分值为0~10分,分值越高表示潜在购买力越高。
原假设认为“看后”平均得分小于或等于“看前”平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分。
第6章假设检验练习:6.1某乐器厂以往生产的乐器采用的是一种镍合金弦线,这种弦线的平均抗拉强度不超过1035Mpa,现产品开发小组研究了一种新型弦线,他们认为其抗拉强度得到了提高并想寻找证据予以支持。
在对研究小组开发的产品进行检验时,应该采取以下哪种形式的假设?为什么?6.2研究人员发现,当禽类被拘禁在一个很小的空间内时,就会发生同类相残的现象。
一名孵化并出售小鸡的商人想检验某一品种的小鸡因为同类相残而导致的死亡率是否小于0.04。
试帮助这位商人定义检验参数并建立适当的原假设和备择假设。
6.3一条产品生产线用于生产玻璃纸,正常状态下要求玻璃纸的横向延伸率为65,质量控制监督人员需要定期进行抽检,如果证实玻璃纸的横向延伸率不符合规格,该生产线就必须立即停产调整。
监控人员应该怎样提出原假设和备择假设,来达到判断该生产线是否运转正常的目的?6.4一家大型超市连锁店上个月接到许多消费者投诉某种品牌炸土豆片中60克一袋的那种土豆片的重量不符。
店方猜想引起这些投诉的原因是运输过程中沉积在食品袋底部的土豆片碎屑,但为了使顾客们对花钱买到的土豆片感到物有所值,店方仍然决定对来自于一家最大的供应商的下一批袋装炸土豆片的平均重量(克)μ进行检验,假设陈述如下:如果有证据可以拒绝原假设,店方就拒收这批炸土豆片并向供应商提出投诉。
(1)与这一假设检验问题相关联的第一类错误是什么?(2)与这一假设检验问题相关联的第二类错误是什么?(3)你认为连锁店的顾客们会将哪类错误看得较为严重?而供应商会将哪类错误看得较为严重?6.5某种纤维原有的平均强度不超过6克,现希望通过改进工艺来提高其平均强度。
研究人员测得了100个关于新纤维的强度数据,发现其均值为6.35。
假定纤维强度的标准差仍保持为1.19不变,在5%的显著性水平下对该问题进行假设检验。
(1)选择检验统计量并说明其抽样分布是什么样的?(2)检验的拒绝规则是什么?(3)计算检验统计量的值,你的结论是什么?6.6一项调查显示,每天每个家庭看电视的平均时间为7.25个小时,假定该调查中包括了200个家庭,且样本标准差为平均每天2.5个小时。
第6章假设检验6.1考点归纳一、正态性检验1.W检验设是来自正态总体的样本,为其次序统计量,W统计量定义为,其中系数在样本容量为n时有特定的值,可查附表6,对于假设:总体分布为,其检验的拒绝域具有形式{},其中分位数形,可查附表7。
2.EP检验EP检验即爱泼斯—普利(Epps—Pulley)检验。
爱泼斯—普利检验对多种备择假设有较高的效率,其出发点是利用样本的特征函数与正态分布的特征函数的差的模的平方产生的一个加权积分得到的。
设是来自正态总体N的样本,EP检验统计量定义为,其中,就是前述的样本均值和(除以n的)样本方差看,其拒绝域为是样本容量为n时EP检验统计量(在原假设下的分布)的1-分位数。
二、正态总体均值的假设检验1.单个总体均值μ的检验设总体,未知,检验问题为,.(显著性水平为)(1)σ2已知,关于μ的检验(Z检验)当σ2已知时,用统计量作为检验统计量,当时拒绝原假设,即得拒绝域为(2)σ2未知,关于μ的检验(t检验)设X1,X2,…,X n是来自总体X的样本,由于σ2未知,样本统计量S2是σ2的无偏估计,用S来代替σ,采用作为检验统计量,当时拒绝原假设,即得拒绝域为2.两个正态总体均值差的检验(t检验)设是来自正态总体的样本,是来自正态总体的样本,均为未知,设两样本独立且方差是相等的,又分别记它们的样本均值为,记样本方差为.检验问题为:(δ为已知常数),显著性水平为α,采用下述t统计量作为检验统计量:其中当时拒绝原假设,于是得拒绝域为3.基于成对数据的检验(t检验)(1)逐对比较法在相同的条件下做对比试验,得到一批成对的观察值,然后分析观察数据作出推断,这种方法常称为逐对比较法.(2)成对数据的检验设有n对相互独立的观察结果:(X1,Y1),(X2,Y2),…,(X n,Y n),令,则D1,D2,…,D n相互独立,又由于D1,D2,…,D n是由同一因素所引起的,可认为它们服从同一分布.假设,i=1,2,…,n,其中未知,我们需要基于这一样本检验假设:①;②,③,分别记D1,D2,…,D n的样本均值和样本方差的观察值为,由单个正态总体均值的t检验知检验问题①,②,③的拒绝域分别为(显著性水平为α):三、正态总体方差的假设检验1.单个总体的情况(χ2检验法)设总体均未知,X1,X2,…,X n是来自X的样本,要求检验假设(显著性水平为α)为已知常数.由于S2是σ2的无偏估计,因此选作为检验统计量,则拒绝域具有以下的形式:或类似地,可得左边检验问题的拒绝域为右边检验问题问题的拒绝域为表6-1 正态总体均值、方差的检验法(显著性水平为α)2.两个总体的情况(F检验法)设是来自总体的样本,是来自总体的样本,且两样本独立,其样本方差分别为且设均为未知.现在需要检验假设(显著性水平为α)选取作为检验统计量,则拒绝域为四、分布拟合检验1.单个分布的χ2拟合检验法设总体X的分布未知,x1,x2,…,x n是来自X的样本值,来检验假设H0:总体X的分布函数为F(x);H1:总体X的分布函数不是F(x).将在下X可能取值的全体分成互不相交的子集,以记样本观测值落在的个数,其中设F(x)不含未知参数,(也常以分布律或概率密度代替F(x)).采用作为检验统计量,其中.定理若n充分大(n≥50),则当H0为真时统计量近似服从χ2(k-1)分布.对于给定的显著性水平α,得到上述假设检验问题的拒绝域为.注意:在拟合检验中,n不能小于50,应有np i≥5,否则应适当并组以满足这个要求.2.分布族的χ2拟合检验检验的原假设是H0:总体X的分布函数是其中F的形式已知,而是未知参数,用样本求出未知参数的最大似然估计(在H0下),以估计值作为参数值,求出p i的估计值则取作为检验假设H0的统计量,在H0为真时近似地有得到上述检验问题在显著性水平为下的拒绝域为五、其他分布参数的假设检验1.指数分布参数的假设检验(1)提出假设:拒绝域:,P值:。
第6章假设检验
6.1 一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为
7.25小时,标准差为2.5小时。
据报道,10年前每天每个家庭看电视的平均时间是6.70小时。
取显著性水平,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”?
详细答案:
,=3.11,,拒绝,如今每个家庭每天收看电视的平均时间显著地增加了。
6.2 为监测空气质量,某城市环保部门每隔几周对空气烟尘质量进行一次随机测试。
已知该城市过去每立方米空气中悬浮颗粒的平均值是82微克。
在最近一段时间的检测中,每立方米空气中悬浮颗粒的数值如下(单位:微克):
81.6 86.6 80.0 85.8 78.6 58.3 68.7 73.2
96.6 74.9 83.0 66.6 68.6 70.9 71.7 71.6
77.3 76.1 92.2 72.4 61.7 75.6 85.5 72.5
74.0 82.5 87.0 73.2 88.5 86.9 94.9 83.0
根据最近的测量数据,当显著性水平时,能否认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值?
详细答案:
,=-2.39,,拒绝,该城市空气中悬浮颗粒的平均值显著低于过去的平均值。
6.3 安装在一种联合收割机的金属板的平均重量为25公斤。
对某企业生产的20块金属板进行测量,得到的重量数据如下:
22.6 26.6 23.1 23.5
27.0 25.3 28.6 24.5
26.2 30.4 27.4 24.9
25.8 23.2 26.9 26.1
22.2 28.1 24.2 23.6
假设金属板的重量服从正态分布,在显著性水平下,检验该企业生产的金属板是否符合要求?
详细答案:
,,,不拒绝,没有证据表明该企业生产的金属板不符合要求。
6.4 在对消费者的一项调查表明,17%的人早餐饮料是牛奶。
某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。
为验证这一说法,生产商随机抽取550人的一个随机样本,其中115人早餐饮用牛奶。
在显著性水平下,检验该生产商的说法是否属实?详细答案:
,,,拒绝,该生产商的说法属实。
6.5 某生产线是按照两种操作平均装配时间之差为5分钟而设计的,两种装配操作的独立样本产生如下结果:
操作A操作B
=100 =50
=14.8 =10.4
=0.8 =0.6
对=0.02,检验平均装配时间之差是否等于5分钟。
详细答案:
,=-5.145,,拒绝,两种装配操作的平均装配时间之差不等于5分钟。
6.6 某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。
样本中每个人都分别在看过该产品的新的电视广告之前与之后打分。
潜在购买力的分值为0~10分,分值越高表示潜在购买力越高。
原假设认为“看后”平均得分小于或等于“看前”平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分。
对=0.05的显著性水平,用下列数据检验
该假设,并对该广告给予评价。
购买力得分购买力得分个体看后看前个体看后看前
1 6 5 5 3 5
2 6 4 6 9 8
3 7 7 7 7 5
4 4 3 8 6 6
详细答案:
设,。
,=1.36,
,不拒绝,广告提高了平均潜在购买力得分。
6.7 某企业为比较两种方法对员工进行培训的效果,采用方法1对15名员工进行培训,采用方法2 对12名员工进行培训。
培训后的测试分数如下:方法1 方法2
56 51 45 59 57 53
47 52 43 52 56 65
42 53 52 53 55 53
50 42 48 54 64 57
47 44 44
两种方法培训得分的总体方差未知且不相等。
在显著性水平下,检验两种方法的培训效果是否有显著差异?
详细答案:
,,,拒绝,两种方法的培训效果是有显著差异。
6.8 为研究小企业经理们是否认为他们获得了成功,在随机抽取100个小企业的女性经理中,认为自己成功的人数为24人;而在对95个男性经理的调查中,认为自己成功的人数为39人。
在的显著性水平下,检验男女经理认为自己成功的人数比例是否有显著差异?
详细答案:
设,。
,,,拒绝,男女经理认为自己成功的人数比例有显著差异。
6.9 为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。
研究
者选择了面积相等、土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数据如下:
旧肥料新肥料
109 101 97 98 100 105 109 110 118 109
98 98 94 99 104 113 111 111 99 112
103 88 108 102 106 106 117 99 107 119
97 105 102 104 101 110 111 103 110 119
取显著性水平,检验:
(1)新肥料获得的平均产量是否显著地高于旧肥料?假定条件为:
①两种肥料产量的方差未但相等,即。
②两种肥料产量的方差未且不相等,即。
(2)两种肥料产量的方差是否有显著差异?
详细答案:
(1)设,。
,,,拒绝,新肥料获得的平均产量显著地高于旧肥料。
(2),拒绝,新肥料获得的平均产量显著地高于旧肥料。
(3),。
,,两种肥料产量的方差有显著差异。
6.10 生产工序中的方差是工序质量的一个重要测度,通常较大的方差就意
味着要通过寻找减小工序方差的途径来改进工序。
某杂志上刊载了关于两部机器生产的袋茶重量的数据(单位:克)如下,检验这两部机器生产的袋茶重量的方差是否存在显著差异(a=0.05)。
机器1 2.95 3.45 3.50 3.75 3.48 3.26 3.33 3.20
3.16 3.20 3.22 3.38 3.90 3.36 3.25 3.28
3.20 3.22 2.98 3.45 3.70 3.34 3.18 3.35
3.12
机器2 3.22 3.30 3.34 3.28 3.29 3.25 3.30 3.27
3.38 3.34 3.35 3.19 3.35 3.05 3.36 3.28
3.30 3.28 3.30 3.20 3.16 3.33
详细答案:
,。
=8.28,,拒绝,两部机器生产的袋茶重量的方差存在显著差异。