第三章 假设检验
- 格式:doc
- 大小:747.00 KB
- 文档页数:15
第三章 假设检验3.1 假设检验 两类错误(1)假设检验(hypothesis test ) 假设检验是统计推断的另一类重要问题,是概率意义下的一种反证法。
一般,当母体X 的分布完全未知,或只知其形式而不知其参数时,为推断母体的有关特性,提出针对母体的某项假设;再对母体进行抽样,依据子样值对所提假设做出接受或拒绝的决策。
(2)决策依据——实际推断原理 小概率事件在一次试验中几乎不发生。
若抽样结果是小概率事件在这一次试验中发生了,就有理由怀疑假设的正确性,从而做出拒绝原假设的决策;否则接受原假设。
例 3.1.1 某饮料厂在自动流水线上装饮料,每瓶的重量(单位:克))10,(~2μN X ,正常生产情况下500=μ,一段时间后,为检查机器工作是否正常,抽取9个样品,称重后算得494=x ,试问:此时自动流水线的工作是否正常?解:①提出假设母体)10,(~2μN X ,其中μ未知,在母体上作原假设0H 和备择假设(或称对立假设)1H 如下:↔==500:00μμH 500:01=≠μμH ②构造检验统计量X ∴的值应与μ很接近,想到用X 的值来检验原假设0H .当原假设成立时,10),,(~0200=σσμN X ,故),(~200n N X σμ,从而)1,0(~/10500/000N n X n X U H -=-=σμ(3-1)③给定小概率,找出拒绝域取小概率02.0=α,则有2αu 使}{2αα=≥u U P (3-2)}{2αu U ≥是一个小概率事件,如果一次抽样的结果是这一小概率事件发生了,则认为原假设不合理,应予拒绝。
即应取拒绝域}),,,{(221αu U x x x W n ≥= }),,,{(221ασμu n X x x x n ≥-= (3-3)④做出决策 这时,494=x ,5000=μ,9,100==n σ,8.1=∴U ;02.0=α,33.201.02==u u α,故2αu U <,∴应接受0H ,即认为机器工作正常.注:①假设检验又称为差异显著性检验;②假设检验是具有概率性质的反证法;③拒绝H的说服力强,接受0H的说服力不强;④α越小,拒绝H的说服力越强。
多元统计分析第三章假设检验与⽅差分析第3章多元正态总体的假设检验与⽅差分析从本章开始,我们开始转⼊多元统计⽅法和统计模型的学习。
统计学分析处理的对象是带有随机性的数据。
按照随机排列、重复、局部控制、正交等原则设计⼀个试验,通过试验结果形成样本信息(通常以数据的形式),再根据样本进⾏统计推断,是⾃然科学和⼯程技术领域常⽤的⼀种研究⽅法。
由于试验指标常为多个数量指标,故常设试验结果所形成的总体为多元正态总体,这是本章理论⽅法研究的出发点。
所谓统计推断就是根据从总体中观测到的部分数据对总体中我们感兴趣的未知部分作出推测,这种推测必然伴有某种程度的不确定性,需要⽤概率来表明其可靠程度。
统计推断的任务是“观察现象,提取信息,建⽴模型,作出推断”。
统计推断有参数估计和假设检验两⼤类问题,其统计推断⽬的不同。
参数估计问题回答诸如“未知参数θ的值有多⼤?”之类的问题,⽽假设检验回答诸如“未知参数θ的值是0θ吗?”之类的问题。
本章主要讨论多元正态总体的假设检验⽅法及其实际应⽤,我们将对⼀元正态总体情形作⼀简单回顾,然后将介绍单个总体均值的推断,两个总体均值的⽐较推断,多个总体均值的⽐较检验和协⽅差阵的推断等。
3.1⼀元正态总体情形的回顾⼀、假设检验在假设检验问题中通常有两个统计假设(简称假设),⼀个作为原假设(或称零假设),另⼀个作为备择假设(或称对⽴假设),分别记为0H 和1H 。
1、显著性检验为便于表述,假定考虑假设检验问题:设1X ,2X ,…,n X 来⾃总体),(2σµN 的样本,我们要检验假设100:,:µµµµ≠=H H (3.1)原假设0H 与备择假设1H 应相互排斥,两者有且只有⼀个正确。
备择假设的意思是,⼀旦否定原假设0H ,我们就选择已准备的假设1H 。
当2σ已知时,⽤统计量nX z σµ-=在原假设0H 成⽴下,统计量z 服从正态分布z )1,0(~N ,通过查表,查得)1,0(N 的上分位点2αz 。
《应用数理统计》吴翊李永乐第三章假设检验课后作业参考答案-标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII第三章 假设检验课后作业参考答案3.1 某电器元件平均电阻值一直保持2.64Ω,今测得采用新工艺生产36个元件的平均电阻值为2.61Ω。
假设在正常条件下,电阻值服从正态分布,而且新工艺不改变电阻值的标准偏差。
已知改变工艺前的标准差为0.06Ω,问新工艺对产品的电阻值是否有显著影响( 01.0=α)解:(1)提出假设64.2:64.2:10≠=μμH H , (2)构造统计量36/06.064.261.2/u 00-=-=-=nX σμ(3)否定域⎭⎬⎫⎩⎨⎧>=⎭⎬⎫⎩⎨⎧>⋃⎭⎬⎫⎩⎨⎧<=--21212αααu u u u u u V(4)给定显著性水平01.0=α时,临界值575.2575.2212=-=-ααuu ,(5) 2αu u <,落入否定域,故拒绝原假设,认为新工艺对电阻值有显著性影响。
3.2 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测得其寿命平均值为950(小时)。
已知这种元件寿命服从标准差100σ=(小时)的正态分布,试在显著水平0.05下确定这批元件是否合格。
解:{}01001:1000, H :1000X 950 100 n=25 10002.5V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得:拒绝域:本题中:0.950.950u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。
3.3某厂生产的某种钢索的断裂强度服从正态分布()2,σμN ,其中()2/40cm kg =σ。
现从一批这种钢索的容量为9的一个子样测得断裂强度平均值为X ,与以往正常生产时的μ相比,X 较μ大20(2/cm kg )。
第三章 假设检验一、填空题1、在假设检验中,第一类错误(即弃真错误)是 。
2、在假设检验中,第二类错误(即取伪错误)是 。
3、在假设检验中,βα,分别为犯第一类错误和第二类错误的概率,n 为样本容量,则有当n 固定时,βα, ; 当n 增大时,βα, 。
4、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ=H 01:μμ≠H ,所采用的检验统计量为 。
5、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ=H 01:μμ≠H ,拒绝域为 。
6、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≥H 01:μμ<H ,所采用的检验统计量为 。
7、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≥H 01:μμ<H ,拒绝域为 。
8、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≤H 01:μμ>H ,所采用的检验统计量为 。
9、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≤H 01:μμ>H ,拒绝域为 。
10、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中μ未知,则对于假设2020:σσ=H 2021:σσ≠H ,所采用的检验统计量为 。
11、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中μ未知,则对于假设2020:σσ=H 2021:σσ≠H ,拒绝域为 。
12、检验一个总体X 服从正态分布,可用的方法有(给出两种方法即可) 。
13、设某个假设检验问题的拒绝域为W ,且当原假设H 0成立时,样本值12(,,,)n X X X 落入W 的概率为0.15,则犯第一类错误的概率为_____________________。
第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布一、正态变量二次型的分布1、分量独立的n 维随机向量X 的二次型设),,1)(,(~21n i N X i i =σμ,且相互独立,记⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=n X X X 1,则),(~2n n I N X σμ,其中)',,(1n μμμ =。
X 的二次型具有以下一些结论:结论1 当),,1(0n i i ==μ,12=σ时,则)(~'212n XX X ni iχξ∑===;当),,1(0n i i ==μ,12≠σ时,则)(~'122n X X χσ(或记为)(~'22n X X χσ)。
结论2 当),,1(0n i i =≠μ,X X '的分布常称为非中心2χ分布。
Def3.1.1 设n 维随机向量)0)(,(~≠μμn n I N X ,则称随机向量X X '=ξ为服从n 个自由度、非中心参数∑===ni i 12'μμμδ的2χ分布,记为)(~'),(~'22δχδχn X X n X X 或。
若时且1),0)(,(~22≠≠σμσμn n I N X ,有)(~'122δχσn X X 。
结论3 设),0(~2n n I N X σ,A 为对称矩阵,且r A rank =)(,则二次型 A A r AX X =⇔222)(~/'χσ(A 为对称幂等矩阵)。
结论4 设),(~2n n I N X σμ,'A A =,则),(~'122δχσr AX X ,其中A A A =⇔=22'1μμσδ,且)()(n r r A rank ≤=。
结论5 二次型与线性函数的独立性:设),(~2n n I N X σμ,A 为n 阶对称矩阵,B 为n m ⨯矩阵,令)(,'维随机向量为m Z BX Z AX X ==ξ,若O BA =,则AX X BX '和相互独立。
第三章 假设检验3.2 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测得其寿命平均值为950(小时)。
已知这种元件寿命服从标准差100σ=(小时)的正态分布,试在显著水平0.05下确定这批元件是否合格。
解:{}01001:1000, H :1000950 100 n=25 10002.5V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得:拒绝域:本题中:0.950.950u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。
3.4某批矿砂的五个样品中镍含量经测定为(%): 3.25 3.27 3.24 3.26 3.24设测定值服从正态分布,问在0.01α=下能否接受假设,这批矿砂的镍含量为3.25? 解:n=5;x=zeros(1,n);x=[3.25 3.27 3.24 3.26 3.24]; x1=sum(x)/n; x2=0; for i=1:nx2=x2+(x(1,i)-x1)^2;endx2=x2/n;S=sqrt(x2);0101102: 3.25 H :t 3.252, S=0.0117, n=50.3419H x μμμμσ==≠==提出假设:构造统计量:本题属于未知的情形,可用检验,即取检验统计量为:本题中,代入上式得:否定域为:1-20.995120 V=t>t (1)0.01,(4) 4.6041, 3.25n t t tH ααα-⎧⎫-⎨⎬⎩⎭==<∴本题中,接受认为这批矿砂的镍含量为。
3.5确定某种溶液中的水分,它的10个测定值0.452%,0.035%,X S ==2N(,),μσ设总体为正态分布试在水平5%检验假设:0101() H :0.5% H :0.5%() H :0.04% H :0.0.4%i ii μμσσ≥<≥<{}0.95()0.452% S=0.035%-4.1143(1)0.05 n=10 t (9) 1.833i t X n ασα==-==1-构造统计量:本文中未知,可用检验。
取检验统计量为X 本题中,代入上式得: 0.452%-0.5%拒绝域为:V=t >t 本题中,01 4.1143H <=∴t 拒绝{}22200222212210.952()nS S 0.035% n=10 0.04%100.035%7.65630.04% V=(1)(1)(9)16.919ii n n ααμχσσχχχχχχ--===*==>--==2构造统计量:未知,可选择统计量本题中,代入上式得:()()否定域为:本题中, 210(1)n H αχ-<-∴接受3.8用重量法和比色法两种方法测定平炉炉渣中2SiO 的含量,得如下结果重量法:n=5次测量,120.5%,0.206%X S == 比色法:n=5次测量,221.3%,0.358%Y S == 假设两种分析法结果都服从正态分布,问 (i )两种分析方法的精度σ()是否相同? (ii )两种分析方法的μ均值()是否相同?0.01α=() 解:(i )121122121221212121211H : H :n (1) F=n (1)H FF 11(11)(11)V H 0.015, n S n S n n n n n n n αασσσσα-=≠----⎧⎫⎧⎫----⎨⎬⎨⎬⎩⎭⎩⎭==00220提出原假设:对此可采用统计量在下,(,),我们可取否定域为V=F<F ,F>F ,此时 P()=本题中,111 x 20.5%, S =0.206% 5, y 21.3%, S =0.358%n ===212122120.0050.9950.0050.995n (1)5(51)0.206%F=0.3311n (1)5(51) F 0.0669 F F F H n S n S -*-*==-*-*=∴220代入上式得:()(0.358%)1(5,5)=14.94(5,5)=14.94由于 (5,5)<F<(5,5)接受即无明显差异。
(ii)1202122222121112012H H :(11() ()H 2 V=n n i ii i X Y S X X S Y Y n n t n n t μμμμσ===≠=-=-+-∑∑11提出假设::这种未知的场合,用统计量其中在成立时,服从自由度为的分布。
否定域为:12121111t ((2))V H 0.015, x 20.5%, S =0.206% 5, y 21.3%, S =0.358%t n n n n X Y αα-⎧⎫>+-⎨⎬⎩⎭======0此时 P()=本题中,代入上式得:120.9951-2121-20 =-3.8737t (2)t (8) 3.3554t(2),n n t n n H αα+-==>+-∴拒绝即差距显著。
3.9设总体116(,4),,,XN X X μ为样本,考虑如下检验问题:{}{}01123:0 H :1() =0.05 V ={2X -1.645}V = 1.502X 2.125V =2X 1.962X 1.96(ii)H i μμα==-≤≤≤≤-≥试证下述三个检验(否定域)犯第一类错误的概率同为或通过计算他们犯第二类错误的概率,说明哪个检验最好?解:{}{}{}{}00.97512012()0.050.05:02*1.960.052 1.64502 1.645 1.645( 1.645)1(1.645)=1-0.95=0.05V 1.502 2.i P x V H X U U H X V X X P X P X ααμσμσ-=∈=⎧⎫-⎪⎪=>==⎨⎬⎪⎪⎩⎭=∴>==≤-⎧⎫⎪⎪-⎪⎪≤-=≤-=Φ-=-Φ⎨⎬⎪⎪⎪⎪⎩⎭=≤≤即,P U 这里P {}{}{}{}{}{}203301110125 1.50 2.120(2.215)(1.50)0.980.930.052 1.962 1.962 1.96 1.96P(V H )=1-P 2 1.962(1(1.96))0.05ii :2 1.645X P V H V X X X X H V X σββ⎧⎫⎪⎪-⎪⎪=≤≤⎨⎬⎪⎪⎪⎪⎩⎭=Φ-Φ=-=⎫⎪⎪=≤-≥=≥=≥⎬⎪⎪⎭<=-Φ=X ≥-或()犯第二类错误的概率 =P -V =P {}1μ=-{}{}223310.3551(0.355)0.36:1 1.502 2.12511 4.125:2 1.96110.04 3.96V P X V P X σβμσβμσ⎧⎫⎪⎪+⎪⎪≥=-Φ=⎨⎬⎪⎪⎪⎪⎩⎭=-≤≤=-⎧⎫⎪⎪+⎪⎪≤≤⎨⎬⎪⎪⎪⎪⎩⎭ΦΦ=≤=-⎧⎫⎪⎪+⎪⎪≤≤⎨⎬⎪⎪⎪⎩⎭X =P X =1-P 3.50 =1-(4.125)+(3.50) =1X =P ⎪ΦΦ∴11 =(3.96)-(0.04)=0.99996092-0.516=0.48396092V 出现第二类错误的概率最小,即V 最好。
3.10 一骰子投掷了120次,得到下列结果:问这个骰子是否均匀?(0.05)α= 解:22i 122i 11:620()()20i ki i i ki i i P n np np n np np χχχ====-=-+++==∑∑0i 2222本题原假设为: H i=1,2,,6这里n=120,nP 本题采用的统计量为Pearson 统计量即, 代入数据为:(23-20)(26-20)(15-20)=4.82210.9521k-15k-1H ααχχχχ--<20()=()=11.071由于 () 所以接受即认为这个是均匀的。
3.11 某电话站在一小时内接到电话用户的呼唤次数按每分钟记录的如下表:试问这个分布能看作为泊松分布吗?α(=0.05) 解:{}{}{}{}0221122222233224H :()!81610X n 01*6*7*260606060200.13530!212*0.27071!222*0.27072!23 1.5*0.23!k e P x k k p e P P X e e P P X e e P P X e e P P X e λλλλλ-∧∧--------=====*+++++=====================0检验问题为: 参数为已知的最大似然估计 {}{}{}{}{}4225522662278222221030224*0.09024!3245* 0.03615!15246* 0.01206!457160()(860*0.1353)(1660*0.2707)(160*0.0120)60*0.135360*0.270760*0ki i i i e P P X e e P P X e e P P X e P P X P X n np np χ------=================≥=-≤=----==+++∑.01200.6145=(下面为MATLAB 编程计算程序。
)21210k-1k-1,H ααχχχχ--<∴20.952由于()=(5)=11.071()接受即分布可以看作为泊松分布。
n=60;p=zeros(1,7);p=[exp(-2) exp(-2)*2 exp(-2)*2 exp(-2)*1.5 exp(-2)*(2/3) exp(-2)*(4/15) exp(-2)*(8/90)]; nn=zeros(1,7);nn=[8 16 17 10 6 2 1]; sum=0; for i=1:7sum=sum+((nn(1,i)-n*p(1,i))^2)/(n*p(1,i)); end sumsum = 0.61453.13从一批滚珠中随机抽取了50个,测得他们的直径为(单位:mm ): 15.0 15.8 15.2 15.1 15.9 14.7 14.8 15.5 15.6 15.3 15.1 15.3 15.0 15.6 15.7 14.8 14.5 14.2 14.9 14.9 15.2 15.0 15.3 15.6 15.1 14.9 14.2 14.6 15.8 15.2 15.9 15.2 15.0 14.9 14.8 14.5 15.1 15.5 15.5 15.1 15.1 15.0 15.3 14.7 14.5 15.5 15.0 14.7 14.6 14.2 是否可认为这批滚珠直径服从正态分布?(0.05)α= 解:2123(),H :()()H 0.1833()(-1.1163)0.13210.428214.815.078p ()(-1.1163)(-0.6492)(-1.1163)0.12600.4282p X F x x F x p μσμσμσ-=Φ==Φ=Φ=-=Φ-Φ=Φ-Φ==Φ020设为滚球的直径,其分布函数为则检验问题为在成立的条件下,参数,的最大似然估计为=15.078,14.6-15.07815.115.078()(-0.6492)(0.0514)(-0.6492)0.26240.4282--Φ=Φ-Φ=4512340.952015.415.078p ()(-0.6492)(0.7520)(0.0514)0.25350.4282p 10.2260k-m-12k-m-1,p p p p H ααχχχχ-=Φ-Φ=Φ-Φ==----=<∴221-21-()=()=5.991()=5.991接受认为滚珠直径服从正态分布。