第三章假设检验
- 格式:docx
- 大小:66.06 KB
- 文档页数:16
第三章 假设检验3.1 假设检验 两类错误(1)假设检验(hypothesis test ) 假设检验是统计推断的另一类重要问题,是概率意义下的一种反证法。
一般,当母体X 的分布完全未知,或只知其形式而不知其参数时,为推断母体的有关特性,提出针对母体的某项假设;再对母体进行抽样,依据子样值对所提假设做出接受或拒绝的决策。
(2)决策依据——实际推断原理 小概率事件在一次试验中几乎不发生。
若抽样结果是小概率事件在这一次试验中发生了,就有理由怀疑假设的正确性,从而做出拒绝原假设的决策;否则接受原假设。
例 3.1.1 某饮料厂在自动流水线上装饮料,每瓶的重量(单位:克))10,(~2μN X ,正常生产情况下500=μ,一段时间后,为检查机器工作是否正常,抽取9个样品,称重后算得494=x ,试问:此时自动流水线的工作是否正常?解:①提出假设母体)10,(~2μN X ,其中μ未知,在母体上作原假设0H 和备择假设(或称对立假设)1H 如下:↔==500:00μμH 500:01=≠μμH ②构造检验统计量X ∴的值应与μ很接近,想到用X 的值来检验原假设0H .当原假设成立时,10),,(~0200=σσμN X ,故),(~200n N X σμ,从而)1,0(~/10500/000N n X n X U H -=-=σμ(3-1)③给定小概率,找出拒绝域取小概率02.0=α,则有2αu 使}{2αα=≥u U P (3-2)}{2αu U ≥是一个小概率事件,如果一次抽样的结果是这一小概率事件发生了,则认为原假设不合理,应予拒绝。
即应取拒绝域}),,,{(221αu U x x x W n ≥= }),,,{(221ασμu n X x x x n ≥-= (3-3)④做出决策 这时,494=x ,5000=μ,9,100==n σ,8.1=∴U ;02.0=α,33.201.02==u u α,故2αu U <,∴应接受0H ,即认为机器工作正常.注:①假设检验又称为差异显著性检验;②假设检验是具有概率性质的反证法;③拒绝H的说服力强,接受0H的说服力不强;④α越小,拒绝H的说服力越强。
多元统计分析第三章假设检验与⽅差分析第3章多元正态总体的假设检验与⽅差分析从本章开始,我们开始转⼊多元统计⽅法和统计模型的学习。
统计学分析处理的对象是带有随机性的数据。
按照随机排列、重复、局部控制、正交等原则设计⼀个试验,通过试验结果形成样本信息(通常以数据的形式),再根据样本进⾏统计推断,是⾃然科学和⼯程技术领域常⽤的⼀种研究⽅法。
由于试验指标常为多个数量指标,故常设试验结果所形成的总体为多元正态总体,这是本章理论⽅法研究的出发点。
所谓统计推断就是根据从总体中观测到的部分数据对总体中我们感兴趣的未知部分作出推测,这种推测必然伴有某种程度的不确定性,需要⽤概率来表明其可靠程度。
统计推断的任务是“观察现象,提取信息,建⽴模型,作出推断”。
统计推断有参数估计和假设检验两⼤类问题,其统计推断⽬的不同。
参数估计问题回答诸如“未知参数θ的值有多⼤?”之类的问题,⽽假设检验回答诸如“未知参数θ的值是0θ吗?”之类的问题。
本章主要讨论多元正态总体的假设检验⽅法及其实际应⽤,我们将对⼀元正态总体情形作⼀简单回顾,然后将介绍单个总体均值的推断,两个总体均值的⽐较推断,多个总体均值的⽐较检验和协⽅差阵的推断等。
3.1⼀元正态总体情形的回顾⼀、假设检验在假设检验问题中通常有两个统计假设(简称假设),⼀个作为原假设(或称零假设),另⼀个作为备择假设(或称对⽴假设),分别记为0H 和1H 。
1、显著性检验为便于表述,假定考虑假设检验问题:设1X ,2X ,…,n X 来⾃总体),(2σµN 的样本,我们要检验假设100:,:µµµµ≠=H H (3.1)原假设0H 与备择假设1H 应相互排斥,两者有且只有⼀个正确。
备择假设的意思是,⼀旦否定原假设0H ,我们就选择已准备的假设1H 。
当2σ已知时,⽤统计量nX z σµ-=在原假设0H 成⽴下,统计量z 服从正态分布z )1,0(~N ,通过查表,查得)1,0(N 的上分位点2αz 。
第三章 假设检验一、填空题1、在假设检验中,第一类错误(即弃真错误)是 。
2、在假设检验中,第二类错误(即取伪错误)是 。
3、在假设检验中,βα,分别为犯第一类错误和第二类错误的概率,n 为样本容量,则有当n 固定时,βα, ; 当n 增大时,βα, 。
4、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ=H 01:μμ≠H ,所采用的检验统计量为 。
5、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ=H 01:μμ≠H ,拒绝域为 。
6、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≥H 01:μμ<H ,所采用的检验统计量为 。
7、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≥H 01:μμ<H ,拒绝域为 。
8、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≤H 01:μμ>H ,所采用的检验统计量为 。
9、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≤H 01:μμ>H ,拒绝域为 。
10、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中μ未知,则对于假设2020:σσ=H 2021:σσ≠H ,所采用的检验统计量为 。
11、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中μ未知,则对于假设2020:σσ=H 2021:σσ≠H ,拒绝域为 。
12、检验一个总体X 服从正态分布,可用的方法有(给出两种方法即可) 。
13、设某个假设检验问题的拒绝域为W ,且当原假设H 0成立时,样本值12(,,,)n X X X 落入W 的概率为0.15,则犯第一类错误的概率为_____________________。
第三章 假设检验3.2 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测得其寿命平均值为950(小时)。
已知这种元件寿命服从标准差100σ=(小时)的正态分布,试在显著水平0.05下确定这批元件是否合格。
解:{}01001:1000, H :1000950 100 n=25 10002.5V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得:拒绝域:本题中:0.950.950u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。
3.4某批矿砂的五个样品中镍含量经测定为(%): 3.25 3.27 3.24 3.26 3.24设测定值服从正态分布,问在0.01α=下能否接受假设,这批矿砂的镍含量为3.25? 解:n=5;x=zeros(1,n);x=[3.25 3.27 3.24 3.26 3.24]; x1=sum(x)/n; x2=0; for i=1:nx2=x2+(x(1,i)-x1)^2;endx2=x2/n;S=sqrt(x2);0101102: 3.25 H :t 3.252, S=0.0117, n=50.3419H x μμμμσ==≠==提出假设:构造统计量:本题属于未知的情形,可用检验,即取检验统计量为:本题中,代入上式得:否定域为:1-20.995120 V=t>t (1)0.01,(4) 4.6041, 3.25n t t tH ααα-⎧⎫-⎨⎬⎩⎭==<∴本题中,接受认为这批矿砂的镍含量为。
3.5确定某种溶液中的水分,它的10个测定值0.452%,0.035%,X S ==2N(,),μσ设总体为正态分布试在水平5%检验假设:0101() H :0.5% H :0.5%() H :0.04% H :0.0.4%i ii μμσσ≥<≥<{}0.95()0.452% S=0.035%-4.1143(1)0.05 n=10 t (9) 1.833i t X n ασα==-==1-构造统计量:本文中未知,可用检验。
假设检验(hypothesis testing)方法演变:t检验、z检验、F检验、卡方检验,方差分析( ANOVA)➢概述假设检验是分析数据的一种方法。
回答此类问题:“随机发生的事件的概率是多少?”另一方面的问题是:“我们从数据中发现的结果是真的吗?”当问题是有关大的总体而只能得到总体的一个样本时用假设检验。
这种方法被用来回答在质量改进中一系列重要的问题,如“我们在过程中所做的改变对产出创造了有意义的差别吗?”或”顾客对场地A的满意度是不是比其他场地高?”最常用的检验是:z检验、t检验、F检验、卡方(χ2)检验和方差分析。
这些检验和其他的检验都是基于均值、方差、比例及其他统计量所形成的具有常见模式的频率分布。
最有名的分布就是正态分布,它是:检验的基础。
t检验、F检验和卡方(χ2)检验是基于t分布、F分布和卡方分布。
➢适用场合·想知道一组或更多组数据的平均值、比例、方差或其他特征时;·当结论是基于更大总体中所取得的样本时。
例如:·想确定一个过程的均值或方差有否改变;·想确定很多数据集的均值或方差是否不同:·想确定两组不同的数据集的比例是否不同;·想确定真正的比例、均值或方差是否和一个定值相等(或大于或小于)。
➢实施步骤假设检验的步骤由三部分组成:理解要解决的问题并安排检验(以下步骤1~3);数字计算通常由计算机完成(步骤4和步骤5);应用数值结果到实际问题中(步骤6)。
虽然计算机能处理数字,但理解假没检验隐含的观念对第1部分和第3部分至关重要。
如果第一次接触假设检验,那么从看“注意事项”中的术语和定义开始。
这些定义解释了假设检验的慨念,然后再回来看这个步骤。
本书不可能详细地涉及假设检验。
这个步骤是个综述和快速参考。
要得到更多的信息,查阅统计学参考书或请教统计学家。
1确定要从数据中获得的结论。
选择适当的检验方法。
用哪种检验取决于检验的目的和数据的种类。
第二章假设检验3.2 —种元件,要求其使用寿命不低于1000 (小时),现在从一批这种 元件中随机抽取25件,测得其寿命平均值为950 (小时)。
已知这种元 件寿命服从标准差 100(小时)的正态分布,试在显著水平0.05下确定这批元件是否合格 解:提出假设:H 。
:1000, H i : 1000构造统计量:此问题情形属于u 检验,故用统计量:u=此题中:x 950 0100 n=25代入上式得:拒绝域:V= 本题中: u u 10.05 u 0.95 1.64 即, u U 0.95拒绝原假设H 。
认为在置信水平0.05下这批元件不合格。
3.4某批矿砂的五个样品中镍含量经测定为(%):3.25 3.27 3.24 3.26 3.24 设测定值服从正态分布,问在 0.01下能否接受假设,这批矿砂的镍含量为3.25? 解:n=5;x=zeros(1, n);x=[3.25 3.27 3.24 3.26 3.24]; x1=sum(x)/n; x2=0; for i=1: nx2=x2+(x(1,i)-x1)A 2;1000=950-1000 100 25 2.5endx2=x2/n; S=sqrt(x2);提出假设:H 0: J 0 3.25 H 1 : 1构造统计量:本题属于1 2未知的情形,可用t 检验,即取检验统计量为:-X — S .n 1本题中,X 3.252, S=0.0117,代入上式得:否定域为:V 二 t>t (n 1)1— 2本题中, 0.01,t 0.995(4) 4.6041Qt t1 - 2接受H 0,认为这批矿砂的镍含量为 3.25。
3.5确定某种溶液中的水分,它的10个测定值X 0.452%, SS 百本题中,X 0.452% 代入上式得:拒绝域为:拒绝H °1 H 0: 0.5% (ii)H 0 : 0.04%_3.252-3.25_0.0117 -F10.3419设总体为正态分布N(,2),试在水平5%检验假设:H 1 : 0.5%H 1 : 0.0.4%(i)构造统计量:本文中未知,可用t 检验。
取检验统计量为t=°452%-0.5% -4.11430.035% J0-1V= 本题中, t >t 1- (n 1) 0.05n=10t 0.95(9) 1.8331 t4.1143n=50.035%,t= S=0.035%曰(ii )构造统计量: 未知,可选择统计量2nS 22"0.035% n=10 0 0.04%否定域为:本题中,12(n 1)Q 212(n 1)接受H 。
3.8用重量法和比色法两种方法测定平炉炉渣中 SiO 2的含量,得如下 结果重量法:n=5 次测量,X 20.5%,S 0.206% 比色法:n=5 次测量,Y 21.3%,S 20.358%假设两种分析法结果都服从正态分布,问 (i ) 两种分析方法的精度()是否相同? (ii )两种分析方法的均值()是否相同?( 0.01解: (i )提出原假设:H o : 1 2H 1 : 1 2对此可采用统计量口(门 2 "S 'F=2吐(n 1 1)S 2在H o 下,F: F (m 1, n 2 1),我们可取否定域为V= F<F (n-i 1, n 2 1) U F>F g 1, n 2 1)1 —2 2此时 P ( V H 0)= 0.01 本题中,n,5, x 20.5%, =0.206%本题中,S 代入上式得:10(°.035%)27.6563(0.04%)2V=12(n 1) fa®) 16.919n15, y 21.3%, 0=0.358%代入上式得:2 2n 1(n21)3 5 (5 1)(0.206%)F= 2n2(m 1)S2 5 (5 1) (0.358%)1F o.oo",5)=149^ 0.0669F o』95(5, 5) =14.94由于F0.005(5, 5)VF<F0.995(5, 5)接受H。
即无明显差异。
(ii)提出假设:H0: 1 2H| :1 2这种未知的场合,用统计量1 2 _其中S2— (X i X)2S;—(Y Y)2m i 1 n2 i 1在H0成立时,t服从自由度为n n2 2的t分布<否定域为:V= t t1 ((A! n2 2))1 —2此时P( V H°)= 0.01本题中,n 5, x 20.5%, 0=0.206%g 5, y 21.3%, 0=0.358%代入上式得:t= ne 2(m n2 2) (X Y)V n1 n2 JmS2 n2S;5 5 (5 5 2) _________ (20.5%_21.3%) _____N 5 5& (0.206%)2 5 (0.358%)2=-3.8737t (n1 n2 2) 10.995(8) 3.35541-—2Q t t1 (n, n2 2)1-—2拒绝H0,即差距显著。
3.9设总体X : N( ,4), X1,K ,X16为样本,考虑如下检验问题:H0: 0 H1: 1(i) 试证下述三个检验(否定域)犯第一类错误的概率同为V i二{2才-1.645}V2= 1.50 2X 2.125V3= 2X 1.96 或2X 1.96(ii) 通过计算他们犯第二类错误的概率,说明哪个检验最好? 解:P x V H00.05X即,P U ------------ U 0.975 0.051~2这里H。
:0P 冈2*1.96 0.05V12X 1.645X 0P 2X 1.645 P 1.645 ( 1.645) 1石=1-0.95=0.05P(V3H0)=1-P 2X 1.96 2(1 (1.96)) 0.05 (ii)犯第二类错误的概率=P -V H1V1: 1=P 2X 1.645 1=0.05 (1.645)V2 1.50 2X 2.125 1.50 2.120P V2 H0 (2.215) (1.50)V 2X 1.96 或2X 1.96n0.98 0.93 0.051.962X 1.96i 1nP i 20X i =P0.355 1 (0.355) 0.36nV 2: 2 1 P 1.50 2X 2.1251X 1=1-P 3.50 4.125•匚=1- (4.125)+ (3.50)=1V 3: 3 P 2X| 1.961X 1 =P 0.04 3.96n= (3.96)- (0.04)=0.99996092-0.516=0.48396092 V 出现第二类错误的概率最小,即V 最好。
3.10 一骰子投掷了 120次,得到下列结果:问这个骰子是否均匀? ( 0.05)解:1本题原假设为: H ° : p 16这里 n=120,nP j 20本题采用的统计量为 Pearson k(n i 叩J 2i 1np i代入数据为:km npJ 2( 23-20)( 26-20)L (15-20)=4 8i=1,2, L ,6 2统计量即,221(k-1) = 0(5) =11.071由于2 1(k-1)所以接受H o即认为这个是均匀的。
3.11某电话站在一小时内接到电话用户的呼唤次数按每分钟记录 的如下表:试问这个分布能看作为泊松分布吗? ( =0.05)解:检验问题为:kH o :P(x k) — 参数为 k!已知的最大似然估计X np 0 § 1卫 L 6*丄60 60 60P X 7 1 P X 6 0 =0.6145(下面为MATLAB 编程计算程序。
)P F3巳F6耳P X 0P X 1 P X 2 P X 3 P X 4 P X 5 P X 620e 20!1 22 e 1! 22e 2 2! 23e 2 3! 24e 2 4! 25e 2 5! 26e 2 6!e 2 0.1353 2* e 2 0.2707 2* e 2 0.2707 1.5* e 2 0.2030 2 2 *e 2 0.0902 3 4 2* e 2 0.0361 15 4 2 *e 2 0.0120457* — L 60k(n i np)2 (8 60*0.1353) (16 60*0.2707)i 1np i 60*0.1353 60*0.2707(1 60*0.0120)2 60*0 .0120由于 1 (k-1 ) = 0.95 (5) =1 1.071 Q 21(k-1 )接受H 0,即分布可以看作为泊松分布。
n=60; p=zeros(1,7);p=[exp(-2) exp(-2)*2 exp(-2)*2 exp(-2)*1.5 exp(-2)*(2⑶ exp(-2)*(4/15) exp(-2)*(8/90)]; nn=zeros(1,7); nn=[8 16 17 10 6 2 1]; sum=0; for i=1:7sum=sum+(( nn (1,i)-n*p(1,i))A 2)/( n*p(1,i)); end sumsum = 0.6145是否可认为这批滚珠直径服从正态分布? ( 0.05)解:设X 为滚球的直径,其分布函数为F(x),则检验问题为xH 0:F(x)()在H 。
成立的条件下,参数,2的最大似然估计为 =15.078, 20.183315.0 15.8 15.2 15.1 15.9 14.7 14.8 15.5 15.6 15.3 15.1 15.3 15.0 15.6 15.7 14.8 14.5 14.2 14.9 14.9 15.2 15.0 15.3 15.6 15.1 14.9 14.2 14.6 15.815.2 15.9 15.2 15.0 14.9 14.8 14.5 15.1 15.5 15.515.115.1 15.0 15.3 14.7 14.5 15.5 15.0 14.7 14.6 14.2 3.13从一批滚珠中随机抽取了 50个,测得他们的直径为(单位:mm ):p p P 2 P14.6-15.078 0.4282(14.8 15.078)0.4282(15.1 15.078)(0.4282)(-1.1163) 0.1321 (-1.1163) (-0.6492) (-0.6492)(0.0514)(-1.1163) 0.1260 (-0.6492) 0.2624P4 (-0-6492) (0.7520) (0.0514) 0.2535P5 1 P l P2 P3 P4 0.22602(k-m-1 ) = :.95(2)=5.991 Q 2I. (k-m-1 ) =5.9911接受H 0,认为滚珠直径服从正态分布。