第五章假设检验
- 格式:doc
- 大小:642.50 KB
- 文档页数:13
第五章假设检验本章介绍假设检验的基本概念以及参数检验与非参数检验的主要方法。
通过学习,要求:1.掌握统计检验的基本概念,理解该检验犯两类错误的可能;2. 熟练掌握总体均值与总体成数指标的各种检验方法;包括:z 检验、t 检验和p- 值检验;4. 掌握基本的非参数检验方法,包括:符号检验、秩和检验与游程检验; 5. 能利用Excel 进行假设检验。
第一节假设检验概述一、假设检验的基本概念假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。
假设检验与区间估计结合起来,构成完整的统计推断内容。
假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。
本章分别讨论这两类检验方法。
进行假设检验,首先要对总体的分布函数形式或分布的某些参数做出假设,然后再根据样本数据和“小概率原理” ,对假设的正确性做出判断。
这种思维方法与数学里的“反证法” 很相似,“反证法”先将要证明的结论假设为不正确的,作为进一步推论的条件之一使用,最后推出矛盾的结果,以此否定事先所作的假设。
反证法所认为矛盾的结论,也就是不可能发生的事件,这种事件发生的概率为零,该事件是不能接受的现实。
其实,我们在日常生活中,不仅不肯接受概率为0 的事件,而且对小概率事件,也持否定态度。
比如,虽然偶尔也有媒体报导陨石降落的消息,但人们不必担心天空降落的陨石会砸伤自己。
所谓小概率原理,即指概率很小的事件在一次试验中实际上不可能出现。
这种事件称为“实际不可能事件” 。
小概率的标准是多大?这并没有绝对的标准,一般我们以一个所谓显著性水平 a 0<加1)作为小概率的界限,a的取值与实际问题的性质有关。
所以,统计检验又称显著性检验。
下面通过一个具体例子说明假设检验是怎样进行的。
【例5-1】消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。
第五章假设检验的功效与样本量•当假设检验不拒绝H 0时,推断正确的概率称为检验功效。
•临床科研中不时遇到假设检验无统计学意义,此时,很有必要对检验功效作出评价。
5.1 两类错误与功效1. 两类错误的概率H 0: μ=μ0, H 1: μ>μ0(5.1) 〔略〕Z =nX σμ0-(5.2) 〔略〕 •任何假设检验都可能出现两类错误,用两个概率来度量 第Ⅰ类错误概率=P(拒绝H 0|H 0为真)≤α(5.3) 第Ⅱ类错误概率=P(不拒绝H 0|H 1为真)≤β(5.4a) 也可以理解为第Ⅱ类错误概率=P(不拒绝H 0|H 0为假)≤β(5.4b) •如果将诊断是否患有某病也视为一个假设检验问题: H 0:无病, H 1:有病第Ⅰ类错误:假阳性∕误诊,概率 P(阳性|无病)(α) 第Ⅱ类错误:假阴性∕漏诊,概率 P(阴性|有病)(β) •两类错误的背景:拒绝H 0时可能犯第Ⅰ类错误不拒绝H 0时可能犯第Ⅱ类错误•两类错误的后果:第Ⅰ类错误可能将“真实无效误作有效〞∕误诊 第Ⅱ类错误可能将“真实有效误作无效〞∕漏诊 • 一般α, β的数值要在科研设计时事先确定2. 功效(power)• 假设检验发现真实差异的功效就不低于1-β,即 检验功效=P(拒绝H 0|H 1为真)≥1-β(5.5) 检验功效=P(拒绝H 0|H 0为假)≥1-β(5.5)•功效就是真实有效的药物被发现的概率∕疾病被诊断出来的概率5.2 影响功效的四要素• 假设检验的功效至少受四个要素的影响,参看(5.2)式 nX σμ0-≥Z α(5.6) • 功效的影响因素为:δ=0μ-x ,σ,n ,αX ≥μ0+Z αn σ (5.7) 〔略〕• 现用X 分布图形来定性地讨论四要素对功效的影响1. 客观差异越大,功效越大X ~N(μ,σ2/n) (5.8) 〔略〕若H 0为真,X ~N(μ0,σ2/n) (5.9) 〔略〕若H 1为真,X ~N(μ0+δ,σ2/n) (5.10) 〔略〕2. 个体间标准差越小, 功效越大。
第五章假设检验与回归分析本章主要介绍了假设检验和回归分析两种统计方法。
一、假设检验假设检验是通过收集样本数据来对总体参数的假设进行推断的一种统计方法。
假设检验的步骤如下:1.建立原假设和备择假设:原假设是需要进行检验的参数的假设值,备择假设是对原假设的一种否定或补充。
通常将备择假设设置为我们要验证的假设。
2.收集样本数据:根据样本数据进行统计分析,并计算出检验统计量。
3.确定显著性水平:显著性水平是拒绝原假设的最大错误概率,通常取0.05或0.014.计算拒绝域的临界值:根据显著性水平和自由度,在统计表中查找检验统计量的临界值。
5.比较检验统计量和临界值:如果检验统计量落在拒绝域内,则拒绝原假设,否则接受原假设。
二、回归分析回归分析是一种用于研究两个或多个变量之间关系的统计方法。
它可以用来建立一个变量对另一个变量的预测模型。
回归分析的步骤如下:1.收集数据:根据需要收集自变量和因变量的数据。
2.建立模型:选择适当的回归模型,将自变量和因变量进行数学表达。
3.估计参数:使用最小二乘法等方法,对模型参数进行估计。
4.检验模型:通过检验模型的显著性水平,确定模型是否合理。
5.利用模型:使用估计的模型来进行预测和分析。
回归分析可以分为简单线性回归和多元线性回归两种。
简单线性回归是指只有一个自变量和一个因变量之间的关系,多元线性回归是指有多个自变量和一个因变量之间的关系。
回归分析的应用非常广泛,可以用于市场营销、财务管理、经济预测等领域。
通过回归分析,可以找到影响因变量的主要因素,并对未来的变化进行预测。
总之,假设检验和回归分析是统计学中两种重要的方法。
假设检验用于对总体参数的假设进行验证,回归分析用于研究变量之间的关系。
这两种方法在实际应用中具有广泛的价值。
第五章 假设检验第一节 假设检验中的基本概念和基本原理一、统计假设的概念统计假设,指的是和抽样手段联系在一起,并且依靠抽样数据来进行验证的假设。
统计假设的内容都是数量化了的,而且验证的依据都是凭借抽样调查所取得的资料,在抽取样本资料时,必须保证抽样的随机性。
假设⎩⎨⎧H H 10备择假设原假设原假设,又称为零假设。
它一般是根据已有的资料,或经过周密考虑后确定的、具有稳定性的、受保护的经验和看法。
因此,若没有充分根据, H 0是不会被轻易否定的。
备择假设,又称为研究假设。
经过抽样调查,若有充分根据否定原假设H 0,自然就得接受其逻辑对立面。
原假设H 0的逻辑对立面即为备择假设。
以总体均值μ的假设检验为例,根据问题的不同,假设检验可能有三种: 1、双边检验 H 0:μμ0=H1:μμ0≠2、右侧单边检验 H 0:μμ0=H1:μ>μ03、左侧单边检验 H 0:μμ0=H1:μ<μ二、假设检验的基本原理——小概率原理小概率原理可归纳为两个方面:一是可以认为小概率事件在一次观察中是不可能出现的;二是如果在一次观察中出现了小概率事件,那么,合理的想法是否定原来认为该事件具有小概率的看法。
假设检验的基本思想:经过随机抽样获得一个来自总体的样本,然后根据样本计算某个(或某几个)统计量的数值。
若在原假设H 0成立的条件下,该统计量数值的出现几乎是不可能的,就拒绝或否定原假设H 0,并接受它的逻辑对立面——备择假设H 1。
反之,如果在原假设H 0成立的条件下,该统计量数值出现的可能性不是很小的话,就没有理由拒绝原假设H 0。
三、假设检验中的统计量1、在原假设H 0成立的情况下,统计量中不应包含有未知参数,其数值应该是确定的。
2、所选用的统计量的分布应该是已知的,是有表可查的。
例如,对于正态总体均值μ的检验H 0:μμ0=,应选择的统计量为: =Z nX σμ-(σ2已知) t =nS X μ-(σ2未知)四、显著性水平α显著性水平α是假设检验中所规定的小概率的数量界限。
也就是在原假设H 0成立的条件下,判断统计量数值的出现是否是小概率事件的标准。
常用的标准有:05.0,1.0==αα或01.0=α。
五、临界值、接受域和拒绝域选定一个检验统计量后,在原假设H 0成立的条件下,就可画出统计量的分布。
再根据给定的显著性水平α,就可确定临界值、接受域和拒绝域。
比如,对于正态总体均值μ的双边检验H 0:μμ0=,在总体方差σ2已知的情况下,我们选择=Z nX σμ-为统计量;根据原假设H 0:μμ0=,就可以画出如图5-1-1所示的Z 统计量的分布。
图5-1-1 Z 统计量的分布由于双边检验把拒绝原假设H 0的小概率事件定在了统计量分布的两侧,因此,两侧尾部面积总和所代表的概率即为显著性水平α。
又由于Z 统计量的分布是对称的,所以每侧的概率都是2α。
查标准正态分布表可得:2)(αα=>Z Z P ,2)(2αα=-<Z Z P即 )(22Z Z Z P αα<<-= α-1根据假设检验的小概率原理,如果统计量的值Z Z Z Z c c 22αα-<>或,就应拒绝原假设H;反之,若统计量的值Z Z Z c 2αα<<-,就应接受原假设H 0。
因此,该双边检验以Z Z 22αα和-为临界值,两者之间的区域为接受域,两边为拒绝域。
六、双边检验和单边检验 (一)双边检验双边检验的假设形式为:H 0:μμ0=←→H 1:μμ0≠双边检验的拒绝域被定在了统计量分布的两侧。
若给定的显著性水平为α,则每侧拒绝域的概率应各为2α。
假定所选统计量为Z 统计量,则临界值Z 2α和显著性水平α有如下的关系式:)(22Z Z Z P αα<<-=α-1也就是说,该双边检验的拒绝域为:Z Z Z Z 22αα-<>或,如图5-1-3所示。
图5-1-3 双边检验的接受域、拒绝域(二)单边检验 l.右侧单边检验右侧单边检验的假设形式为:H 0:μμ0=←→H 1:μμ0>右侧单边检验把拒绝域定在了统计量分布的右侧。
若给定的显著性水平为α,则统计量分布右尾的概率应为α。
假定所选统计量为Z 统计量,则临界值Z α和显著性水平α有如下的关系式:αα=>)(Z Z P也就是说,该右侧单边检验的拒绝域为:Z Z α>,如图5-1-4所示。
图5-1-4 右侧单边检验的接受域、拒绝域2.左侧单边检验左侧单边检验的假设形式为:H 0:μμ0=←→H 1:μμ0<左侧单边检验把拒绝域定在了统计量分布的左侧。
若给定的显著性水平为α,则统计量分布左尾的概率应为α。
假定所选统计量为Z 统计量,则临界值-Z α和显著性水平α有如下的关系式:αα=-<)(Z Z P也就是说,该左侧单边检验的拒绝域为:Z Z α-<,如图5-1-5所示。
图5-1-5 左侧单边检验的接受域、拒绝域第二节 假设检验的步骤和两类错误一、假设检验的步骤1、根据实际问题作出假设,包括原假设H 0和备择假设H 1两部分;2、根据样本构造合适的统计量,并在原假设H 0成立的条件下确定统计量的分布;3、根据有关要求给定显著性水平α,并根据统计量的分布求出拒绝域和临界值;4、根据样本统计量的观测值进行判断。
若样本统计量的值落入统计量分布的拒绝域,则拒绝原假设H 0,接受备择假设H 1;反之,则接受H 0。
二、假设检验的两类错误 1、弃真错误弃真错误,又称为第一类错误,指的是否定了未知的真实状态,把正确的原假设H 0当成了假的而加以拒绝的错误。
这是在拒绝原假设H 0时可能出现的错误。
犯弃真错误的概率就是显著性水平α。
2、纳伪错误纳伪错误,又称为第二类错误,指的是接受了未知的不真实状态,把错误的原假设H 0当成了真的而加以接受的错误。
这是在接受原假设H 0时可能出现的错误。
犯纳伪错误的概率β的大小是不确定的。
它的数值大小取决于真实的μ和原假设中的μ的偏离程度△μμμ0-=。
μ∆越小, 犯纳伪错误的概率β越大;反之,△μ越大,β的数值就越小。
(β——下图中阴影部分的面积)在样本容量n 一定的情况下, 不可能同时减小犯两类错误的概率βα和。
要想同时减小犯两类错误的概率,就只能增加样本容量n 。
第三节 单总体假设检验一、大样本假设检验(一)大样本总体均值μ的假设检验在大样本情况下,总体均值μ的假设检验的统计量为:σμμσXX nX Z 0-=-=1、双边检验H 0:μμ0=H1:μμ0≠( 拒绝域为:Z Z Z Z 2αα-<>或 )2、右侧单边检验H 0:μμ0=H1:μ>μ( 拒绝域为:Z Z α> )3、左侧单边检验H 0:μμ0=H1:μ<μ( 拒绝域为:Z Z α-< )图5-3-1 大样本总体均值μ的假设检验例、某部门统计报表显示,该部门职工的人均月收入为1500元。
为检查统计报表的正确性,在该部门职工中抽查了60人,抽查结果为:元,1520=X 36=S 元,问该部门统计报表中的人均月收入是否正确(05.0=α)?解:本问题是在=α0.05下检验假设:H 0:1500=μ←→H 1:1500≠μ。
由于是大样本,所以应选用=Z ns X μ-作为检验统计量,在H 0成立的条件下,Z ~)1,0(N 。
查标准正态分布表可得Z Z 025.02=α=1.96。
因此,该双边检验的拒绝域为:96.196.1-<>Z Z 或。
根据抽样结果有,6036150015200-=-=nX Z σμ=4.303>1.96所以,拒绝原假设H 0,认为该部门的报表中的人均月收入不正确。
由假设检验的原理及方法可知,假设检验与区间估计其实是同一个问题的两种不同的表述方法,假设检验的接受域也正是区间估计的置信区间。
(二)大样本总体成数P 的假设检验大样本总体成数p 的假设检验的统计量为:nP Z P P P )1(ˆ0--=1、双边检验H:PP 0=H 1:PP 0≠( 拒绝域为:Z ZZ Z 22αα-<>或 )2、右侧单边检验H 0:P P 0=H1:PP 0>( 拒绝域为:Z Z α> )3、左侧单边检验H 0:P P 0=H1:PP 0<( 拒绝域为:Z Z α-< )图5-3-2 大样本总体成数P 的假设检验例、某县近年的高考升学率都保持在30%左右,为提高升学率,该县各校进行了一系列的教学改革。
为检查改革的成效,在该县今年的应届毕业生中抽查了100人,结果有38人考上大学。
请问该县各校的一系列教学改革是否取得成效(05.0=α)?解:本问题是在=α0.05下检验假设:H:%30=P ←→H 1:%30>P由于是大样本,所以应选用σPP PnpqP P Z ˆˆˆ-=-=作为检验统计量,在H 0成立的条件下,Z ~)1,0(N 。
查标准正态分布表可得Z Z 05.0=α=1.645。
因此,该右侧单边检验的拒绝域为:645.1>Z 。
根据有关数据,得 nP Z P P P )1(ˆ0--==100%70%30%30%38⨯-=1.746>1.645所以,拒绝原假设H 0,认为该县的教学改革取得了成效。
二、小样本假设检验在小样本情况下,检验统计量的分布与总体分布有关。
(一)单正态总体),(2σμN 的均值检验 1、σ2已知总体均值μ的假设检验的统计量为: σμμσXX nX Z 0-=-=(1)双边检验H 0:μμ0=H1:μμ0≠( 拒绝域为:Z Z Z Z 22αα-<>或 )(2)右侧单边检验H 0:μμ0=H1:μ>μ( 拒绝域为:Z Z α> )(3)左侧单边检验H 0:μμ0=H1:μ<μ( 拒绝域为:Z Z α-< )图5-3-3 单正态总体均值μ的假设检验(σ2已知)例、某厂生产的某种螺栓的直径(单位:mm )服从正态分布),20(2.12N ,设备维修后,从新生产的产品中随机抽查20个,测得X =21mm 。
若方差没有发生变化,问设备维修后,螺栓的直径有没有显著变化(05.0=α)?解:本问题是在=α0.05下检验假设:H:20=μ←→H 1:20≠μ由于是正态总体及小样本,且σ2已知,所以应选用=Z nX σμ-作为检验统计量,在H 0成立的条件下,Z ~)1,0(N 。
查标准正态分布表可得Z Z 025.02=α=1.96。
因此,该双边检验的拒绝域为:96.196.1-<>Z Z 或。
根据抽样数据,可得 202.120210-=-=nX Z σμ=3.727>1.96 所以,拒绝原假设H 0,认为设备维修后螺栓的直径发生了变化。