假设检验的基本问题
- 格式:doc
- 大小:120.50 KB
- 文档页数:5
应用统计学第九章假设检验朱佳俊博士Applied Statistics 第一节假设检验的基本问题一、假设检验的基本概念对总体的概率分布或分布参数作出某种“假设”,根据抽样得到的样本观测值,运用数理统计的分析方法,检验这种“假设”是否正确,从而决定接受或拒绝“假设”,这就是本章要讨论的假设检验问题。
1、假设定义为一个调研者或管理者对被调查总体的某些特征所做的一种假定或猜想。
是对总体参数的一种假设。
常见的是对总体均值或比例和方差的检验;在分析之前,被检验的参数将被假定取一确定值。
2、假设检验(hypothesis test)(1)概念–事先对总体参数或分布形式作出某种假设–然后利用样本信息来判断原假设是否成立(2)类型–参数假设检验–非参数假设检验(3)特点–采用逻辑上的反证法–依据统计上的小概率原理... 因此我们拒绝假设 =20... 如果这是总体的真实均值样本均值μ= 50抽样分布H0这个值不像我们应该得到的样本均值...203、假设检验的基本思想小概率原理是假设检验的基本依据,即认为小概率事件在一次试验中几乎是不可能发生的。
当进行假设检验时,先假设H 0正确,在此假设下,若小概率事件A出现的概率很小,例如P (A )=0.01,经过取样试验后,A 出现了,则违反了上述原理,我们认为这是一个不合理的结果。
4、小概率原理5、原假设和备择假设(1)原假设(null hypothesis)研究者想收集证据予以支持的假设也称“研究假设”总是有符号≠, <或>表示为H 1–H 1 :μ<某一数值,或μ>某一数值–例如, H 1 :μ< 10cm ,或μ>10cm(2)备择假设(alternative hypothesis)研究者想收集证据予以支持的假设也称“研究假设”总是有符号≠, <或>表示为H1–H1 :μ<某一数值,或μ>某一数值–例如, H1 :μ< 10cm,或μ>10cm6、双侧检验与单侧检验(1)备择假设没有特定的方向性,并含有符号“≠”的假设检验,称为双侧检验或双尾检验(two-tailed test)(2)备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailed test)–备择假设的方向为“<”,称为左侧检验–备择假设的方向为“>”,称为右侧检验双侧检验与单侧检验(假设的形式)单侧检验H1: μ> μ0H1:μ< μ0H1: μ≠μ0备择假设H: μ≤μ0H: μ≥μ0H: μ= μ0原假设右侧检验左侧检验双侧检验假设二、假设检验中的两类错误与显示性水平1、假设检验中的两类错误(1)第Ⅰ类错误(弃真错误)–原假设为真时拒绝原假设–第Ⅰ类错误的概率记为α•被称为显著性水平(2)第Ⅱ类错误(取伪错误)–原假设为假时未拒绝原假设–第Ⅱ类错误的概率记为β(Beta)2、显著性水平(significant level)(1)是一个概率值(2)原假设为真时,拒绝原假设的概率–被称为抽样分布的拒绝域(3)表示为α(alpha)–常用的α值有0.01, 0.05, 0.10(4)由研究者事先确定三、检验统计量与拒绝域(一)检验统计量(test statistic)1、根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量2、对样本估计量的标准化结果–原假设H为真–点估计量的抽样分布点估计量的抽样标准差假设值—点估计量标准化检验统计量=3.标准化的检验统计量显著性水平和拒绝域(双侧检验)抽样分布临界值临界值α/2α/2 样本统计量拒绝H 0拒绝H 01 -α1 -置信水平显著性水平和拒绝域(单侧检验)0临界值α样本统计量拒绝H 0抽样分布1 -α置信水平(二)决策规则1、给定显著性水平α,查表得出相应的临界值z α或z α/2,t α或t α/22、将检验统计量的值与α水平的临界值进行比较3、作出决策–双侧检验:I 统计量I > 临界值,拒绝H 0–左侧检验:统计量< -临界值,拒绝H 0–右侧检验:统计量> 临界值,拒绝H 0四、利用P 值进行决策(一)什么是P 值(P -value)1、在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率–双侧检验为分布中两侧面积的总和2、反映实际观测到的数据与原假设H 0之间不一致的程度3、被称为观察到的(或实测的)显著性水平4、决策规则:若p 值<α, 拒绝H 0双侧检验的P 值α/ 2α/ 2Z拒绝H 0拒绝H 0临界值计算出的样本统计量计算出的样本统计量临界值1/2 P 值1/2 P 值临界值α样本统计量拒绝H 0抽样分布1 -1 -α置信水平计算出的样本统计量P 值左侧检验的P 值临界值α拒绝H 0抽样分布 1 -1 -α置信水平计算出的样本统计量P 值右侧检验的P 值五、假设检验步骤1、陈述原假设和备择假设2、从所研究的总体中抽出一个随机样本3、确定一个适当的检验统计量,并利用样本数据算出其具体数值4、确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5、将统计量的值与临界值进行比较,作出决策–统计量的值落在拒绝域,拒绝H 0,否则不拒绝H 0–也可以直接利用P 值作出决策第二节一个总体参数的检验z 检验(单尾和双尾)z 检验(单尾和双尾)t 检验(单尾和双尾)t 检验(单尾和双尾)z 检验(单尾和双尾)z 检验(单尾和双尾)χ2 检验(单尾和双尾)χ2 检验(单尾和双尾)均值均值一个总体一个总体比率比率方差方差是z 检验x z nμσ−=否z 检验ns x z 0μ−=一、总体均值的检验σ是否已知小样本容量n大σ是否已知否t 检验ns x t 0μ−=是z 检验nx z σμ0−=(一)总体均值的检验(大样本)•1.假定条件–正态总体或非正态总体大样本(n ≥30)2.使用z 检验统计量σ2已知:σ2未知:)1,0(~0N nx z σμ−=)1,0(~0N nsx z μ−=1、总体均值的检验(σ2已知)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml ,标准差为5ml 。
假设检验的基本问题一、什么是假设检验原假设H 0是接受检验的假设。
备择假设H 1是当原假设被否定时另一种可成立的假设。
原假设和备择假设相互对立,在任何情况下只能有一个成立。
二、假设检验中的小概率事件假设检验的基本思想——根据小概率的原理,可以做出是否接受原假设的决定。
小概率原理:指发生概率很小的随机事件在一次试验中几乎不可能发生的。
E : 据报载,某商店为搞促销,对购买一定数额商品的顾客给予一次摸球中奖的机会,规定从装有红、绿两色球各10个的暗箱中连续摸10次(摸后放回),若10次都是摸得绿球,则中大奖。
某人按规则去摸10次,皆为绿球,商店认定此人作弊,拒付大奖,此人不服,最后引出官司。
所谓“小概率事件”,究竟多大概率为小概率事件?在一个问题中,通常是指定一个正数10,<<αα,认为概率不超过α的事件是在一次试验中不会发生的事件,这个α称为显著性水平(Level of significance)。
通常可选取α=0.01,0.05,0.10等。
下面我们用假设检验的语言来模拟商店的推断:10提出假设:0H :此人未作弊;1H :此人作弊。
20 构造统计量,并由样本算出其具体值:统计量取为10次摸球中摸中绿球的个数N .由抽样结果算出N=1030求出在H 0下统计量N 的分布,构造对H 0不利的小概率事件。
40给定显著性水平α,确定临界值。
50得出结论。
在这些步骤中,关键的技术问题是确定一个适当的用以检验假设的统计量,这个统计量至少应该满足在H 0成立的情况下,其抽样分布易于计算(查到)。
在统计量选定以后,便可构造出由该统计量T 描述某个显著性水平下的一小概率事件{αB T ∈},我们称使得这一小概率事件发生的样本空间的点的全体 });,,,(:),,,{(2121αθB X X X T X X X V n n ∈X ∈=为H 0的否定域或拒绝域,最后的检验即是判断所给的样本是否落在V 内。
第十章假设检验第一节假设检验的基本问题一、假设与假设检验1.假设检验的意义从样本的差异推论总体差异的过程,就是假设检验。
一个研究的概括程度越高,可推论的范围就越大。
2.虚无假设H0在推论研究假设之前所提出来的与研究假设相反的假设,这一假设是不存在的,故称之为虚无假设。
一般虚无假设都假设两个总体之间没有差异。
3.研究假设H1研究中所要证明的假设,称为科学假设、对立假设。
一般为假设两个总体参数之间有差异。
二、检验中的两类错误1、α错误:(1)概念:又称为显著性水平,I型错误,是指在否定虚无假设、接受对立假设时所犯的错误,即是将属于没有差异的总体推论为有差异的总体时,所犯的错误。
(2)α错误的确定原则:α错误的概率一般根据统计学原则,规定为5%-1%。
2.β错误:β错误是指在接受H0 为真时所犯的错误,在接受H0 为真,而拒绝H1时,势比有一部分属于H1总体的部分样本,被视为H0 的部分,而被否定在H1之外。
(3)α错误和β错误的关系:α错误和β错误是在两个前提下的概率。
两个总体的关系若是确定的,则α增大,β减小;α减小,β增大;二者相反。
三、单侧检验和双侧检验1、单测检验(1)概念:查统计表时,按分布的一侧计算显著性水平概率的检验,称作单侧检验。
(2)应用条件:凡是检验大于、小于、高于、低于、优于、劣于等有确定性大小关系的假设检验问题。
这类问题的确定是有一定的理论依据的。
假设检验写作H1:μ1<μ2 或μ1>μ2。
2.双侧检验(1)概念:查统计表时,按分布的两端计算显著性水平概率的检验,称作双侧检验。
(2)应用条件:凡是理论上不能确定两个总体一个一定比另一个大或小的假设检验。
一般写作H1:μ1≠μ2。
第二节平均数差异显著性检验一、平均数显著性检验(一)概念:是指研究样本的总体与已知总体μ0差异是否显著的假设检验。
(二)原理:总体分布正态分布或接近正态分布的样本平均数的分布为正态分布或t分布,按分布率进行推论。
假设检验的基本问题
一、什么是假设检验
原假设H 0是接受检验的假设。
备择假设H 1是当原假设被否定时另一种可成立的假设。
原假设和备择假设相互对立,在任何情况下只能有一个成立。
二、假设检验中的小概率事件
假设检验的基本思想——根据小概率的原理,可以做出是否接受原假设的决定。
小概率原理:指发生概率很小的随机事件在一次试验中几乎不可能发生的。
E : 据报载,某商店为搞促销,对购买一定数额商品的顾客给予一次摸球中奖的机会,规定从装有红、绿两色球各10个的暗箱中连续摸10次(摸后放回),若10次都是摸得绿球,则中大奖。
某人按规则去摸10次,皆为绿球,商店认定此人作弊,拒付大奖,此人不服,最后引出官司。
所谓“小概率事件”,究竟多大概率为小概率事件?在一个问题中,通常是指定一个正数10,<<αα,认为概率不超过α的事件是在一次试验中不会发生的事件,这个α称为显著性水平(Level of significance)。
通常可选取α=0.01,0.05,0.10等。
下面我们用假设检验的语言来模拟商店的推断:
10
提出假设:0H :此人未作弊;1H :此人作弊。
20 构造统计量,并由样本算出其具体值:
统计量取为10次摸球中摸中绿球的个数N .由抽样结果算出N=10
30
求出在H 0下统计量N 的分布,构造对H 0不利的小概率事件。
40
给定显著性水平α,确定临界值。
50
得出结论。
在这些步骤中,关键的技术问题是确定一个适当的用以检验假设的统计量,这个统计量至少应该满足在H 0成立的情况下,其抽样分布易于计算(查到)。
在统计量选定以后,便可构造出由该统计量T 描述某个显著性水平下的一小概率事件{αB T ∈},我们称使得这一小概率事件发生的样本空间的点的全体 });,,,(:),,,{(2121αθB X X X T X X X V n n ∈X ∈=
为H 0的否定域或拒绝域,最后的检验即是判断所给的样本是否落在V 内。
因此,设计一个检验,本质上就是找到一个恰当的否定域V ,使得在0H 下,它的概率:a H V P 0)()|(≤=或 依据小概率原理推断可能会犯错误!
检验的原理是“小概率事件在一次试验中不发生”,以此作为推断的依据,决定是接受H 0或拒绝H 0.但是这一原理只是在概率意义下成立,并不是严格成立的,即不能说小概率事件在一次试验中绝对不可能发生。
仍以上例来说,尽管按统计推断结论,认为摸球人作弊,但事实上也完全可能没有作弊。
当摸奖人事实上的确是未作弊的话,商店的统计推断就犯了错误。
三、第一类错误、第二类错误与显著水平
第一类错误(弃真错误):原假设H 0本来为真,却错误地否定
了。
(属于弃真错误)
第二类错误(取伪错误):原假设H 0非真,但做出接受H 0的选择。
(属于取伪错误)
犯两错误的概率:在假设检验中,犯第一类错误的概率记为α,α也称为显著性水平。
犯Ⅱ类错误的概率记为β。
人们自然希望犯这两类错误的概率越小越好。
但对于一定的样本容量n ,两类错误有相反的关系,减小α会引起β增大,减少β会引起α增大。
可能带来的后果越严重,危害越大的一类错误,在假设检验中作为首要的控制目标!它是谁呢? 假设检验中,遵守首先控制犯α错误原则大家都在执行这样一个原则。
α
β 对H 0的行动 H 0是真的 H 1是真的
你的 态度 接受H 0 你正确
你犯第二类错误β 拒绝H 0
你犯第一
类错误α 你正确
原因是:原假设是什么常常是明确的,而替换假设常常是模糊的。
所以,人们常把最关心的问题作为原假设提出,将较严重的错误放到了α,这就能够在假设检验中对α错误实施有效控制。
假设检验中犯两类错误的概率如下图所示:
µ=µ0 µ0 (a )
µ=µ1>µ0
µ1 (b )
注意:
(1)在假设检验中,原假设0H 与备选假设1H 的地位不对等。
检验推断是“偏向”原假设,而“歧视”备选假设的。
在应用中一定要慎重提出原假设。
(2)对于0H 的否定是有力的,且 越小,小概率事件越难于发生,一旦发生了,这种否定就越有力,也就越能说明问题。
综上所述,处理参数的假设检验问题的步骤如下:
β
α
接受H 0 拒绝H 0
(1)根据实际问题的要求,给出原假设和备择假设;
(2)给定显著性水平α0和样本容量n;
(3)确定检验统计量以及拒绝域的形式;
(4)按P{当H0为真拒绝H0}≤α0求出拒绝域;
(5)取样,根据样本观察值做出决策,是接受H0还是拒绝H0。
四、SPSS中假设检验的判定原则
在SPSS系统中,所有的假设检验(包括非参数检验)都只要求使用者记住(必须记住!)检验的原假设H0是什么,并且按照以下的准则去判断是否应该接受原假设:
若sig>α0,则接受原假设H0;若sig<α0,则拒绝原假设H0。
One-Sample T Test过程检验单个变量的均值是否与给定的常数之间存在差异。
该过程对每个检验变量给出的统计量有:均值、标准差和均值的标准误。
该过程计算每个数据值与总体均值之间差的平均值,进行该差值为0的t检验及计算该差值的置信区间,用户可以指定检验的显著性水平。
(如:0.05)
〖练习〗数据文件“公司职工.sav”,试检验假设:
H0:平均受教育年限μ=13 H1:μ≠13
H0:平均受教育年限μ=13.5 H1:μ≠13.5
H0:平均当前薪金μ=13.5 H1:μ≠13.5
H0:平均年龄μ=40 H1:μ≠40。