第二节二一个总体参数的假设检验tt
- 格式:ppt
- 大小:1.24 MB
- 文档页数:55
ˆ ˆ对多元线性回归模型的各种检验方法对于形如Y = β 0 + β1 X 1 + β 2 X 2 + L L + β k X k + u(1)的回归模型,我们可能需要对其实施如下的检验中的一种或几种检验:一、 对单个总体参数的假设检验:t 检验在这种检验中,我们需要对模型中的某个(总体)参数是否满足虚拟假设 H 0 : β j = a j ,做出具有统计意义(即带有一定的置信度)的检验,其中 a j 为某个给 定的已知数。
特别是,当 a j =0 时,称为参数的(狭义 意义上的)显著性检验。
如果拒绝 H 0 ,说明解释变量X j 对被解释变量 Y 具有显著的线性影响,估计值 β j 才敢使用;反之,说明解释变量 X j 对被解释变量 Y 不具有显著的线性影响,估计值 β j 对我们就没有意义。
具体检验方法如下:(1) 给定虚拟假设 H 0 : β j = a j ;ˆˆˆˆˆˆˆ ˆ ((2) 计算统计量t =β j - E ( β j )Se ( β j )=β j - a jSe ( βj ) 的数值;Se ( β j ) = σC jj ,其中C jj = (X T X) -1 j +1j +1(3) 在给定的显著水平 α 下( α 不能大于 0.1 即10%,也即我们不能在置信度小于 90%以下的前提下做结论),查出双尾 t ( n - k - 1 )分布的临界值 t α / 2 ;(4) 如果出现t > t α / 2 的情况,检验结论为拒绝H 0 ;反之,无法拒绝 H 0 。
t 检验方法的关键是统计量t =β j - β j Se (βj ) 必须服从已 知的 t 分布函数。
什么情况或条件下才会这样呢?这需要我们建立的模型满足如下的条件(或假定):(1) 随机抽样性。
我们有一个含 n 次观测的随机样 { X i 1 , X i 2 ,L , X ik , Y i ): i = 1,2,L , n }。
应用统计学第九章假设检验朱佳俊博士Applied Statistics 第一节假设检验的基本问题一、假设检验的基本概念对总体的概率分布或分布参数作出某种“假设”,根据抽样得到的样本观测值,运用数理统计的分析方法,检验这种“假设”是否正确,从而决定接受或拒绝“假设”,这就是本章要讨论的假设检验问题。
1、假设定义为一个调研者或管理者对被调查总体的某些特征所做的一种假定或猜想。
是对总体参数的一种假设。
常见的是对总体均值或比例和方差的检验;在分析之前,被检验的参数将被假定取一确定值。
2、假设检验(hypothesis test)(1)概念–事先对总体参数或分布形式作出某种假设–然后利用样本信息来判断原假设是否成立(2)类型–参数假设检验–非参数假设检验(3)特点–采用逻辑上的反证法–依据统计上的小概率原理... 因此我们拒绝假设 =20... 如果这是总体的真实均值样本均值μ= 50抽样分布H0这个值不像我们应该得到的样本均值...203、假设检验的基本思想小概率原理是假设检验的基本依据,即认为小概率事件在一次试验中几乎是不可能发生的。
当进行假设检验时,先假设H 0正确,在此假设下,若小概率事件A出现的概率很小,例如P (A )=0.01,经过取样试验后,A 出现了,则违反了上述原理,我们认为这是一个不合理的结果。
4、小概率原理5、原假设和备择假设(1)原假设(null hypothesis)研究者想收集证据予以支持的假设也称“研究假设”总是有符号≠, <或>表示为H 1–H 1 :μ<某一数值,或μ>某一数值–例如, H 1 :μ< 10cm ,或μ>10cm(2)备择假设(alternative hypothesis)研究者想收集证据予以支持的假设也称“研究假设”总是有符号≠, <或>表示为H1–H1 :μ<某一数值,或μ>某一数值–例如, H1 :μ< 10cm,或μ>10cm6、双侧检验与单侧检验(1)备择假设没有特定的方向性,并含有符号“≠”的假设检验,称为双侧检验或双尾检验(two-tailed test)(2)备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailed test)–备择假设的方向为“<”,称为左侧检验–备择假设的方向为“>”,称为右侧检验双侧检验与单侧检验(假设的形式)单侧检验H1: μ> μ0H1:μ< μ0H1: μ≠μ0备择假设H: μ≤μ0H: μ≥μ0H: μ= μ0原假设右侧检验左侧检验双侧检验假设二、假设检验中的两类错误与显示性水平1、假设检验中的两类错误(1)第Ⅰ类错误(弃真错误)–原假设为真时拒绝原假设–第Ⅰ类错误的概率记为α•被称为显著性水平(2)第Ⅱ类错误(取伪错误)–原假设为假时未拒绝原假设–第Ⅱ类错误的概率记为β(Beta)2、显著性水平(significant level)(1)是一个概率值(2)原假设为真时,拒绝原假设的概率–被称为抽样分布的拒绝域(3)表示为α(alpha)–常用的α值有0.01, 0.05, 0.10(4)由研究者事先确定三、检验统计量与拒绝域(一)检验统计量(test statistic)1、根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量2、对样本估计量的标准化结果–原假设H为真–点估计量的抽样分布点估计量的抽样标准差假设值—点估计量标准化检验统计量=3.标准化的检验统计量显著性水平和拒绝域(双侧检验)抽样分布临界值临界值α/2α/2 样本统计量拒绝H 0拒绝H 01 -α1 -置信水平显著性水平和拒绝域(单侧检验)0临界值α样本统计量拒绝H 0抽样分布1 -α置信水平(二)决策规则1、给定显著性水平α,查表得出相应的临界值z α或z α/2,t α或t α/22、将检验统计量的值与α水平的临界值进行比较3、作出决策–双侧检验:I 统计量I > 临界值,拒绝H 0–左侧检验:统计量< -临界值,拒绝H 0–右侧检验:统计量> 临界值,拒绝H 0四、利用P 值进行决策(一)什么是P 值(P -value)1、在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率–双侧检验为分布中两侧面积的总和2、反映实际观测到的数据与原假设H 0之间不一致的程度3、被称为观察到的(或实测的)显著性水平4、决策规则:若p 值<α, 拒绝H 0双侧检验的P 值α/ 2α/ 2Z拒绝H 0拒绝H 0临界值计算出的样本统计量计算出的样本统计量临界值1/2 P 值1/2 P 值临界值α样本统计量拒绝H 0抽样分布1 -1 -α置信水平计算出的样本统计量P 值左侧检验的P 值临界值α拒绝H 0抽样分布 1 -1 -α置信水平计算出的样本统计量P 值右侧检验的P 值五、假设检验步骤1、陈述原假设和备择假设2、从所研究的总体中抽出一个随机样本3、确定一个适当的检验统计量,并利用样本数据算出其具体数值4、确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5、将统计量的值与临界值进行比较,作出决策–统计量的值落在拒绝域,拒绝H 0,否则不拒绝H 0–也可以直接利用P 值作出决策第二节一个总体参数的检验z 检验(单尾和双尾)z 检验(单尾和双尾)t 检验(单尾和双尾)t 检验(单尾和双尾)z 检验(单尾和双尾)z 检验(单尾和双尾)χ2 检验(单尾和双尾)χ2 检验(单尾和双尾)均值均值一个总体一个总体比率比率方差方差是z 检验x z nμσ−=否z 检验ns x z 0μ−=一、总体均值的检验σ是否已知小样本容量n大σ是否已知否t 检验ns x t 0μ−=是z 检验nx z σμ0−=(一)总体均值的检验(大样本)•1.假定条件–正态总体或非正态总体大样本(n ≥30)2.使用z 检验统计量σ2已知:σ2未知:)1,0(~0N nx z σμ−=)1,0(~0N nsx z μ−=1、总体均值的检验(σ2已知)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml ,标准差为5ml 。
对多元线性回归模型的各种检验方法对于形如LL uYXXX??????????k11k220)(1的回归模型,我们可能需要对其实施如下的检验中的一种或几种检验:一、对单个总体参数的假设检验:t检验在这种检验中,我们需要对模型中的某个(总体)?a?:,做出具有统计意参数是否满足虚拟假设H jj0a义(即带有一定的置信度)的检验,其中为某个给ja=0定的已知数。
特别是,当时,称为参数的(狭义j意义上的)显著性检验。
如果拒绝,说明解释变量H0Y?X具有显著的线性影响,估计值对被解释变量才?j jX Y不具对被解释变量敢使用;反之,说明解释变量j??对我们就没有意义。
具有显著的线性影响,估计值j体检验方法如下:a?;:)给定虚拟假设1(H?jj01.??a??E()???j j jj?t???的数值;计算统计量)(2(Se)Se)(??j j??1T?中,其X)?(XSe()?CC??1j?1jj jj j?j??0.1即(3)在给定的显著水平下(不能大于以下的前提下做90%,也即我们不能在置信度小于10%t;)t(分布的临界值双结论),查出尾1k?n??2/t?t的情况,检验结论为拒绝4)如果出现(?2/H H。
;反之,无法拒绝00????jj?t必须服从已检验方法的关键是统计量t?(Se)?j t分布函数。
什么情况或条件下才会这样呢?这需知的:要我们建立的模型满足如下的条件(或假定)n次观测的随机)随机抽样性。
我们有一个含(1????LL,X,X,nX,:1,2,,Yi?样。
这保证了误i1i i2iku差2.自身的随机性,即无自相关性,Cov(u?E(u))(u?E(u))?0。
jiji (2)条件期望值为0。
给定解释变量的任何值,误差u的期望值为零。
即有L,X)?,X,0E(uX k21L,,XX,X这也保证了误差独立于解释变量,即21uE(u)?0模型中的解释变量是外生性的,也使得。
(3)不存在完全共线性。