概率统计导引课件8-1假设检验基本概念
- 格式:pps
- 大小:1.11 MB
- 文档页数:28
第一节假设检验的基本概念Hypothesis Testing二、假设检验的相关概念三、假设检验的一般步骤一、假设检验的基本原理四、典型例题五、小结一、假设检验的基本原理在总体的分布函数完全未知或只知其形式、但不知其参数的情况下, 为了推断总体的某些性质, 提出某些关于总体的假设.假设检验就是“检验假设”,即根据样本对所提出的(原)假设作出判断: 是接受, 还是拒绝. (Accept or reject?)例如, 提出总体服从泊松分布的假设;.,0假设等的期望等于对于正态总体提出数学又如如何利用样本值对一个具体的假设进行检验?通常借助于直观分析和理论分析相结合的做法,其基本原理就是人们在实际问题中经常采用的所谓实际推断原理:“一个小概率事件在(孤立的)一次试验中几乎是不可能发生的”.下面结合实例来说明假设检验的基本思想.假设检验问题是统计推断的另一类重要问题. 另一类我们已知是参数估计。
实例 某车间用包装机包装大白兔糖, 包得的袋装糖重是一个随机变量, 它服从正态分布.当机器正常时, 其均值为0.5千克, 标准差为0.015千克.某日开工后为检验包装机是否正常, 随机地抽取它所包装的糖9袋, 称得净重为(千克):0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常?,的均值和标准差装糖重总体分别表示这一天袋和用X σμ分析: 均值恒定认为正常由长期实践可知, 标准差较稳定, ,015.0=σ设),015.0,(~2μNX则.未知其中μ问题: 根据样本值判断.0.50.5≠=μμ还是提出两个对立假设.:5.0:1μμμμ≠==HH和再利用已知样本作出判断是接受假设H( 拒绝假设H1) , 还是拒绝假设H0 (接受假设H1 ).如果作出的判断是接受H,即认为机器工作是正常的, 否则, 认为是不正常的.,μμ=则由于要检验的假设涉及总体均值, 故可借助于样本均值来判断--, 的无偏估计量是因为μX, || , 00不应太大则为真所以若μ-x H ),1,0(~/,00N nX H σμ-为真时当 , /||||00的大小的大小可归结为衡量衡量nx x σμμ--于是可以选定一个适当的正数k ,EX μ=.: 5.0:0100μμμμ≠==H H 和,,/ 00H k n x x 拒绝假设时满足当观察值≥-σμ .,/ ,00H k nx x 接受假设时满足当观察值反之<-σμ),1,0(~/00N nX Z H σμ-=为真时因为当由标准正态分布分位点的对称性取k =. , ,,02/002/0H z x H z x 接受时拒绝时当ααμμ<-≥-.: 5.0:0100μμμμ≠==H H 和/2,z α1α-/X P k n μσ⎧⎫-<=⎨⎬⎩⎭ 01, α<<给定一个判断标准: 使得0.05,=α在实例中若取定,96.1025.02/===zzkα则0.015,,9==σn又已知0.511,=x由样本算得 1.96,2.2/0>=-nxσμ即有于是拒绝假设H, 认为包装机工作不正常.假设检验过程如下:以上所采取的检验法是符合实际推断原理的.0.05,0.01,,==ααα一般取总是取得很小由于通常.,/,,,/,,2/0 02/几乎是不会发生的的观察值等式由一次试验得到满足不为真就可以认为如果根据实际推断原理小概率事件是一个时即为真因而当xznxHznXHαασμσμμμ≥-⎭⎬⎫⎩⎨⎧≥-=.,,/2/HHznxx因而只能接受没有理由拒绝假设则满足不等式若出现观察值ασμ<-.,,/,2/HHxznx因而拒绝正确性的的假设则我们有理由怀疑原来的观察值得到了满足不等式在一次试验中ασμ≥-二、假设检验的基本概念1.显著性水平(Significance Level)./,,,来作决定还是小于值大于等于的观察值的绝对然后按照统计量定就可以确数后选定当样本容量固定时kknxZkσμα-=,,,/Hxknxz则我们拒绝的差异是显著的与则称如果μσμ≥-=, , ,/ ,000H x k nx z 则我们接受不显著的的差异是与则称如果反之μσμ<-=.称为显著性水平数α(Significance Level),如5%等. 为置信度(Confidence level),如95%,99%等等.1α-的含义就是我们以此置信度为把握,接受原假设H 0.1α-/X P k n μσ⎧⎫-<=⎨⎬⎩⎭α/X P k n μσ⎧⎫-≥=⎨⎬⎩⎭则是以此显著水平为概率,拒绝原假设H 0.2. 检验统计量. /0称为检验统计量统计量nX Z σμ-=3. 原假设与备择假设(Null Hypothesis and Alternative Hypothesis ) 假设检验问题通常叙述为: ,下在显著性水平α . ,01”检验针对下或称为“在显著性水平H H α . , 10称为备择假设称为原假设或零假设H H. : , : 0100μμμμ≠=H H 检验假设4. 拒绝域与临界点(Critical Region and Critical Point )当检验统计量取某个区域C 中的值时, 我们拒绝原假设H 0, 则称区域C 为拒绝域, 拒绝域的边界点称为临界点.临界点往往取为某种分位点。
如在前面实例中,,||2/αz z ≥拒绝域为.,2/2/ααz z z z =-=临界点为5.两类错误及记号假设检验所作出的结论有可能是错误的. 这种错误主要有两类(Type I Error, Type II Error):(1) 当原假设H0为真, 观察值却落入拒绝域, 而作出了拒绝H的判断, 称做第一类错误, 又叫弃真错误, 这类错误是“以真为假”. 犯第一类错误的概率是显著性水平.αα/XP knμσ⎧⎫-≥=⎨⎬⎩⎭(2) 当原假设 H 0 不真, 而观察值却落入接受域, 而作出了接受 H 0 的判断, 称做第二类错误, 又叫取伪错误, 这类错误是“以假为真”..}{}{0001H P H H P H 接受或不真接受当∈μ 当样本容量 n 一定时, 若减少犯第一类错误的概率, 则犯第二类错误的概率往往增大.(欲取真而不幸取伪了)犯第二类错误的概率记为若要使犯两类错误的概率都减小, 可以增加样本容量.6. 显著性检验.: , : , , , , : : 010********为双边假设检验的假设检验称形如假设称为双边备择也可能小于可能大于表示备择假设中和在μμμμμμμμμμμ≠=≠=H H H H H 7. 双边备择假设与双边假设检验(Bilateral Testing )只对犯第一类弃真错误的概率加以控制, 而不考虑犯第二类取伪错误的概率的检验, 称为显著性检验.8.右边检验与左边检验0010: , :.H Hμμμμ≤>形如的假设检验称为右边检验0010: , :.H Hμμμμ≥<形如的假设检验称为左边检验右边检验与左边检验统称为单边检验 (Unilateral Testing) .例 北京菜市口百货商场的某店员给一顾客一根“奥运金条”,说重量为2008克。
此顾客为验证真假,将金条拿到一架精密的戥子上反复称量,共称了n 次。
称出的结果是服从正态分布的随机变量,均值未知。
于是我们可作出一对互不相容的原假设H 0 和备择假设H 1:设均值: 双边假设检验0010: , : .H H μμμμ=≠02008. μ=或者0010: , :H H μμμμ≤>右边假设检验9. 单边检验的拒绝域,,,,, ,),,(~212ασσμ给定显著性水平的样本是来自总体为已知设总体X X X X N X n ./ ,/00αασμσμz n x z z nx z -≤-=≥-=左边检验的拒绝域为右边检验的拒绝域为则证明 (1)右边检验, / 0n X Z σμ-=取检验统计量,:,: 0100μμμμ>≤H H, 10要小中的都比中的全部因μμH H, , 1往往偏大观察值为真时当x H, , 为待定正常数因此拒绝域的形式为k k x ≥} { 00H H P 为真拒绝由{}k X P H ≥=∈0μ⎭⎬⎫⎩⎨⎧-≥-=≤n k n X P //000σμσμμμ⎭⎬⎫⎩⎨⎧-≥-≤≤n k n X P //00σμσμμμ,:,: 0100μμμμ>≤H H 标准化上式不等号成立的原因是(不等式放大):, 0μμ≤因为,// 0nX n X σμσμ-≥-所以.////000⎭⎬⎫⎩⎨⎧-≥-⊂⎭⎬⎫⎩⎨⎧-≥-n k n X n k n X σμσμσμσμ事件,} {00α≤H H P 为真拒绝要控制.//00ασμσμμμ=⎭⎬⎫⎩⎨⎧-≥-≤n k n X P 只需令000//X k P n n μμμμσσ≤⎧⎫--≥⎨⎬⎩⎭⎭⎬⎫⎩⎨⎧-≥-≤≤n k n X P //00σμσμμμ故右边检验的拒绝域为),1,0(~/ N n X σμ-因为,/ 0ασμz nk =-所以,0ασμz n k +=./0ασμz n x z ≥-=即,0ασμz n x +≥.//00ασμσμμμ=⎭⎬⎫⎩⎨⎧-≥-≤n k n X P 只需令单边分位点证明(2)左边检验,:,:1μμμμ<≥HH,,/0待定拒绝域的形式为kknxz≤-=σμ}{HHP为真拒绝由,/ασμμμ=⎭⎬⎫⎩⎨⎧≤-=≥knxP,αzk-=得./ασμznxz-≤-=故左边检验的拒绝域为三、假设检验的一般步骤;,.11HH假设及备择提出原假设根据实际问题的要求;.2n以及样本容量给定显著性水平α3. 确定检验统计量以及拒绝域形式;;}{.4求出拒绝域为真拒绝按α=HHP.,.5H受还是拒绝根据样本观察值确定接取样四、典型例题.05.0?s,/cm2s./cm25.41,25,.s/cm2,s/cm40),,(2=====ασμσμ取显著水平烧率有显著的提高以往生产的推进器的燃推进器的燃烧率是否较问用新方法生产的法下总体均方差仍为设在新方得燃烧率的样本均值为测只随机取进器用新方法生产了一批推现从正态分布推进器的燃烧率服某工厂生产的固体燃料xnN例1, )( : 01烧率即假设新方法提高了燃μμ>H 这是右边检验问题, 拒绝域为 .645.1/05.00=≥-=z nx z σμ拒绝域为0 3.125/x z n μσ-==因为 ,值落在拒绝域中z . 0.05 0H 下拒绝故在显著性水平=α即认为这批推进器的燃烧率较以往有显著提高. 解 根据题意需要检验假设, )( 40: 00燃烧率即假设新方法没有提高=≤μμH 040,μ=2,σ=25n =41.25x =0.05α=0/x z z n αμσ-=≥1.645, >五、小结假设检验的基本原理、相关概念和一般步骤.真实情况(未知)所作决策接受H拒绝HH为真正确犯第I类错误H不真犯第II类错误正确假设检验的两类错误。