I 假设检验21-24#
- 格式:doc
- 大小:314.00 KB
- 文档页数:4
假设检验基本步骤第一篇:假设检验基本步骤假设检验基本步骤上述抽样模拟试验表明,从同一总体中以固定n随机抽样,由于抽样误差的影响,样本均数x与总体均数μ往往不相等,且两个样本均数x1和x2也往往不相等。
因此在实际工作中遇到样本均数与总体均数间或样本均数与样本均数间不相等时,要考虑两种可能:①由于抽样误差所致;②两者来自不同总体。
如何作出判断?统计上是通过假设检验(hypothesis testing),又称显著性检验(significance test),来回答这个问题。
下面以样本均数x与总体均数μ比较的假设检验为例,介绍假设检验的基本步骤。
一、建立假设和确定检验水准假设有二。
一是无效假设(null hypothesis),符号为H0.假设两总体均数相等(μ=μ0),即样本均数x所代表的总体均数μ与假设和总体均数μ0相等。
x和μ0差别仅仅由抽样误差所致;二是备择假设(alternative hypothesis),符号为H1.二者都是根据推断的目的提出的对总体特征的假设。
这里还有双侧检验和单侧检验之分,需根据研究目的和专业知识而定:若目的是推断两总体是否不等(即是否μ≠μ0),并不关心μ>μ0还是μ<μ0,应用双侧检验,H0:μ=μ0,H1:μ≠μ0;若从专业知识已知μ>μ0,不会μ<μ0(或已知μ<μ0不会μ>μ0),或目的是推断是否μ>μ0(或μ<μ0),则用单侧检验,H0:μ=μ0,H1:u>μ0(或μ<μ0)。
一般认为双侧检验较为稳妥,故较常用。
检验水准(size of a test)亦称显著性水准(significance level),符号为α,是假设检验时发生第一类错误的概率。
α常取0.05或0.01.二、选定检验方法和计算统计量根据研究设计的类型、资料类型及分析目的选用适当的检验方法。
如配对设计的两样本均数比较,选用配对t检验;完全随机设计的两样本均数比较,选用u检验(大样本时)或t检验(小样本时)等。
假设检验(HypothesisTesting)假设检验的定义假设检验:先对总体参数提出某种假设,然后利⽤样本数据判断假设是否成⽴。
在逻辑上,假设检验采⽤了反证法,即先提出假设,再通过适当的统计学⽅法证明这个假设基本不可能是真的。
(说“基本”是因为统计得出的结果来⾃于随机样本,结论不可能是绝对的,所以我们只能根据概率上的⼀些依据进⾏相关的判断。
)假设检验依据的是⼩概率思想,即⼩概率事件在⼀次试验中基本上不会发⽣。
如果样本数据拒绝该假设,那么我们说该假设检验结果具有统计显著性。
⼀项检验结果在统计上是“显著的”,意思是指样本和总体之间的差别不是由于抽样误差或偶然⽽造成的。
假设检验的术语零假设(null hypothesis):是试验者想收集证据予以反对的假设,也称为原假设,通常记为 H0。
例如:零假设是测试版本的指标均值⼩于等于原始版本的指标均值。
备择假设(alternative hypothesis):是试验者想收集证据予以⽀持的假设,通常记为H1或 Ha。
例如:备择假设是测试版本的指标均值⼤于原始版本的指标均值。
双尾检验(two-tailed test):如果备择假设没有特定的⽅向性,并含有符号“=”,这样的检验称为双尾检验。
例如:零假设是测试版本的指标均值等于原始版本的指标均值,备择假设是测试版本的指标均值不等于原始版本的指标均值。
单尾检验(one-tailed test):如果备择假设具有特定的⽅向性,并含有符号 “>” 或 “<” ,这样的检验称为单尾检验。
单尾检验分为左尾(lower tail)和右尾(upper tail)。
例如:零假设是测试版本的指标均值⼩于等于原始版本的指标均值,备择假设是测试版本的指标均值⼤于原始版本的指标均值。
检验统计量(test statistic):⽤于假设检验计算的统计量。
例如:Z值、t值、F值、卡⽅值。
显著性⽔平(level of significance):当零假设为真时,错误拒绝零假设的临界概率,即犯第⼀类错误的最⼤概率,⽤α表⽰。
假设检验(复习)
一. 假设检验的基本概念:
1. 问题的提出: (估计:对未知参数,用样本求出具体的θˆ
) 例1:设产品的质量合格标准为:次品率
01.0≤p ,现200
21,,,ξξξξ →,经
检查发现有3件次品.问ξ合格吗?
(即:由20021,,,ξξξ 推断
01.0≤p ?)
通常使用格式: 原假设 ;
01.0:0≤p H 备择假设
01
.0:1>p H
例2:设有一批枪弹,其
),(~2
000σμN v ,其中s m 9500=μ,s m 1020=σ
储存一段时间后,初速度的均值0μ和方差20σ是否发生变化?
则
n v v v v ,,,210 →
以推断是否发生变化.即:
;950:0=μH 950
:1<μH ;
10:0=σH
10
:1≠σH
以上两例属“参数假设检验问题”(总体分布已知)
例3:设建筑材料,抗拉强度),(~2σμςN ;
(i )改变配料后,N
?
~ς
(ii )若不关心服从什么分布,而只想知道ς
是否符合标准c E ≥ς
?
则 n ςςςς,,,21 →
,推断
N H N H i ⨯
~:;~:)(10ςς c E H c E H ii <≥ςς:;:)(10
该例属“非参数假设检验问题”(分布是否相同 或 总体分布未知)
2. 假设检验的基本原理: 假设检验的基本思想是 :“小概率事件原理” ⇔ 认为在一次试验中不可能发生。
作法是:设有0H 需要检验,先假设0H 正确.在此假定下,构造一个事件A,并且
在
0H 正确下A为小概率事件.即:对于给定的α,有:α=}{0为真H A P
若n ξξξξ
,,,21 →),,,(21n x x x (一次试验)⎩⎨
⎧⇒⇒)
()
(00接受正确没发生拒绝错误发生了H A H A
注1.
α的大小由实际问题而定;
注2.考虑到“小概率事件”在一次试验中也不一定绝对不发生,一旦发生,这将 出现推断上的错误(控制的概率值
α很小).即:拒绝0H 或接受0H 不是绝对的,
而是以样本信息),,,(21n x x x 及一定的可靠程度α
-1采取的一个决策.
例:设打包机正常包装的大米)9.0,100(~2N ξ
,某天开机后检验机器工作是否正常,
便随机抽取9袋刚包装的大米,得数据:
99.3 , 98.7 , 100.5 , 101.2 , 98.3 , 99.7 , 105.1 , 102.6 , 100.5 问:打包机工作是否正常? (设为已知9.0=σ,取05
.0=α)
解: 由问题知100:;
100:0100≠=μμH H
由于ξ为
μ
的UMVUE ,所以考虑0
μξ-应很小,即:0
μξ
-较大为小概率事件.
则
k
∃ 使得
05.0}100{0=≥-为真H k P ξ
由
)1,0(~00
N n
σμξ- , 则05.0}3
9.09
9
.0100
{
0=≥
-为真H k
P ξ
有:
96.139.0975.02
05.01===-u u k
588.0=⇒k
即:当
588.0100≥-x 时,拒绝0H ,588.0100<-x 时,接受0H
则将样本空间X 划分为 0X ,1X ,即:10X X X ⋃=
其中}588.0100:),,{(10
≥-=x x x x X i n 满足 拒绝域
}588.0100:),,{(11<-=x x x x X i n 满足 接受域 0.588 即称 临界值
一般地,对
0H 、1H 问题:先找统计量),,,(21n T ξξξ ,以此构造检验法则;
对于给定的 ,得出 拒绝域 或 接受域
3.两类错误:
n ξξξ,,,21 (部分)ξ−−→−推断(总体),难免绝对不犯错误
(i)
0H 为真而拒绝0H ,即:第一类错误(拒真).控制为α=}{00为真
拒H H P α
(ii )0H 不真而接受0H ,即:第二类错误(纳伪).记为:β=}{00不真
接受H H P 下面对
α、β进行分析:
设 ),(~2
0σμξN ,
2
0σ已知.
n ξξξξ,,,21 →,在α下,
)(:;
:101
100μμμμμμ<==H H 考虑
由
α=}{00为真拒H H P 且
)1,0(~00
N n
σμξ-
有:αλσμξασμξα
α=⎭⎬⎫
⎩⎨⎧=+≥⇒=⎭
⎬⎫⎩⎨⎧≥-∆--10010000u n P u n P H H
即:{}
α
λ
ξ=≥为真0H P
又
为真0H 时,),
(~2
0n
N σμξ,
得 ξ
的密度曲线
);(00μx p 为:
又由 β=}{10为真接H H P 的含义
有
{}
β
λξ=<为真1H P 又
为真1H 时,),
(~2
1n N σμξ 得
ξ
的密度曲线
);(11μx p 为:
可以看出:① ↘ ↗ ; ↘ ↗ 即: 、 不能同时减少. ② 当分别0H 、为真1H 时,),
(~2
1,0n
N σμξ,有小大→→n
n 20
,
σ
即:两密度曲线变陡,从而α、β都变小.但充分大的样本量在实际中不可用
为此:在实际中,通常由供、需双方协商定出α;或由两类错误的后果而定.
(常取α=0.001, 0.005, 0.01, 0.05, 0.1等 便于查表的数值 ~ 标准化数值)
注:有时只限定α而忽略β,称该检验问题为显著性检验,α称为显著性水平.
α⇒β
β⇒ααβ
0的接受域
3. 假设检验(参数检验)的一般步骤:
① 根据问题的要求提出
0H 、1H ;
② 构造统计量、确定拒绝域; ③ 选定适当的
α(通常是给定),求出临界值;
④ 根据样本观测值),,,(21n x x x 确定是否拒绝
0H .
例:设
),(~2σμξN ,μ
、2
σ均未知.对给定的
α,n x x x x ,,,21 →
检验问题:0
10
0μμμμ≠:;
=:H H
当为真0H 时,构造统计量)1(~0
--=*
n t n
S x t μαμαμ=⎪⎭
⎪
⎬⎫⎪⎩⎪⎨⎧-≥-⇒-*)1(2100
n t n S x P 得 拒绝域
)}1(:),,,{(2
10
210-≥-=-*n t n S x x x x x X i n αμ满足
或 n S n t x *
-
-≥-)1(2
10αμ
注1:关于“一个正态总体μ与2
σ的检验”的拒绝域
0X ,参看P.217、P. 224表
关于“两个正态总体
μ与2σ的检验”的拒绝域0X ,参看P.229、P. 235表
注2:对于“非正态总体”的μ与2
σ的检验,通常在大样本下,作统计量的近似检验
如:设 总体为
ξ,ξD 已知.在α下,检验均值ξE :
利用统计量
)()
1,0(∞→−→−-=n N n
D E u L
ξξξ
有:αξμξαμ=⎪⎭
⎪⎬⎫⎪⎩⎪⎨⎧≥--
2100u n D P
从而得 拒绝域}:),,,{(2
10210
α
ξμ-
⋅≥-=u
n D x x x x x X i n 满足
类似地,对其它情况.如:方差的检验及两个总体的μ
与2
σ的检验等,
参看P.237~245.。