- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设检验的两类错误 实际情况 决定 H0为真 第一类错误 H0不真 正确
拒绝H0 接受H0
第一类错误 第二类错误
正确
第二类错误
拒真错误 取伪错误
犯两类错误的概率: P{拒绝H0|H0为真}= , P{接受H0|H0不真}= . 显著性水平 为犯第一类错误的概率. 通常计算犯第Ⅱ类错误的概率是很复杂 的,下面我们通过举例来说明
§8.1假设检验的基本概念
在本讲中,我们将讨论不同于参数估计 的另一类重要的统计推断问题. 这就是根据 样本的信息检验关于总体的某个假设是否 正确. 这类问题称作假设检验问题 . 假设检验
参数假设检验 非参数假设检验
总体分布已知, 检验关于未知参数 的某个假设
总体分布未知时的 假设检验问题
若对参数 一无所知
较大、较小是一个相对的概念,合理的界 限在何处?应由什么原则来确定?
问题归结为对差异作定量的分析,以确定 其性质.
差异可能是由抽样的随机性引起的,称为
“抽样误差”或 随机误差 这种误差反映偶然、非本质的因素所引起 的随机波动.
然而,这种随机性的波动是有一定限 度的,如果差异超过了这个限度,则我们 就不能用抽样的随机性来解释了. 必须认为这个差异反映了事物的本质差别, 即反映了生产已不正常.
即“ | u | Z 2 ”是一个小概率事件 . 得否定域 W: |u |>1.96
小概率事件在一次 试验中基本上不会 发生 .
第四步:
将样本值代入算出统计量 u的实测值, | u |=0.370<1.96 故不能拒绝H0 .
没有落入 拒绝域
这并不意味着H0一定对,只是差异 还不够显著, 不足以否定H0 .
当然也不能总认为正常,有了问题不能 及时发现,这也要造成损失. 如何处理这两者的关系,假设检验面 对的就是这种矛盾.
罐装可乐的容量按标准应在 350毫升和360毫升之间. 现在我们就来讨论这个问题.
在正常生产条件下,由于种种随机因素 的影响,每罐可乐的容量应在355毫升上下 波动. 这些因素中没有哪一个占有特殊重要 的地位. 因此,根据中心极限定理,假定每 罐容量服从正态分布是合理的.
设
66, n 36, X ~ N (66,3.6 / 36)
2
66 P(66.82 X 69.18 66)
69.18 66 66.82 66 0.6 0.6
(5.3) (1.37) 1 0.9147 0.0853
小概率事件在一次试验 中基本上不会发生.
我们不妨先假设:这个盒子里有99个白球. 现在我们从中随机摸出一个球,发现是
此时你如何判断这个假设是否成立呢?
小概率事件在一次试验 中基本上不会发生.
假设其中真有99个白球, 摸出红球的概率只有1/100, 这是小概率事件. 小概率事件在一次试验中竟然发生了,不能不 使人怀疑所作的假设. 这个例子中所使用的推理方法,可以称为
若
69, n 36, X ~ N (69,3.6 / 36)
2
69 P ( 66.82 X 69.18 69 )
69.18 69 66.82 69 0.6 0.6 (0.3) (3.63) 0.6179 0.0002 0.6177
二、两类错误 假设检验会不会犯错误呢?
由于作出结论的依据是下述
小概率原理 不是一定不发生
小概率事件在一次试验中基本上 不会发生 .
由例2可见,在给定的前提下,接受还是 拒绝原假设完全取决于样本值, 因此所作检 验可能导致以下两类错误的产生: 如果H0成立,但统计量的实测值落入否 定域,从而作出否定H0的结论,那就犯了“ 以真为假”的错误 . 如果H0不成立,但统计量的实 测值未落入否定域,从而没有作出 否定H0的结论,即接受了错误的H0 ,那就犯了“以假为真”的错误 .
也就是说,“ | U | u 2 ”是一个小概率事件. 故我们可以取拒绝域为: W: | U | u 2
u 2 , u 2 称为临界值
如果由样本值算得该统计量的实测值落入 区域W,则拒绝H0 ;否则,不能拒绝H0 .
这里所依据的逻辑是: 如果H0 是对的,那么衡量差异大小的 某个统计量落入区域 W(拒绝域) 是个小概 率事件. 如果该统计量的实测值落入W, 也就是说, H0 成立下的小概率事件发生 了,那么就认为H0不可信而否定它. 否则 我们就不能否定H0 (只好接受它).
1.96 可以确定拒绝域为
( , 67.118 ) 与 ( 68.882 , + ) 因此,接受域为(67.118, 68.882)
66 P ( 67.118 X 68.882 66 )
68.88 66 67.12 66 0.45 0.45
那么,如何判断原假设H0 是否成立呢? 由于 是正态分布的期望值,它的估计量是 样本均值 X ,因此可以根据 X 与 0的差距 | X - 0| 来判断H0 是否成立. 当 | X - 0| 较小时,可以认为H 是成立的;
0
当 | X - 0 | 较大时,应认为H0不成立,即 生产已不正常.
这样,我们可以认为X1,…,X5是取自正态 总体 N ( , 2 )的样本,当生产比较稳定时, 2 是一个常数. 现在要检验的假设是:
H0:
0( 0 = 355)
它的对立假设是:
H1: 0
在实际工作中, 往往把不轻易 否定的命题作 为原假设.
称H0为原假设(或零假设,解消假设); 称H1为备择假设(或对立假设).
在显著性假设检验问题中,由于我们控 制的是犯第一类错误的概率,因此原假设H0 与备择假设H1地位是不平等的,他们不能随 意交换,在实际问题中如何确定H0 与H1是 非常重要的。一般H0要取那个在长期实践中 受到保护的论断,这个论 假设
根据统计调查的目的, 提出 原假设H0 和备选假设H1 作出 决策
这样做显然 不行!
通常的办法是进行抽样检查.
每隔一定时间,抽查若干罐 . 如每隔1小时, 抽查5罐,得5个容量的值X1,…,X5,根 据这些值来判断生产是否正常.
如发现不正常,就应停产,找出原因, 排除故障,然后再生产;如没有问题,就 继续按规定时间再抽样,以此监督生产, 保证质量.
很明显,不能由5罐容量的数据,在把 握不大的情况下就判断生产 不正常,因为 停产的损失是很大的.
的选择要根据实际情况而定。
常取
0.1, 0.01, 0.05.
现在回到我们前面罐装可乐的例中: 在提出原假设H0后,如何作出接受和拒绝 H0的结论呢?
罐装可乐的容量按标准应在350毫 升和360毫升之间. 一批可乐出厂前应 进行抽样检查,现抽查了n罐,测得容 量为X1,X2,…,Xn,问这一批可乐的容量 是否合格?
提出假设
H0: = 355
H1: ≠ 355
X 0 ~ N(0,1) 选检验统计量 U n 它能衡量差异 | X 0 | 大小且分布已知 .
由于 已知,
对给定的显著性水平,可以在N(0,1)表 中查到分位点的值 u 2 ,使
P{| U | u 2 }
P{| U | u 2 }
在上面的例子的叙述中,我们已经初 步介绍了假设检验的基本思想和方法 . 下面,我们再结合另一个例子,进一步 说明假设检验的一般步骤 .
例2 某厂生产的螺钉,按标准强度为68/mm2, 长期实践的经验表明,其长度服从正态分布 N( , 3.62 ). 若E(X)==68,则认为这批螺钉 符合要求,某日为了检验生产螺钉的机器是否 正常,实测了9个螺钉,长度为69.0,65.3, 68.4,67.7,66.8,70.2,71.0,69.5,68.1, 问机器是否正常? 解 第一步: 提出原假设和备择假设
(6.4) (2.49)
1 0.9936 0.0064 0.0853
要同时降低两类错误的概率 , ,或 者要在 不变的条件下降低 ,需要增 加样本容量.
/2
/2
H0 真
H0 不真
当n增大时,图形变得陡峭,因此α,β都减少。
任何检验方法都不能完全排除犯错
误的可能性.理想的检验方法应使犯两类 错误的概率都很小,但在样本容量给定的 情形下,不可能使两者都很小,降低一个, 往往使另一个增大. 假设检验的指导思想是控制犯第一类 错误的概率不超过, 即只对犯第一类 错误的概率加以控制,然后,若有必要, 通过增大样本容量的方法来减少 。
注
º
关于原假设与备择假设的选取
以例2为例计算犯第二类错误的概率β
犯第Ⅰ类错误时 P(拒绝H0|H0为真) P{| u | Z 2 }
P ( X 66.824 X 69.18) 0.05
下面计算犯第Ⅱ类错误的概率
=P(接受H0|H0不真) H0不真,即 68,可能小于68,也可能大于 68, 的大小取决于 的真值的大小.
H 0 : 68 H1 : 68
第二步: 取一检验统计量,在H0成立下
求出它的分布
能衡量差异 大小且分布 已知
X 68 u ~ N (0,1) 9
对给定的显著性水平 =0.05,查表确 第三步: Z 2 Z 0.025 1.96 ,使 定临界值
P{| u | Z 2 }
/2
/2
H0 真
H0 不真
两类错误是互相关联的, 当样本容量固 定时,一类错误概率的减少导致另一类错误概 率的增加.
现增大样本容量,取n = 64, = 66,则
X ~ N (66,3.6 / 64) 仍取=0.05,则 c z z 0.025 1.96