第5章 假设检验
- 格式:doc
- 大小:139.01 KB
- 文档页数:3
第五章假设检验本章介绍假设检验的基本概念以及参数检验与非参数检验的主要方法。
通过学习,要求:1.掌握统计检验的基本概念,理解该检验犯两类错误的可能;2.熟练掌握总体均值与总体成数指标的各种检验方法;包括:z 检验、t 检验和p-值检验;4.掌握基本的非参数检验方法,包括:符号检验、秩和检验与游程检验;5.能利用Excel 进行假设检验。
第一节假设检验概述一、假设检验的基本概念假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。
假设检验与区间估计结合起来,构成完整的统计推断内容。
假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。
本章分别讨论这两类检验方法。
进行假设检验,首先要对总体的分布函数形式或分布的某些参数做出假设,然后再根据样本数据和“小概率原理”,对假设的正确性做出判断。
这种思维方法与数学里的“反证法”很相似,“反证法”先将要证明的结论假设为不正确的,作为进一步推论的条件之一使用,最后推出矛盾的结果,以此否定事先所作的假设。
反证法所认为矛盾的结论,也就是不可能发生的事件,这种事件发生的概率为零,该事件是不能接受的现实。
其实,我们在日常生活中,不仅不肯接受概率为0的事件,而且对小概率事件,也持否定态度。
比如,虽然偶尔也有媒体报导陨石降落的消息,但人们不必担心天空降落的陨石会砸伤自己。
所谓小概率原理,即指概率很小的事件在一次试验中实际上不可能出现。
这种事件称为“实际不可能事件”。
小概率的标准是多大?这并没有绝对的标准,一般我们以一个所谓显著性水平α(0<α<1)作为小概率的界限,α的取值与实际问题的性质有关。
所以,统计检验又称显著性检验。
下面通过一个具体例子说明假设检验是怎样进行的。
【例5-1】消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。
第五章、假设检验
思考题
1.1.理解原假设与备择假设的含义,并归纳常见的几种建立原假设与备择假设的原则.
答:原假设通常是研究者想收集证据予以反对的假设;而备择假设通常是研究者想收集证据予以支持的假设。
建立两个假设的原则有:
(1)原假设和备择假设是一个完备事件组。
(2)一般先确定备择假设。
再确定原假设。
(3)等号“=”总是放在原假设上。
(4)假设的确定带有一定的主观色彩。
(5)假设检验的目的主要是收集证据来拒绝原假设。
2.第一类错误和第二类错误分别是指什么?它们发生的概率大小之间存在怎样的关系?
答:第I类错误指,当原假设为真时,作出拒绝原假设所犯的错误,其概率为α。
第II类错误指当原假设为假时,作出接受原假设所犯的错误,其概率为β。
在其他条件不变时,α增大,β减小;β增大,α减小。
3.什么是显著性水平?它对于假设检验决策的意义是什么?
答:假设检验中犯第一类错误的概率被称为显著性水平。
显著性水平通常是人们事先给出的一个值,用于检验结果的可靠性度量,但确定了显著性水平等于控制了犯第一错误的概率,但犯第二类错误的概率却是不确定的,因此作出“拒绝原假设”的结论,其可靠性是确定的,但作出“不拒绝原假设”的结论,其可靠性是难以控制的。
4.什么是p值?p值检验和统计量检验有什么不同?
答:p值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。
P值常常作为观察到的数据与原假设不一致程度的度量。
统计量检验采用事先确定显著性水平α,来控制犯第一类错误的上限,p
值可以有效地补充α提供地关于检验可靠性的有限信息。
p值检验的优点在于,
它提供了更多的信息,让人们可以选择一定的水平来评估结果是否具有统计上的显著性。
5.什么是统计上的显著性?
答:一项检验在统计上是显著的(拒绝原假设),是指这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的。
显著性的意义在于“非偶然的
练习题
3.解(1)第一类错误是,供应商提供的炸土豆片的平均重量不低于60克,但店方拒收并投诉。
(2)第二类错误是,供应商提供的炸土豆片的平均重量低于60克,但店方没有拒收。
(3)顾客会认为第二类错误很严重,而供应商会将第一类错误看得较严重。
4.解:提出假设 02:6,:6H H μμ≤>
已知 1.19,100,0.05n σα===
(1)
检验统计量为()60,1a
x Z N σ
-=
(2) 拒绝规则是:若Z z α>,拒绝0H ;否则,不拒绝0H
(3) 由 6.35x =
得:0.056.356 2.94 1.641.19
Z z -==>=,拒绝0H ,认为改进工艺能提高其平均强度。
5解: 设μ为如今每个家庭每天收看电视的平均时间(小时)
需检验的假设为:01: 6.70,: 6.70H H μμ≤ 调查的样本为:200,7.25, 2.5n x s ===
大样本下检验统计量为:0.55*14.14 3.112.5x z ==== 在0.01的显著性水平下,右侧检验的临界值为0.01 2.33z =
因为 2.33z >,拒绝0H ,可认为如今每个家庭每天收看电视的平均时间增加了
6. 解:提出假设 2222201:0.75,:0.75TV
VCR TV H H σσσ≤=> 已知:230,2,0.05n s α===
检验统计量()()2220.0522129*21032942.5570.75
VCR n s χχσ-===>= 拒绝0H ,可判定电视使用寿命的方差显著大于VCR
7. 解:提出假设:012112:5,:5H H μμμμ-=-≠
120.02,100,50n n α===,独立大样本,则检验统计量为:
514.810.45 5.1458x x z ----===- 而0.01z =2.33 因为/2z z α>,拒绝0H ,平均装配时间之差不等于5分钟
8. 解:匹配小样本 提出假设:01:,:a b a b H H μμμμ≤> 由计算得:0.625, 1.302,8,0.05d d s n α===
=,检验统计量为
()0.051.35777 1.8946d t t ===<=,不拒绝0H ,不能认为广告提高了潜在购买力的平均得分。
9. 解:提出假设:012112:,:H H ππππ≥<
已知:1122197301288,0.684,367,0.82,0.1288367
n p n p α==
===== 大样本,则检验统计量为: 112212288*0.684367*0.820.76288367
p n p n p n n ++===++
4.0476z ===-
而0.1 1.29z =,因为0.1z z <-,拒绝0H ,可认为信息追求者消极度假的比率显著小于非信息追求者。
10. 解:提出假设:2222012112:,:H H σσσσ=≠
由题计算得:112225,0.221,22,0.077n s n s ====
检验统计量为:22
12220.2218.23760.077
s F s ===,而()0.02524,21 2.37F = ()/2121,1F F n n α>--,所以拒绝0H ,认为两种机器的方差存在显著差异。