当前位置:文档之家› 第五章假设检验

第五章假设检验

第五章假设检验
第五章假设检验

第五章 假设检验

第一节 假设检验中的基本概念和基本原理

一、统计假设的概念

统计假设,指的是和抽样手段联系在一起,并且依靠抽样数据来进行验证的假设。 统计假设的内容都是数量化了的,而且验证的依据都是凭借抽样调查所取得的资料,在抽取样本资料时,必须保证抽样的随机性。

假设?

??H H 10备择假设原假设

原假设,又称为零假设。它一般是根据已有的资料,或经过周密考虑后确定的、具有稳定性的、受保护的经验和看法。因此,若没有充分根据, H 0是不会被轻易否定的。

备择假设,又称为研究假设。经过抽样调查,若有充分根据否定原假设H 0,自然就得接受其逻辑对立面。原假设H 0的逻辑对立面即为备择假设。

以总体均值μ的假设检验为例,根据问题的不同,假设检验可能有三种: 1、双边检验 H 0:μμ0

=

H

1

:μμ0

2、右侧单边检验 H 0:μμ0

=

H

1

:μ>

μ0

3、左侧单边检验 H 0:μ

μ0

=

H

1

:μ<

μ

二、假设检验的基本原理——小概率原理

小概率原理可归纳为两个方面:一是可以认为小概率事件在一次观察中是不可能出现的;二是如果在一次观察中出现了小概率事件,那么,合理的想法是否定原来认为该事件具有小概率的看法。

假设检验的基本思想:经过随机抽样获得一个来自总体的样本,然后根据样本计算某个(或

某几个)统计量的数值。若在原假设H 0成立的条件下,该统计量数值的出现几乎是不可能的,就拒绝或否定原假设H 0,并接受它的逻辑对立面——备择假设H 1。反之,如果在原假设H 0成立的条件下,该统计量数值出现的可能性不是很小的话,就没有理由拒绝原假设H 0。

三、假设检验中的统计量

1、在原假设H 0成立的情况下,统计量中不应包含有未知参数,其数值应该是确定的。

2、所选用的统计量的分布应该是已知的,是有表可查的。

例如,对于正态总体均值μ的检验H 0:μ

μ0

=

,应选择的统计量为: =Z n

X σ

μ

-(σ2

已知) t =

n

S X μ-(σ2

未知)

四、显著性水平α

显著性水平α是假设检验中所规定的小概率的数量界限。也就是在原假设H 0成立的条件下,判断统计量数值的出现是否是小概率事件的标准。常用的标准有:05.0,1.0==αα或

01.0=α。

五、临界值、接受域和拒绝域

选定一个检验统计量后,在原假设H 0成立的条件下,就可画出统计量的分布。再根据给定的显著性水平α,就可确定临界值、接受域和拒绝域。

比如,对于正态总体均值μ的双边检验H 0:μ

μ0

=,在总体方差σ2

已知的情况下,我

们选择=

Z n

X σ

μ

-为统计量;根据原假设H 0:μ

μ0

=

,就可以画出如图5-1-1所示的Z 统计

量的分布。

图5-1-1 Z 统计量的分布

由于双边检验把拒绝原假设H 0的小概率事件定在了统计量分布的两侧,因此,两侧尾部面积总和所代表的概率即为显著性水平α。又由于Z 统计量的分布是对称的,所以每侧的概率都是2α。查标准正态分布表可得:

2

)(α

α=

>Z Z P ,2

)(2α

α=

-

即 )(22Z Z Z P αα<<-= α-1

根据假设检验的小概率原理,如果统计量的值Z Z Z Z c c 22αα-<>或,就应拒绝原假设

H

;反之,若统计量的值Z Z Z c 2αα<<-,就应接受原假设H 0。

因此,该双边检验以Z Z 22αα和-为临界值,两者之间的区域为接受域,两边为拒绝域。 六、双边检验和单边检验 (一)双边检验

双边检验的假设形式为:H 0:μ

μ0

=

←→H 1:μ

μ0

双边检验的拒绝域被定在了统计量分布的两侧。若给定的显著性水平为α,则每侧拒绝域的概率应各为2α。假定所选统计量为Z 统计量,则临界值Z 2α和显著性水平α有如下的关系式:

)(22Z Z Z P αα<<-=α-1

也就是说,该双边检验的拒绝域为:Z Z Z Z 22αα-<>或,如图5-1-3所示。

图5-1-3 双边检验的接受域、拒绝域

(二)单边检验 l.右侧单边检验

右侧单边检验的假设形式为:H 0:μ

μ0

=

←→H 1:μ

μ0

>

右侧单边检验把拒绝域定在了统计量分布的右侧。若给定的显著性水平为α,则统计量分布右尾的概率应为α。假定所选统计量为Z 统计量,则临界值Z α和显著性水平α有如下的关系式:

αα=>)(Z Z P

也就是说,该右侧单边检验的拒绝域为:Z Z α>,如图5-1-4所示。

图5-1-4 右侧单边检验的接受域、拒绝域

2.左侧单边检验

左侧单边检验的假设形式为:H 0:μ

μ0

=

←→H 1:μ

μ0

<

左侧单边检验把拒绝域定在了统计量分布的左侧。若给定的显著性水平为α,则统计量分布左尾的概率应为α。假定所选统计量为Z 统计量,则临界值-Z α和显著性水平α有如下的关系式:

αα=-<)(Z Z P

也就是说,该左侧单边检验的拒绝域为:Z Z α-<,如图5-1-5所示。

图5-1-5 左侧单边检验的接受域、拒绝域

第二节 假设检验的步骤和两类错误

一、假设检验的步骤

1、根据实际问题作出假设,包括原假设H 0和备择假设H 1两部分;

2、根据样本构造合适的统计量,并在原假设H 0成立的条件下确定统计量的分布;

3、根据有关要求给定显著性水平α,并根据统计量的分布求出拒绝域和临界值;

4、根据样本统计量的观测值进行判断。若样本统计量的值落入统计量分布的拒绝域,则拒绝原假设H 0,接受备择假设H 1;反之,则接受H 0。

二、假设检验的两类错误 1、弃真错误

弃真错误,又称为第一类错误,指的是否定了未知的真实状态,把正确的原假设H 0当成了假的而加以拒绝的错误。这是在拒绝原假设H 0时可能出现的错误。

犯弃真错误的概率就是显著性水平α。 2、纳伪错误

纳伪错误,又称为第二类错误,指的是接受了未知的不真实状态,把错误的原假设H 0当成了真的而加以接受的错误。这是在接受原假设H 0时可能出现的错误。

犯纳伪错误的概率β的大小是不确定的。它的数值大小取决于真实的μ和原假设中的μ

的偏离程度△μμμ0

-=。μ?越小, 犯纳伪错误的概率β越大;反之,△μ越大,β的数值就越小。(β——下图中阴影部分的面积)

在样本容量n 一定的情况下, 不可能同时减小犯两类错误的概率βα和。要想同时减小犯两类错误的概率,就只能增加样本容量n 。

第三节 单总体假设检验

一、大样本假设检验

(一)大样本总体均值μ的假设检验

在大样本情况下,总体均值μ的假设检验的统计量为:σ

μ

μ

σ

X

X n

X Z 0

-=

-=

1、双边检验

H 0

:μμ0

=

H

1

:μ

μ0

( 拒绝域为:Z Z Z Z 2αα-<>或 )

2、右侧单边检验

H 0

:μ

μ0

=

H

1

:μ>

μ

( 拒绝域为:Z Z α> )

3、左侧单边检验

H 0

:μ

μ0

=

H

1

:μ<

μ

( 拒绝域为:Z Z α-< )

图5-3-1 大样本总体均值μ的假设检验

例、某部门统计报表显示,该部门职工的人均月收入为1500元。为检查统计报表的正确性,在该部门职工中抽查了60人,抽查结果为:元,1520=X 36=S 元,问该部门统计报表中的人均月收入是否正确(05.0=α)?

解:本问题是在=α0.05下检验假设:H 0:1500=μ←→H 1:1500≠μ。 由于是大样本,所以应选用=

Z n

s X μ

-作为检验统计量,在H 0成立的条件下,Z ~)1,0(N 。查标准正态分布表可得

Z Z 025.02

=1.96。因此,该双边检验的拒绝域为:

96.196.1-<>Z Z 或。

根据抽样结果有,60

36

1500

15200

-=

-=

n

X Z σ

μ

=4.303>1.96

所以,拒绝原假设H 0,认为该部门的报表中的人均月收入不正确。

由假设检验的原理及方法可知,假设检验与区间估计其实是同一个问题的两种不同的表述方法,假设检验的接受域也正是区间估计的置信区间。

(二)大样本总体成数P 的假设检验

大样本总体成数p 的假设检验的统计量为:n

P Z P P P )

1(?0

--=

1、双边检验

H

:P

P 0

=

H 1

:P

P 0

( 拒绝域为:Z Z

Z Z 22αα-<>或 )

2、右侧单边检验

H 0

:P P 0

=

H

1:P

P 0

>

( 拒绝域为:Z Z α> )

3、左侧单边检验

H 0

:P P 0

=

H

1:P

P 0

<

( 拒绝域为:Z Z α-< )

图5-3-2 大样本总体成数P 的假设检验

例、某县近年的高考升学率都保持在30%左右,为提高升学率,该县各校进行了一系列的教学改革。为检查改革的成效,在该县今年的应届毕业生中抽查了100人,结果有38人考上大学。请问该县各校的一系列教学改革是否取得成效(05.0=α)?

解:本问题是在=α0.05下检验假设:

H

:%30=P ←→H 1:%30>P

由于是大样本,所以应选用σ

P

P P

n

pq

P P Z ???-=

-=

作为检验统计量,在H 0成立的条件下,Z ~

)1,0(N 。查标准正态分布表可得Z Z 05.0=α=1.645。因此,该右侧单边检验的拒绝域为:

645.1>Z 。

根据有关数据,得 n

P Z P P P )

1(?0

--=

=

100

%

70%30%30%38?-=1.746>1.645

所以,拒绝原假设H 0,认为该县的教学改革取得了成效。

二、小样本假设检验

在小样本情况下,检验统计量的分布与总体分布有关。 (一)单正态总体),(2

σμN 的均值检验 1、σ2

已知

总体均值μ的假设检验的统计量为: σ

μ

μ

σ

X

X n

X Z 0

-=

-=

(1)双边检验

H 0

:μμ0

=

H

1

:μ

μ0

( 拒绝域为:Z Z Z Z 22αα-<>或 )

(2)右侧单边检验

H 0

:μ

μ0

=

H

1

:μ>

μ

( 拒绝域为:Z Z α> )

(3)左侧单边检验

H 0

:μ

μ0

=

H

1

:μ<

μ

( 拒绝域为:Z Z α-< )

图5-3-3 单正态总体均值μ的假设检验(σ2

已知)

例、某厂生产的某种螺栓的直径(单位:mm )服从正态分布),20(2.12

N ,设备维修后,从新生产的产品中随机抽查20个,测得X =21mm 。若方差没有发生变化,问设备维修后,螺栓的直径有没有显著变化(05.0=α)?

解:本问题是在=α0.05下检验假设:

H

:20=μ←→H 1:20≠μ

由于是正态总体及小样本,且σ2

已知,所以应选用=

Z n

X σ

μ

-作为检验统计量,在H 0成

立的条件下,Z ~)1,0(N 。查标准正态分布表可得Z Z 025.02=α=1.96。因此,该双边检验的拒绝域为:96.196.1-<>Z Z 或。

根据抽样数据,可得 20

2.120

210

-=

-=

n

X Z σ

μ

=3.727>1.96 所以,拒绝原假设H 0,认为设备维修后螺栓的直径发生了变化。 2、σ2

未知

总体均值μ的假设检验的统计量为: σ

μ

μX

X n

S X t 0

-=

-=

(1)双边检验

H 0

:μμ0

=

H

1

:μ

μ0

( 拒绝域为:t t t t 2αα-<>或 )

(2)右侧单边检验

H 0

:μ

μ0

=

H

1

:μ>

μ

( 拒绝域为:t t α> )

(3)左侧单边检验

H 0

:μ

μ0

=

H

1

:μ<

μ

( 拒绝域为:t t α-< )

第五章假设检验

第五章 假设检验 第一节 假设检验中的基本概念和基本原理 一、统计假设的概念 统计假设,指的是和抽样手段联系在一起,并且依靠抽样数据来进行验证的假设。 统计假设的内容都是数量化了的,而且验证的依据都是凭借抽样调查所取得的资料,在抽取样本资料时,必须保证抽样的随机性。 假设? ??H H 10备择假设原假设 原假设,又称为零假设。它一般是根据已有的资料,或经过周密考虑后确定的、具有稳定性的、受保护的经验和看法。因此,若没有充分根据, H 0是不会被轻易否定的。 备择假设,又称为研究假设。经过抽样调查,若有充分根据否定原假设H 0,自然就得接受其逻辑对立面。原假设H 0的逻辑对立面即为备择假设。 以总体均值μ的假设检验为例,根据问题的不同,假设检验可能有三种: 1、双边检验 H 0:μμ0 = H 1 :μμ0 ≠ 2、右侧单边检验 H 0:μμ0 = H 1 :μ> μ0 3、左侧单边检验 H 0:μ μ0 = H 1 :μ< μ 二、假设检验的基本原理——小概率原理 小概率原理可归纳为两个方面:一是可以认为小概率事件在一次观察中是不可能出现的;二是如果在一次观察中出现了小概率事件,那么,合理的想法是否定原来认为该事件具有小概率的看法。 假设检验的基本思想:经过随机抽样获得一个来自总体的样本,然后根据样本计算某个(或

某几个)统计量的数值。若在原假设H 0成立的条件下,该统计量数值的出现几乎是不可能的,就拒绝或否定原假设H 0,并接受它的逻辑对立面——备择假设H 1。反之,如果在原假设H 0成立的条件下,该统计量数值出现的可能性不是很小的话,就没有理由拒绝原假设H 0。 三、假设检验中的统计量 1、在原假设H 0成立的情况下,统计量中不应包含有未知参数,其数值应该是确定的。 2、所选用的统计量的分布应该是已知的,是有表可查的。 例如,对于正态总体均值μ的检验H 0:μ μ0 = ,应选择的统计量为: =Z n X σ μ -(σ2 已知) t = n S X μ-(σ2 未知) 四、显著性水平α 显著性水平α是假设检验中所规定的小概率的数量界限。也就是在原假设H 0成立的条件下,判断统计量数值的出现是否是小概率事件的标准。常用的标准有:05.0,1.0==αα或 01.0=α。 五、临界值、接受域和拒绝域 选定一个检验统计量后,在原假设H 0成立的条件下,就可画出统计量的分布。再根据给定的显著性水平α,就可确定临界值、接受域和拒绝域。 比如,对于正态总体均值μ的双边检验H 0:μ μ0 =,在总体方差σ2 已知的情况下,我 们选择= Z n X σ μ -为统计量;根据原假设H 0:μ μ0 = ,就可以画出如图5-1-1所示的Z 统计 量的分布。

第五章+统计学教案(假设检验)

第五章+统计学教案(假设检验)参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数 进行推断。前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计 的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证, 从而作出真假判断。通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者 则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。 通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概 念;明确在假设检验中可能犯的两种错误,以及这两种错误之间的联系;熟练掌握总体均值和总体成数 的检验方法,主要是 Z 检验和 t 检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。 2 一、假设检验概述与基本概念 1、假设检验概述 2、假设检验的有关基本概念 二、总体参数检验 1、总体平均数的检验 2、总体成数的检验

3、总体方差的检验 三、总体非参数检验 1、符号检验 2、秩和检验 3、游程检验 一、假设检验的有关基本概念; 二、总体平均数与总体成数的检验; 三、非参数检验; 一、假设检验的基本思路与有关概念; 二、两类错误的理解及其关系; 一、假设检验概述 假设检验:利用统计方法检验一个事先所作出的假设的真伪,这一假设称为统计假设,对这一假设 所作出的检验就是假设检验。 基本思路:首先,对总体参数作出某种假设,并假定它是成立的。然后,根据样本得到的信息(统 计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个 假设。 所谓合理性,就是看是否在一次的观察中出现了小概率事件。 小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。这种事件可以称其 为“实际不可能事件”。 二、假设检验的基本概念

第5章 假设检验

第五章、假设检验 思考题 1.1.理解原假设与备择假设的含义,并归纳常见的几种建立原假设与备择假设的原则. 答:原假设通常是研究者想收集证据予以反对的假设;而备择假设通常是研究者想收集证据予以支持的假设。建立两个假设的原则有: (1)原假设和备择假设是一个完备事件组。(2)一般先确定备择假设。再确定原假设。(3)等号“=”总是放在原假设上。(4)假设的确定带有一定的主观色彩。(5)假设检验的目的主要是收集证据来拒绝原假设。 2.第一类错误和第二类错误分别是指什么?它们发生的概率大小之间存在怎样的关系? 答:第I类错误指,当原假设为真时,作出拒绝原假设所犯的错误,其概率为α。第II类错误指当原假设为假时,作出接受原假设所犯的错误,其概率为β。在其他条件不变时,α增大,β减小;β增大,α减小。 3.什么是显著性水平?它对于假设检验决策的意义是什么? 答:假设检验中犯第一类错误的概率被称为显著性水平。显著性水平通常是人们事先给出的一个值,用于检验结果的可靠性度量,但确定了显著性水平等于控制了犯第一错误的概率,但犯第二类错误的概率却是不确定的,因此作出“拒绝原假设”的结论,其可靠性是确定的,但作出“不拒绝原假设”的结论,其可靠性是难以控制的。 4.什么是p值?p值检验和统计量检验有什么不同? 答:p值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。P值常常作为观察到的数据与原假设不一致程度的度量。统计量检验采用事先确定显著性水平α,来控制犯第一类错误的上限,p 值可以有效地补充α提供地关于检验可靠性的有限信息。p值检验的优点在于, 它提供了更多的信息,让人们可以选择一定的水平来评估结果是否具有统计上的显著性。 5.什么是统计上的显著性? 答:一项检验在统计上是显著的(拒绝原假设),是指这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的。显著性的意义在于“非偶然的 练习题 3.解(1)第一类错误是,供应商提供的炸土豆片的平均重量不低于60克,但店方拒收并投诉。 (2)第二类错误是,供应商提供的炸土豆片的平均重量低于60克,但店方没有拒收。

第五章 假设检验

第五章假设检验 本章介绍假设检验的基本概念以及参数检验与非参数检验的主要方法。通过学习,要求:1.掌握统计检验的基本概念,理解该检验犯两类错误的可能;2.熟练掌握总体均值与总体成数指标的各种检验方法;包括:z检验、t检验和p-值检验;4.掌握基本的非参数检验方法,包括:符号检验、秩和检验与游程检验;5.能利用Excel进行假设检验。 第一节假设检验概述 一、假设检验的基本概念 假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。假设检验与区间估计结合起来,构成完整的统计推断内容。假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。本章分别讨论这两类检验方法。 进行假设检验,首先要对总体的分布函数形式或分布的某些参数做出假设,然后再根据样本数据和“小概率原理”,对假设的正确性做出判断。这种思维方法与数学里的“反证法”很相似,“反证法”先将要证明的结论假设为不正确的,作为进一步推论的条件之一使用,最后推出矛盾的结果,以此否定事先所作的假设。反证法所认为矛盾的结论,也就是不可能发生的事件,这种事件发生的概率为零,该事件是不能接受的现实。其实,我们在日常生活中,不仅不肯接受概率为0的事件,而且对小概率事件,也持否定态度。比如,虽然偶尔也有媒体报导陨石降落的消息,但人们不必担心天空降落的陨石会砸伤自己。 所谓小概率原理,即指概率很小的事件在一次试验中实际上不可能出现。这种事件称为“实际不可能事件”。 小概率的标准是多大?这并没有绝对的标准,一般我们以一个所谓显著性水平α(0<α<1)作为小概率的界限,α的取值与实际问题的性质有关。所以,统计检验又称显著性检验。 下面通过一个具体例子说明假设检验是怎样进行的。 【例5-1】消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品,测试发现平均含量为248毫升,小于250毫升。这是生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢? 上述例子中,消费者协会实际要进行的是一项统计检验工作,检验总体平均容量是否等于包装上注明的250毫升。即,检验总体平均μ=250是否成立。这就是一个原假设(null H表示,即: hypothesis),通常用0 H:μ=250 H,备选假设是在原假设被否定时与原假设对立的是备选假设(alternative hypothesis)1 另一种可能成立的结论。备选假设比原假设还重要,这要由实际问题来确定,一般把期望出 现的结论作为备选假设。上例中可能的备选假设有三种:

第五章 假设检验的功效与样本量

第五章 假设检验的功效与样本量 ? 当假设检验不拒绝H 0时,推断正确的概率称为检验功效。 ? 临床科研中不时遇到假设检验无统计学意义,此时,很有必要对检验功效作出评价。 5.1 两类错误与功效 1. 两类错误的概率 H 0: μ=μ0, H 1: μ>μ0 (5.1) (略) Z =n X σμ0- (5.2) (略) ? 任何假设检验都可能出现两类错误,用两个概率来度量 第Ⅰ类错误概率=P(拒绝H 0|H 0为真)≤α (5.3) 第Ⅱ类错误概率=P(不拒绝H 0|H 1为真)≤β (5.4a) 也可以理解为 第Ⅱ类错误概率=P(不拒绝H 0|H 0为假)≤β (5.4b) ? 如果将诊断是否患有某病也视为一个假设检验问题: H 0:无病, H 1:有病 第Ⅰ类错误:假阳性∕误诊,概率 P(阳性|无病) (α) 第Ⅱ类错误:假阴性∕漏诊,概率 P(阴性|有病) (β) ? 两类错误的背景: 拒绝H 0时可能犯第Ⅰ类错误 不拒绝H 0时可能犯第Ⅱ类错误 ? 两类错误的后果: 第Ⅰ类错误可能将“真实无效误作有效”∕误诊 第Ⅱ类错误可能将“真实有效误作无效”∕漏诊 ? 一般α, β的数值要在科研设计时事先确定 2. 功效 (power) ? 假设检验发现真实差异的功效就不低于1-β,即 检验功效=P(拒绝H 0|H 1为真)≥1-β (5.5) 检验功效=P(拒绝H 0|H 0为假)≥1-β (5.5) ? 功效就是真实有效的药物被发现的概率∕疾病被诊断出 来的概率 5.2 影响功效的四要素 ? 假设检验的功效至少受四个要素的影响,参看(5.2)式 n X σμ0- ≥Z α (5.6) ? 功效的影响因素为:δ=0μ-x ,σ,n ,α X ≥μ0+Z αn σ (5.7) (略) ? 现用X 分布图形来定性地讨论四要素对功效的影响 1. 客观差异越大,功效越大

第5章 假设检验课后习题解答

第五章 假设检验 一、选择题 1.单项选择题 (1)将由显著性水平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性水平的1/2,这是( B )。 A.单侧检验 B.双侧检验 C.右单侧检验 D.左单侧检验 (2)检验功效定义为( B )。 A.原假设为真时将其接受的概率 B.原假设不真时将其舍弃的概率 C.原假设为真时将其舍弃的概率 D.原假设不真时将其接受的概率 (3)符号检验中,(+)号的个数与(-)号的个数相差较远时,意味着( C )。 A.存在试验误差(随机误差) B.存在条件误差 C.不存在什么误差 D.既有抽样误差,也有条件误差 (4)得出两总体的样本数据如下: 甲:8,6,10,7,8; 乙:5,11,6,9,7,10 秩和检验中,秩和最大可能值是( C )。 A.15 B.48 C.45 D.66 2.多项选择题 (1)显著性水平与检验拒绝域的关系是( ABD )。 A.显著性水平提高(α变小),意味着拒绝域缩小 B.显著性水平降低,意味着拒绝域扩大 C.显著性水平提高,意味着拒绝域扩大 D.显著性水平降低,意味着拒绝域扩大化 E.显著性水平提高或降低,不影响拒绝域的变化 (2)β错误( ACDE )。 A.是在原假设不真实的条件下发生的 B.是在原假设真实的条件下发生的 C.决定于原假设与实际值之间的差距 D.原假设与实际值之间的差距越大,犯β错误的可能性就越小 E.原假设与实际值之间的差距越小,犯β错误的可能性就越大 二、计算题 1.某牌号彩电规定无故障时间为10000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,

测得平均无故障时间为10150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)? 解:假设检验为H 0:μ0=10000,H 1:μ0<10000(使用寿命应该使用单侧检验)。n =100可近似采用正态分布的检验统计量z α=0.01水平下的反查正态概率表得到临界值2.34到2.36之间 (因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。计算统计量值3 z = =。因为z =3>2.36(>2.34),所以拒绝原假设。 2.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件,测得平均重量为820克,标准差为60克,试以显著性水平α=0.01与α=0.05,分别检验这批产品的平均重量是否是800克。 解:假设检验为H 0:μ0=800,H 1:μ0≠800(产品重量应该使用双侧检验)。采用t 分布的检验统计量 t = 。查出α=0.05和0.01两个水平下的临界值(df =n -1=15)为2.131和2.947。t =1.667。因为 2.131 2.947t <<,所以在两个水平下都接受原假设。 3.某市全部职工中,平常订阅某种报纸的占40%,最近从订阅率来看似乎出现降低的现象,随机抽200户职工家庭进行调查,有76户职工订阅该报纸,问报纸的订阅率是否显著降低(α=0.05)? 解:假设检验为H 0:P =40%,H 1:P <40%。采用成数检验统计量 z = α=0.05 水平下的临界值为1.64和1.65之间。计算统计量值 0.577z = ≈?,z =-0.577>- 1.64,所以接受原假设。p 值为0.48和0.476之间[因为本题为单侧检验,值p ()() 12F z =?]。显然 p 值>0.05,所以接受原假设。 4.某加油站经理希望了解驾车人士在该加油站的加油习惯。在一周内,他随机地抽取100名驾车人士调查,得到如下结果:平均加油量等于13.5加仑,样本标准差是3.2加仑,有19人购买无铅汽油。试问: (1)以0.05的显著性水平,是否有证据说明平均加油量并非12加仑? (2)计算(1)的p -值; (3)以0.05的显著性水平来说,是否有证据说明少于20%的驾车者购买无铅汽油? (4)计算(3)的p -值; (5)在加油量服从正态分布假设下,若样本容量为25,计算(1)和(2) 。

第五章 假设检验

第五章 假设检验 一、单项选择题 1、按设计标准,某自动食品包装及所包装食品的平均每袋中量应为500克。若要检验该机实际运行状况是否符合设计标准,应该采用( )。 A 、左侧检验 B 、右侧检验 C 、双侧检验 D 、左侧检验或右侧检验 2、假设检验中,如果原假设为真,而根据样本所得到的检验结论是否定原假设,则可认为( )。 A 、抽样是不科学的 B 、检验结论是正确的 C 、犯了第一类错误 D 、犯了第二类错误 3、当样本统计量的观察值未落入原假设的拒绝域时,表示( )。 A 、可以放心地接受原假设 B 、没有充足的理由否定与原假设 C 、没有充足的理由否定备择假设 D 、备择假设是错误的 4、进行假设检验时,在其它条件不变的情况下,增加样本量,检验结论犯两类错误的概率会( )。 A 、都减少 B 、都增大 C 、都不变 D 、一个增大一个减小 5、关于检验统计量,下列说法中错误的是( )。 A 、检验统计量是样本的函数 B 、检验统计量包含未知总体参数 C 、在原假设成立的前提下,检验统计量的分布是明确可知的 D 、检验同一总体参数可以用多个不同的检验统计量 6、某地方煤矿每月发生事故的平均次数为5次,企业准备制定一项新的安全生产计划,希望新计划能减少事故次数。用来检验这一计划有效性的原假设和备择假设应为( )。 A 、原假设:μ≥5;备择假设:μ< 5。 B 、原假设:μ= 5;备择假设:μ≠5。 C 、原假设:μ≠5;备择假设:μ= 5。 D 、原假设:μ≤5;备择假设:μ> 5。 7、在假设检验中,不拒绝原假设意味着( )。 A 、原假设肯定是正确的。 B 、没有证据证明原假设是错误的。 C 、原假设肯定是错误的。 D 、没有证据证明原假设是正确的。 8、从正态总体中随机抽取一个样本容量n=100的随机样本,计算得到该样本的均值17 X ,样本修正方差的标准差为9。假定总体方差已知,为121。要检验总体均值是否为20,则所用统计量的值为( )。 A 、-0.333。 B 、-3.333。 C 、-2.727。 D 、-3.317。 9、在假设检验中,原假设和备择假设( )。 A 、只有一个成立而且必有一个成立。 B 、都有可能成立。 C 、都有可能不成立。 D 、原假设一定成立,备择假设不一定成立。

第5章 假设检验思考与练习参考答案

第5章 假设检验 思考与练习参考答案 一、最佳选择题 1. 样本均数比较作t 检验时,分别取以下检验水准,以( E )所取Ⅱ类错误最小。 A.0.01α= B. 0.05α= C. 0.10α= D. 0.20α= E. 0.30α= 2. 在单组样本均数与一个已知的总体均数比较的假设检验中,结果t = 3.24,t 0.05,v =2.086, t 0.01,v =2.845。正确的结论是( E )。 A. 此样本均数与该已知总体均数不同 B. 此样本均数与该已知总体均数差异很大 C. 此样本均数所对应的总体均数与该已知总体均数差异很大 D. 此样本均数所对应的总体均数与该已知总体均数相同 E. 此样本均数所对应的总体均数与该已知总体均数不同 3. 假设检验的步骤是( A )。 A. 建立假设,选择和计算统计量,确定P 值和判断结果 B. 建立无效假设,建立备择假设,确定检验水准 C. 确定单侧检验或双侧检验,选择t 检验或Z 检验,估计Ⅰ类错误和Ⅱ类错误 D. 计算统计量,确定P 值,作出推断结论 E. 以上都不对 4. 作单组样本均数与一个已知的总体均数比较的t 检验时,正确的理解是( C )。 A. 统计量t 越大,说明两总体均数差别越大 B. 统计量t 越大,说明两总体均数差别越小 C. 统计量t 越大,越有理由认为两总体均数不相等 D. P 值就是α E. P 值不是α,且总是比α小 5. 下列( E )不是检验功效的影响因素的是: A. 总体标准差σ B. 容许误差δ C. 样本含量n D. Ⅰ类错误α E. Ⅱ类错误β 二、思考题 1.试述假设检验中α与P 的联系与区别。 答:α值是决策者事先确定的一个小的概率值。 P 值是在0H 成立的条件下,出现当前检验统计量以及更极端状况的概率。 P ≤α时,拒绝0H 假设。

第五章统计估计和假设检验

第五章统计估计和假设检验 第五章统计估计和假设检验统计学的基本问题就是根据样本所提供的信息对总体的分布以及分布的数字特征作出统计推断。统计推断包括两大部分:一是统计估计,二是假设检验。 统计估计问题就是根据样本的数字特征来估计总体参数的数字特征,因此通常也称作参数估计。参数估计根据所得出结论的方式不同有两种形式:点估计和区间估计。 假设检验就是对关于总体分布的一些数字特征或分布函数所做的假设进行检验,以判断其正确性。假设检验也分为两类:一类是对总体分布的一些数字特征进行检验,称为参数假设检验; 另一类是要求根据样本所提供的信息对关于分布函数的假设进行检验,此时只检验分布,而不对参数作检验,这称作非参数的假设检验。非参数检验将在第六章进行讨论,本章着重讨论参数检验。 第一节点估计一、点估计的极大似然法点估计就是以单个数据对总体参数值作出估计。若未知的总体参数为,这时是一个未知的常数。我们根据抽样样本的观察值构造一个统计量()来估计总体参数。由于抽样的随机性,统计量是一个随机变量。点估计就是将的具体值作为的估计值。显然,这样做必然会有误差产生。这种误差就称为抽样误差。 极大似然法是一种对参数点估计的重要方法之一。我们先用一个例子说明其原理。 例5-1。设有一批产品,质量上分为正品与次品。产品的次品率有两种估计:0.1和0.4,今随机抽样15件产品,发现只有一件是次品。现根据这一抽样情况,来决定用哪一种次品率来估计更为可靠呢?记A =“抽取15件产品,只有一件是次品”,设抽得正品用X=0,抽得次品用X=1来表示。抽样结果只有X=0 与X=1 两种情形,于是,可得事件A发生的概率为:

第5章 假设检验习题

第五章假设检验 思考与练习 一、单项选择题 1.将由显著性水平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性水平的二分之一,这是(b )。 a. 单侧检验 b.双侧检验 c.右侧检验 d.左侧检验 2.检验功效定义为(b )。 a. 原假设为真时将其接受的概率 b. 原假设不真时将其舍弃的概率 c. 原假设为真时将其舍弃的概率 d. 原假设不真时将其接受的概率 3.符号检验中,(+)号的个数与(-)号的个数相差较远时,意味着(c )。 a.存在试验误差(随机误差) b.存在着条件误差 c.不存在什么误差 d.既有抽样误差,也有条件误差 4.得出两总体的样本数据如下: 甲:8,6,10,7,8 乙:5,11,6,9,7,10 秩和检验中,秩和最大可能值是(c )。 126

a. 15 b. 48 c. 45 d. 66 二、多项选择题 1.显著性水平与检验拒绝域关系(a b d ) a. 显著性水平提高(α变小),意味着拒绝域缩小 b. 显著性水平降低,意味着拒绝域扩大 c. 显著性水平提高,意味着拒绝域扩大 d. 显著性水平降低,意味着拒绝域扩大化 e. 显著性水平提高或降低,不影响拒绝域的变化 2. β错误(a c d e ) a. 是在原假设不真实的条件下发生 b. 是在原假设真实的条件下发生 c. 决定于原假设与真实值之间的差距 d. 原假设与真实值之间的差距越大,犯β错误的可能性就越小 e. 原假设与真实值之间的差距越小,犯β错误的可能性就越大 三、计算题 1.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件, 127

128 测得平均重量为820克,标准差为60克,试以显著性水平α=0.01与α=0.05,分别检验这批产品的平均重量是否是800克。 解:假设检验为800:,800:0100≠=μμH H (产品重量应该使用双侧检验)。采用t 分布的检验统计量n x t /0 σμ-= 。查出α=0.05和0.01两个水 平下的临界值(df=n-1=15)为2.131和2.947 。 1.33t = =。因为 t <2.131<2.947,所以在两个水平下都接受原假设。 2.某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10 150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)? 解:假设检验为10000:,10000:0100>=μμH H (使用寿命有无显著增加,应该使用右侧检验)。n=100可近似采用正态分布的检验统计量 n x z /0 σμ-= 。查出α=0.01水平下的反查正态概率表得到临界值2.32到 2.34之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。计算统计量值 3100 /50010000 10150=-= z 。因为z=3>2.34(>2.32),所以拒绝原假设,无故障

第5章 统计假设检验练习题及答案

实验报告——第5章统计假设检验 姓名杨秀娟班级人力10001 学号 【实验1】 某外企对员工英语水平进行调查,开发部门总结该部门员工英语水平很高,如果按照英语六级考试标准考核,一般平均分为75分。现从开发部门雇员中随机选出11人参加考试,得分如下:80,81,72,60,78,65,56,79,77,87,76 请问该开发部门的英语水平是否真的很高(即高于75分,且差异显著) 【解】 (1)数据和变量说明 本题所用数据是:外企英语六级考试成绩样本 该文件为11个样本,1个变量,如变量视图 (2)操作方法 (3)结果报告

上图为单样本t检验表,第一行注明了用于比较的已知的总体均数为75,下面从左到右依次为t值(t)、自由度(df)、P值(Sig)、两均数的差值、差值的95%可信区间。 由上表可知,t= , P=, P>,接受Ho,与平均成绩75相等,无显著差异,因此,该开发部门的英语水平不是真的很高。 【实验2】 以下是对某产品促销团队进行培训前后的销售业绩数据,试分析该培训是否产生了显著效果。 表5-20 培训前后销售业绩数据 序号123456789 培训前677074977488827185 培训后786778987687867895【解】 (1)数据和变量说明 本文件有2个变量,9个数据

(2)操作方法 (3)结果报告 由上表可知, P=, P<,不接受无效假设,有显著差异,所以该培训产生了显著效果。

【实验3】 饲养队制定了两种喂养方案喂猪,希望通过试验了解一下不同喂养方案的喂养效果。 方案一:用一只猪喂不同的饲料所测得的体内钙留存量数据如下: 表5-21 方案一喂养数据 方案二:甲队有11只猪喂饲料1,乙队有9只猪喂饲料2,所得的钙留存量数据如下: 表5-22方案二喂养数据 请选用恰当方法对上述两种方案所获得的数据进行分析,研究不同饲料是否使小猪体内钙留存量有显著不同。 【解】 方案一 (1)数据和变量说明 答:9个数据,2个变量 (2)操作方法

相关主题
文本预览
相关文档 最新文档