第六章假设检验(上)

  • 格式:pdf
  • 大小:12.51 MB
  • 文档页数:80

下载文档原格式

  / 80
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 选择检验统计量 Z • 给定显著性水平1%,查临界值Zα/2=2.58 • 计算检验统计量的观察值: z =-26 • 比较检验统计量的值|z|和临界值,作出结论——
拒绝原假设。
36
例,某公司引进一自动包装线包装大米, 设计规格为每袋大米10公斤,标准差4为 0.6公斤。随机抽取100袋大米,调查表 明:每袋大米平均重量为9.8公斤。在α为 5%的显著水平下,该自动包装线可否接 受?
1.第一类错误( “弃真”或“拒真” 错误) 原假设为真时拒绝原假设(例1,当产品本来合格时) 犯第一类错误的概率为 被称为显著性水平)
Prob (拒绝H0 / H0为真)=
2.第二类错误(“取伪”或“采伪”错误)
原假设不真时接受原假设
例如,产品销售方承诺次品率<2%,这是假的。但买方检验 时作出了信任卖方的错误结论,购买了本来不合格的产 品. 第二类错误的概率为
13
14
15
(二)确定检验统计量及其分布

检验统计量是用于假设检验问题的统计量;检验 统计量及其分布是假设检验的具体理论依据。 选择统计量的方法与参数估计相同:

• •

是大样本还是小样本 总体方差已知还是未知
常用的检验统计量有:Z、t、卡方、F统计量 等。如:
Z
xX

n
~ N (0,1)
2
2 .58
上述假设前提下,x =3.948等价于Z=26,大于 显著水平1%的临界值,说明这几乎是不可能出现的 事件。然而它发生了,这表明原假设是不合理的。
5
假设检验的特点

采用逻辑上的反证法


先认为假设为真,观察在此前提下所抽到样 本的出现是否合理。若合理则判断假设可接 受,反之拒绝假设。
11
12
单侧检验
有些情况下,我们关心的假设问题带有方向性, 有两种情况:一种是我们所考察的数据越大越 好,如产品的使用寿命、利润率等;另一种是我 们所考察的数据越小越好,如废品率、单位成本 等。这时检验的拒绝区域在分布的左侧或右侧。 如果我们提出的原假设是μ≥ 0 或μ≤ 0
H 0 :μ ≥ 0 ——左侧检验(下限检验) H 0 :μ≤ 0 ——右侧检验(上限检验)

1. 显著性水平
随 减少而增大

2. 总体参数的真值


随着总体参数的假设值与真实值的差异缩小而增 大 随着 n 增大,检验统计量的分布曲线更集中,曲 线尾端的面积 则减少。
3. 样本容量 n

4. 总体标准差
当 增大时 增大
27
假设检验的P值

——P值(P-value)是一种概率。 ——在原假设成立的假定条件下,检验统计量 等于实际观测值或更极端情况的概率,即观察 到的显著性水平(实测的显著性水平)。检验 的显著性水平是事先设定的拒绝原假设时所犯 错误的概率的最大允许值。而 P值是根据观察 样本实际计算的。因此, P值是拒绝原假设的 最小显著性水平。


α和β的关系 就好比翘翘板
24

一般说,哪一类错误带来的后果越严重、 危害越大,就应该作为首要的控制目标. 在假设检验中,一般都首先控制第一类错 误,也即控制α.

• 大家都遵守这个原则,讨论问题比较方便; • 最主要的原因是:原假设是什么非常明确,而
备择假设往往是模糊的。
25
确定α时应考虑的因素
2
第一节 假设检验的一般问题
一、假设检验的基本思想 二、假设检验的步骤 三、两类错误
3
一、假设检验的基本思想
例1. 某工厂规定产品次品率不超过4%,今天从 1000件产品中抽出10件,有4件次品,问这批产品能 否出厂(=整批产品的次品率P是否低于4% )? 提出假设:P≤4% 决策思路:
如果这一假设成立,则根据二项分布理论可算得:出现所 抽样本的概率小于1‰,即在次品率为4%的总体中抽出10 件产品有4件次品的概率是小于1 ‰ 。 这种可能性极小,但在一次抽样中发生了,显然不合理。 这种不合理性源于推论的假设前提,故上述假设不能接 受。即这批产品不能出厂。
4

例2. 某零件原平均长度为4 cm,标准差为0.02 cm。进 行工艺改革后,抽取样本:n=100,平均长度 =3.948。 问:改革后的零件长度是否有显著变化( = 零件平均长 度是否为4 cm )?
假设:改革后 x =4, 根据抽样分布理论,有:
x ~ N ( X , / n ), 即: Z ( x X ) /( / n ) 26 Z
7
假设检验必须以有关的 抽样分布理论为依据。
这样的值在一次观 察中出现的可能性 很小,... 如果这个值是 总体参数真值
在抽样观察中 出现这样的值 则很正常...
样本 观察值
总体参数 的假设值
样本估计量
8
二、假设检验的步骤
(一)提出原假设和备择假设 (二)确定检验统计量及其分布 (三)规定显著性水平 (四)计算检验统计量的值 (五)作出统计决策
37
H
0
: X 10
H
1
: X 10
x X Z ~ N ( 0 ,1 ) n
由=0.05 查标准正态分布表得临界值
Z / 2 Z 0 .025 1 .96
x X 9 . 8 10 Z0 3 . 33 / n 0 . 6 / 100
因为 Z 3.33 Z / 2 1.96 故拒绝原假设,接 受备择假设,即每袋大米的重量有显著变 化,所以不能接受这种包装线。
30
利用 P 值进行决策
若p-值 ,不能拒绝 H0 若p-值 < , 拒绝 H0
31
P值与的关系显著性水平(图)
32
第二节 正态总体参数的检验
对正态总体均值的检验
一、总体方差已知时—— z 检验法 二、总体方差未知时—— t 检验法
对正态总体方差的检验
三、小样本时—— 卡方检验法
33
一、方差已知时对正态总体均值的检验——z检 验法
Z x X
0

n
~ N ( 0 ,1 )

临界值——给定α后,查标准正态分布表而
得。
• •
单侧检验时,临界值为 - Zα 或 Zα 双侧检验时,临界值为 - Zα/2 和 Zα/2
35
(一)双侧检验

例二,改革后的零件平均长度是否为4cm?

检验的步骤:
• 提出假设
• 原假设: H0:X
= 4,备择假设: H1: X 4
17
双侧检验中的显著性水平与拒绝域
抽样分布
/2
(1 -
/2
临界值
HO的值
临界值
HO的拒绝区域 HO的不能拒绝区域
HO的拒绝区域
18
单侧检验中的显著性水平与拒绝域
抽样分布
(1 -

HO的值
临界值
样本统计量
HO的不能拒绝区域
HO的拒绝区域
19
单侧检验中的显著性水平与拒绝域

视两类错误所产生的后果轻重而定
• •

当犯第一类错误的后果严重时,则希望尽可能不犯第一 类错误,宁愿犯第二类错误,此时α宜小。 当犯第二类错误的后果严重时,则希望尽可能不犯第二 类错误,宁愿犯第一类错误,此时α不宜太小
事前对原假设的信念
• 对原假设越有信心,则越小;反之则越大
26
影响 错误的因素
1
: X 1000
x X Z ~ N ( 0 ,1 ) n
由=0.05 查标准正态分布表得临界值 Z / 2 Z 0 . 025 1 . 96
x X 105Biblioteka Baidu 1000 Z0 2 .5 n 100 / 25
因为 Z0 2.5 Z / 2 1.96 故拒绝原假设,接受备 择假设,即这批电子元件的使用寿命有显 著性差异。 40

Z检验法——利用服从标准正态分布的 Z
统计量进行假设检验的方法。 对总体均值的Z检验,主要适用于:

• 若总体呈正态分布,且总体方差已知时; • 若总体非正态分布, 但 n 30 时可近似采用Z
检验
34


H0:
X X0
;H1:
X (or or ) X 0 ,
根据抽样分布理论,总体方差已知时,对均值 的检验统计量为:
反证法带有概率性质

判断是否合理的依据统计上的小概率原理, 并非严格的逻辑证明。
6
假设检验中的小概率原理
• • • • •
小概率事件:发生概率很小的随机事件 小概率原理:小概率事件在一次试验(观察) 中几乎不可能发生。 什么样的概率才算小概率? 研究者事先确定(根据决策的风险或要求的 把握程度来决定),没有统一的界定标准。 假设检验中把这个概率称为检验的 “显著性水 平”,用 表示。
38

例,某厂生产的电子元件,根据以前的资料,
其平均使用寿命为1000小时。现从一批采用 新工艺生产的该种电子元件中随机抽出25 件,测得其样本平均使用寿命为1050小时。 已知总体的标准差为100小时,试在显著性 水平 =0.05下,检验这批电子元件的使用寿 命是否有显著性差异?
39
H 0 : X 1000 H
Prob(接受H0 / H0不真)=
22
决策结果与两类错误
实际情况 决策 H0为真 第一类错误 (拒真) ( 接受H0 正确 (1 – ) H0为不真
拒绝H0
正确 (1- 第二类错误 (采伪) (
23
和 的关系
在检验中人们总希望犯两类错误的可能性都 很小,然而,在其它条件不变的情况下, 和 不可能同时减小,就象交易中买卖双方各自承担 的风险一样。
28

P值表示所观察到的样本对原假设的支持 程度。

P值越大,在原假设为真的情况下,样本出现 的概率越大,出现这样的样本不是小概率事 件,说明原假设不能拒绝。反之, P值越小, 在原假设为真的情况下,样本出现的概率越 小,出现这样的样本属于小概率事件,而实际 却正好抽到了这样的样本,说明原假设不能成 立,应拒绝原假设。
29
P值的计算
单侧检验中,P值通常为统计量分布曲线从检验 统计量的观察值到拒绝区域这一侧的面积。 设检验的统计量为ξ,c是计算得出的检验 统计量的值。
• 左侧检验时,P值= • 右侧检验时,P值=

P{ξ c } P{ξ c }
双侧检验中,P值=单侧P值的2倍。即: P值=2P{ξ≥c },当 c 在右侧时; 或: P值=2P{ξ≤c },当 c 在左侧时。


原假设的提出应该本着“保守”或“不轻易拒绝”的原 则。
10
假设的三种形式:
0 H 0 : o , H 1 : 0 0

双侧检验 左侧检验 右侧检验
单侧检验
严格地讲,单侧检验中原假设应该用 “ ≤ ” 或 “ ≥ ” 表 示,且必须包括 “=” 。但实际检验时,只取其边界 值,该值能够拒绝,其它值更有理由拒绝。
16
(三)规定显著性水平


显著性水平——小概率,也即当原假设为真时,拒绝原假设 的概率。 给定 了,也就确定了临界值



临界值——原假设的拒绝区域与不能拒绝区域的分界 点。根据检验统计量的分布,给定的 查相应的概率分布 表,即得临界值。 如: 采用Z统计量时=0.05,对应的单测临界值 Z0.05=1.645。 临界值还与检验形式(单双侧)有关. 确定了显著性水平和临界值,也就等于建立了检验的具体规 则。 由研究者根据具体情况事先确定,如0.01, 0.05, 0.10
9
(一)提出假设

包括原假设和备择假设。 原假设(Null Hypothesis)——待检验的假设,也称 为零假设,用 H0表示。 备择假设(Alternative Hypothesis )——也称对 立假设,与原假设内容完全相反的假设。准备在拒 绝原假设后应接受的假设。用 H1表示。对某个问题 提出了原假设,也就同时给出了备择假设。
抽样分布

(1 -
临界值
HO的值
样本统计量
HO的拒绝区域
HO的不能拒绝区域
20
(四)计算检验统计量的值

根据样本资料计算出检验统计量 的观察值。
(五)作出检验结论
• 将检验统计量的值与 水平的临 界值进行比较,看其是否落在了 拒绝区内,从而得出接受或拒绝 原假设的结论。
21
三、假设检验中的两类错误
第六章 假设检验与方差分析
1
实际中的假设检验问题

产品自动生产线工作是否正常; 某种新生产方法是否会降低产品成本; 治疗某疾病的新药是否比旧药疗效更高; 厂商声称产品质量符合标准,是否可信; 学生考试成绩是否服从正态分布…
※ 假设检验——事先作出关于总体参数、分布形式 、相互关系等的命题,然后通过样本信息来判断该命 题是否成立。可分为: 参数检验和非参数检验。