- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
H 0 : 100g
H1 : 100g
构造统计量(构造参数的置信区间)
A. 情形 B. 情形
x x T ( ) ( 未知) T ( ) (已知) ; s n n
T ( 2 ) ( X i )2
i 1 n
2
C. 情形 T ( , ) 1 2
0
0.05
给定 0.05, 查附表得, 0.025 1.96 显然 u 1.96 显然,检验统计量观测值 落入接受域,故接受H 0 ,即认为该日铁水含碳量达到标准。
n
5
设对某门统考课程,两个学校的考生成绩分数分别服从正态
——U检验引例2
N 分布 N (1 ,122 ),( 2 ,142 ) ,现分别从两个学校随机抽取36位考生 的成绩,算得平均成绩分别为72分和78分,问在显著性水平 0.05下,两个学校考生的平均成绩是否有显著性差异? 解:根据题意建立待检验的假设如: 0 : 1 2 ; H1 : 1 2 H (X Y) 选取检验统计量 U 2 2
2
2
36
14
2
4.49 1.96 36
故拒绝H 0,即在显著性水平 0.05 下,可以认为两个学校考 生的平均成绩有显著性差异
T检验:
针对单个正态总体参数(单样本)的检验 建立统计假设: 0 : 0 ; H1 : 0 H
显然
U
X 0
已不再是统计量,考虑到 S 2 是 2的无
2
S2
22
置信区间
设样本 X 1 , X 2 ,..., X n 来自分布函数为F ( x; )(θ
为未知参量)的总体,对于给定的常数 ∈(0,1),如果存在两个统计量1 (X1 , X 2 ,...X n) 1 与 2 (X 1 , X 2 ,...X n) 满足 P 1 2 1 , , 2 则称区间1 , 2 是参数θ 的置信水平为1- 的 和 置信区间, 1 2分别称为置信下限和置信上 1 限, - 称为置信水平。
1
可知,在H 0 成立时, ~ N (0,1) ,给定显著性水平 0.05 ,查 U 附表得 0.025 1.96 已知 x 72, y 78, n1 n2 36,则检验统
u x y n2 72 78 12
2
n1
2
n2
计量U的观测值为
1
2
n1
主讲人:樊桂兰
环化学院 化学111 2012年11月25日
假设检验在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
一、假设检验思想概述
什么是假设? 对总体参数的具体数值所做的陈述
1. 2.
总体参数包括总体数值、比率、方差等 分析之前必须陈述 先对总体的参数(或分布形式)提出某种假 设,然后利用样本信息判断假设是否成立的 过程 逻辑上运用反证法,统计上依据小概率原理
常见的正态总体参数检验方法
U检验: 2 针对单个正态总体参数(单样本)的检验:( 已知) 建立统计假设:H 0 : 0 ; H1 : 0 取检验统计量: U X 0 X 0
X
在H 0 成立下, ~ N (0,1) U 对给定的显著性水平 ,构造小概率事件 U
根据样本观测值计算出检验统计量U的观测值u,若落在拒绝域 内,则拒绝原假设 H 0,否则接受. 见例1,例2:
——U检验引例1
已知某炼铁厂的铁水含碳量(单位:%)在正常状况下服从
正态分布N(4.40,0.05^2),某日测得5炉铁水的含碳量如下: 4.43, 4.40, 4.42, 4.30, 4.35 如果标准差不变,该日铁水含碳量是否达到标准( 0.05)? 解:根据问题的特点,建立统计假设 H 0 : 1 4.40; H1 : 1 4.40 X 因为 =0.05已知,取检验统计量 U n , 由题意知 0 4.40 n 5 计算样本统计量得 x 4.362, u x 0 4.362 4.40 1.669
2
其中 n i 表示 x i 出现的频数 x 10.5 11.084 10.5 检验统计量T的观测值为 t 6.26
s/ n 0.5194/ 31
T 在 H 0 成立时, ~ t (n 1) 给定显著性水平 0.05 查附表得 t (n 1) t 0.025 (30) 2.042 2 显然 t t 0.025 (30),即检验统计量的观测值落在拒绝 域。故拒绝 H 0 ,即在显著性水平 0.05 下,认 为该车床工作不正常。
什么是假设检验?
1.
2.
小概率原理
多大概率为小概率?
在一次试验中,一个几乎不可能发生的事件的概率 在一个问题中,通常是指定一个正数,0< <1, 认为概率不超过 的事件是在一次试验中不会发生的 事件,这个 称为显著性水平(小概率); 小概率由研究者事先确定,通常可取 =0.01, 0.05 在一次试验中小概率事件一旦发生,我们就有理由 拒绝“假设”,因此显著性水平 越大越易得出有差 别的结论,越易推翻原假设。(但也要结合实际, 太大也不好)
n
u 2
使 P U u ,故拒绝域为 , u u , 2 2 2 根据样本观测值计算出检验统计量U的观测值u,若落在拒绝域内, 则拒绝原假设 ,否则接受 H0
U检验:
针对两个正态总体参数(双样本)的检验( 2 已知) 建立统计假设: 0 : 1 2 ; H1 : 1 2 H
n
X 1 0.5 S n
i i
n 由题设知: 31, x
x n
i 1
n
10.1 1 10.3 3 ... 12.0 1 11.084 31
1 n 1 2 10.1 11.0842 10.3 11.0842 3 ... 12.0 11.0842 s xi x ni n 1 i 1 31 1 0.2698
(X Y)
12 2 2 n 1 n2
2
( 1 , 2已知);
T S
2
X Y 1 1 n1 n2
2
( 1 , 2 未知)
2
S
(n 1) S1 (n2 1) S 2 1 n1 n2 2
S1
2
D. 情形
T ( 1 , 2 )
2
12
——T检验引例1
一自动车床加工零件的长度服从正态分布 N (, ),车床正常
2
时,加工零件的均值为10.5,经过一段时间后,要检验这车床是 否正常工作,为此抽取该车床加工的31个零件,测得数据如下: 零件长度/cm 10.1 10.3 10.6 11.2 11.5 11.8 12.0 频数 1 3 7 10 6 3 1 若加工零件的长度标准差不变,问此车床是否正常工作 0.05 ? 解:由于 2 未知,故采用t检验法, 建立统计假设: 0 : 10.5; H1 : 10.5 H 取检验统计量:T
抽样分布
拒绝域 /2 /2 1- /2 接受域 H0值 样本统计量 置信水平 拒绝域
临界值
临界值
T ( ) 在 H 0 成立时有以下四种分布
标准正态分布N(0,1)——情形A,C中 已知
t分布——情形A,C中 未知
X^2分布——情形B
F分布——情形D
三、假设检验的分类
参数假设检验 正态总体参数检验; u检验,t检验,x^2检验,F检验 非正态总体参数检验 非正态总体均值检验的大样本方法,指数总体 的参数检验 非参数假设检验 正态概率纸检验,皮尔逊x^2拟合检验,科尔 莫格罗夫检验,斯米尔诺夫检验,秩和检验
二、假设检验的一般步骤
A. B. C. D. E.
根据需要提出原(无效)假设H 0 和备择(对立)假设 H1 确定适当的统计量 确定显著性水平 和临界值及拒绝域 根据样本数据计算检验统计量的值(或P值) 将检验统计量与临界值比较,做出拒绝或接受原假设的 决策
什么是原假设与备择假设?
原假设和备择假设是一个完备事件组,而且相互对
立。在一项假设检验中,原假设和备择假设必有一 个,而且只有一个成立 引例:一种袋装食品,每袋标准重量为100g,为对 产量质量进行监测,以分析每袋重量是否符合要求, 如果每袋食品重量大于或小于100g,则表明生产 过程不正常,必须进行调整。试陈述检验生产过程 是否正常的原假设和备择假设? 欲收集证据予以证明“生产过程不正常”,所以建 立的原假设和备择假设为:
2 2
2
显然
(X Y)
12
n1
22
已不再是统计量,但S1 2 和 S 2 2 分别是 1 2和 2 2的无偏估计
n2
取检验统计量: T
S
X Y 1 n1 1 n2
(n 1)S1 (n2 1)S 2 2 S 1 ,S S n1 n2 2
2 2 2
T t (n1 n2 2) 在 H 0 成立下,T ~ t (n1 n2 2)对给定的显著性水平 ,构造小概率事件 2
,t (n1 2 n2 2 2)t (n1 2 n2 2 2), 使得 P T t (n1 n2 2) ,故拒绝域为 2 2 2
根据样本观测值计算出检验统计量T的观测值t,若落在拒绝域内,则拒绝原假设H 0, 否则接受。 见例题2: