- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
另一方面,查表
02.02(5 68) 47.09,02.97(5 68) 92.69 2 55.8994 (47.09, ,92.69)
或者
K0 { u u1 }
t 检验法
统计量T X 0
S
n
(在H0成立下)
H0的拒绝域:K0 { |t | t1/2 (n 1)}
或者
K0 { t t1 (n 1)}
五、参数假设检验
2)H 0
:
2
2 0
;
H1
:
2
2 0
2
2/2 (n 1)
卡方检验法
统计量 2 (n 1)S 2
2 0
1. 单正态总体
设X1, , X n ~ N (, 2 )
1)H0 : 0; H1 : 0
2)H 0
:
2
2 0
;
H1
:
2
2 0
五、参数假设检验
1)H0 : 0; H1 : 0 ( 0)
U检验法
统计量U X 0
n
(在H0成立下)
H0的拒绝域:K0 { |u | u1 /2}
第3章 假设检验(1)
—— 参数假设检验
一些实际问题:
1.今年的居民消费水平比去年是否有明显的提 高?
2. 重庆的交通堵塞状况比过去5年是否有所改 善?
3. 经过三年的河水污染治理,污染情况是否有 较大的改善?
……
一、假设检验的问题
例3.1.1 某咨询公司根据过去资料与现状想了解国内旅游消费
情况。譬如,某条旅游线路的旅费X(元/人)X~N(1010, 205
i 1
4. 计算和判断。
如果(x1, , xn) K0,则拒绝H0
或者 p值 , 拒绝H0
四、关于显著水平的解释
当一个假设检验被看成是一个决策过程时,会出现
两类错误。
决 不拒绝H定0
拒绝H0
实事
H0为真
正确决定 置信度1-
第一类错误 显著水平
=1
H0为假
第二类错误 正确决定
=1
检测失败 检测的概率1-
H0 : X ~ N (, 2 ), H1 : X 不服从正态分布
问题4 某建筑装修公司想了解某城市的三个地区的乔迁居
民喜好木质地板的情况,目的是决定对这些地区应采取何种
营销策略. 该公司的调研部进行了一项调查,统计数据如下
表.
地板材料 Y
1
木质地板
69
其他
78
合计
147
地区 X
2
3
126
16
99
(2) 选择检验统计量
T X 50000 S
n
(3) 确定拒绝域 K0 { t t1 (n 1)}
已知:n 120, x 51000, s 5000, 0.05
计算:t= x 50000 s
n
1000 120 2.191, 5000
t0.95 (119) u0.95 1.65
1)
2 0.05
(24)
13.85,
2 1
/2
(n
1)
2 0.95
(24)
36.42
由此判断:不拒绝H0,说明该批钢管长度的变异性与标 准差2.4比较没有明显变化。
五、参数假设检验
非正态总体的情形
在大样本情况下,使用中心极限定理,正态总 体的均值的推断过程可以扩展到非正态总体的均值推断上。
譬如,X1, , X n ~B(1, p) H0 : p p0 , H1 : p p0
三、检验步骤
2. 由H1 选择拒绝域的形式;
1) H0 : 0,
H1 : 0
|X 0 | c
2) H0 : 0 ,
H1 : 0
X 0 c1
3) H0 : 0 ,
H1 : 0
X 0 u
n
0 0 c
c u1 /2 n
0 c1
c1 u1 n
三、检验步骤
3. 确定检验统计量及分布;
19.6” 37.4” 52.5”
20.7” 42.2” 55.4”
试以这些数据检验该路口的车流量与过去相比是否有明显改变?
( =0.05)
X
提出问题:H0 : 0.5, H1 : 0.5 (辆/秒)
解一 将1分钟分为60个小区间,1秒钟为一个区间。
每个区间到达车辆数 0
1
2
3
4
小区间个数
2.8 2.0 3.9 2.7 0.3 0.4 0.8 1.4 2.9 1.1 2.6 1.2 0.2 2.9 2.3 1.2 0.7 1.9 2.8 0.9 4.8 1.9 0.2 2.3 0.3 0.8 2.5 0.1 0.3 0.3 1.6 2.9 3.0 0.2 n = 34
提出问题:H0 : 0.5, H1 : 0.5 (辆/秒)
²)(过去),现抽查了400名游客,测得x 1250
,
问现在的旅费与过去比较是否有显著增的加变?化?
提出假设:“旅费无显著变化” 等价于 1010
“
”1,01称0 为原假设,记为H0:
另一个假设:“旅费有显著变化” 等价于“ 1010 ”,称
为备选假设,记为H1: 1010
问题2 某生产流水线生产草莓罐头,规定每只罐头标重是25 0克,现得到流水线上一组连续的15个数据如下
251, 249, 248, 250, 252, 250, 251, 250, 252, 249, 251, 250, 251, 248, 251
问这批产品是否合格?
250
H0 : 合格, H1 : 不合格
H0 : 250, H1 : 250
问题3 某次数学课程考试成绩的分布如下直方图
分数 人数 百分比
得平均每一个轮胎的寿命为51000公里,样本标准差是5000
公里。已知这种轮胎寿命服从正态分布。试根据抽样数据在
显著性水平下判断该制造商的产品是否与他所说的标准相符
合。
不相符
相符
提出问题: H0 : 50000, H1 : 50000
已知:n 120, x 51000, s 5000, 0.05
=P{拒绝H0 | H0为真}(亦称风险)
=P{不拒绝H0 | H0为假}
两类错判概率与之间的关系
与1-是直接相关的, 与1- 同时增大或减小。 假设 H0 : 0,H1 : 1( 0 )
=P{X 0 c | H0:=0}
c u1
n
=P{X 0 c | H1:=1( 0 )}
二、检验的基本思想
H0的拒绝域的形式不唯一。
K0 {(x1,
, xn ) |
| x 0 | u1 2
}
n
K0 {(x1,
, xn ) |
| x 0 |
n u1 } 2
三、检验步骤
1. 由实际问题提出H0和H1 ; 以正态分布的µ为例 “显著差异” 1) H0 : 0, H1 : 0 “显著增大” 2) H0 : 0, H1 : 0 “显著减少” 3) H0 : 0, H1 : 0
计算:u pˆ 0.147
400 0.0045 20 0.2542,
0.147(1 0.147)
0.3541
u0.975 1.96
因为样本观测值落在H0的拒绝域以外,得出结论:接受H0, 调查结果显示支持该市老年人口比重为14.7%的看法。
例5 某十字路口早上8点钟左右是交通高峰期。根据以往的 统计知,该路口每天单位时间内通过的车辆数服从泊松分布, 且车流量是0.5辆/秒。下列数据是某天该路口8点后1分钟内 车辆到达的时刻.
提出问题: H0 : 2 2.42 , H1 : 2 2.42
已知:n 25, s 2.7, 0.01
针对参数 2 选择估计量S2
且 (n 1)S 2
2 0
~
2 (n 1)
2 0
2.42
(4) 计算
2 (n 1)S 2 24 2.72 30.375
2 0
2.42
2 /2
(n
(在H0成立下)
2
2 1
/
2
(n
1)
H0的拒绝域:K0
{
2
2 / 2 } {
2
} 2 1 /2
或者
K0 { 2 2}
或者
K0
{
2
2 1
}
例2 一汽车轮胎制造商声称,他们生产的某一等级的轮胎平
均寿命在一定的汽车重量和正常行驶条件下大于50000公里。
现对这一等级的120个轮胎组成的随机样本进行了测试,测
因为样本观测值落在H0的拒绝域内,得出结论:
该制造商的声称可信,其生产的轮胎平均寿命显著地大 于50000公里。
例3 某机器加工的B型钢管的长度服从标准差为2.4公分的正 态分布。现从一批新生产的B型钢管中随机选取25根,测得 样本标准差为2.7公分。试以显著水平1%判断该批钢管长度 的变异性与标准差2.4比较是否有明显变化?
0~30 4
2.84%
31~50 51~59 60~69 70~79 80~89 90~14.18% 19.15% 18.44% 24.82% 16.31% 4.26%
其他 学生人数 最高分 最低分 全距
2
143
98 23 75
平均成绩 65.57447
问成绩分布如何?
35
18
5
1
1
n 60, x 1 (18 25 31 41) 35 0.5833.
60
60
t x 0.5 60 0.5833 0.5 60 0.9125.
0.5
0.5
另一方面,u0.975 1.96