- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
注1: 对参数θ作区间估计,就是要设法找出两个
只依赖于样本的界限(构造统计量) ˆ L 和 ˆU
一旦有了样本,就把θ估计在区间
[ˆL , ˆU ]内 .
注2: 置信水平 1- α 的频率解释: 在很多次的区间
估计的观测值中, 至少有 100 (1- α)% 次包含θ.
置信区间 (95% 的置信区间)
注: (常用点估计)
总体均值 μ 的点估计为 X ;
总体方差σ2 的点估计为 S 2 ; 总体方差σ 的点估计为 S 。
三、单个正态总体的置信区间
求参数 的置信度为 1 的置信区间.
例如: 设 X1,…, Xn 是取自 N(,2) 的样本, 2已知 ,
1、明确问题,是求哪个参数的置信区间? 置信水平是多少?
选择这样的 c, d, 使得两个尾部概率各为α/2, 即:
P ( G c ) P ( G d )/ α 2 ,
这样的置信区间称为等尾置信区间. 这是在G的分布为 偏态分布场合常采用的方法. 如:
p(x)
α/2
2 2
X~2(n )
α/2
(n )
2 1 2
(n)
x
单个正态总体置信区间常用公式 (1) 方差 2已知, 的置信区间
ˆ ˆ ˆ ˆ ( X ,..., X ) ( X ,..., X )
满足
ˆ} P { 1 L U
则称区间 [ˆL , ˆU ] 是θ 的置信水平(置信度)为1- α的置 信区间(confidence interval).
ˆL 和 ˆU 分别称为(双侧)置信下限和置信上限.
点估计值
重复构造出 的 20 个置信区间
注3: 要求θ以很大的可能被包含在区间 [ˆL , ˆU ]
ˆ ) 要尽可能大 .也就是 内,即概率 P ( L U
要求估计尽量可靠.
估计的精度要尽可能的高. 即要求区间长度
ˆU
L
尽可能短.
可靠度与精度是一对矛盾,一般是在保证可靠度 的条件下尽可能提高精度.
置信区间的意义:估计抽样误差
1 95 %
( 置信区间过宽,虽然包含 真值,但抽样误差过大: ( 置信区间也有可 能不覆盖真值: 实际工作时的情形, 只有一次抽样: 置信度高,则结论更可靠 ( )
x
)
x
) )
x x
(
有时在实际中常用的还有单侧置信区间:
ˆ ˆ( ,..., X )是统计量, 若对给定的 定义3: 设 L LX 1 n
2
注1: 满足置信度要求的 c, d 通常不唯一.若有可能, 应选
ˆ L ) 达到最短的 c 与 d , 这在 G 的分 择平均长度 E( U
布为单峰且对称分布通常容易实现.
p(x) 0.95
c c c
d
0.95
x x
d
0.95
0
d
x
c =-d
注2: 实际中, 选平均长度最短的 c, d 很难实现. 因此常
解: 选 的点估计为 X ,
2、寻找未知 参数的一个良 好估计.
3、寻找一个待估参数和样本的函数,要求其 分布为已知.
取 枢 轴 量 G
x
n
~ N(0, 1)
4、对于给定的置信水平, 根据G 的分布,确定一个区间, 使得G 取值于该区间的概率为置信水平.
对给定的置信水平1- α,查正态分布表得 u 1
则称 ˆ U 是θ 的置信水平为1- α的(单侧)置信上限.
思考: 如果一条广告说,某药品的有效率为 80%,其误差为正负3%,你相信这条广告 吗?这条广告的发布者隐瞒了什么信息?
二、置信区间的求法----枢轴量法
在求置信区间时最常用的方法是枢轴量法. 步骤如下:
1、设法构造一个样本和θ的函数 G = G( X1 ,…., Xn ,θ) , 使得 G 的分布为已知(即不依赖于未知参数). 称 G 为枢轴量.
第三节
区间估计
一、置信区间的定义
二、置信区间的求法 — 枢轴量法
三、单个正态总体参数的置信区间 四、大样本置信区间 五、两个正态总体下的置信区间
一、 区间估计的定义
定义1: 设θ是一个待估参数,对给定的α (0<α<1), 若由样本 X1, X2,…, Xn 确定的两个统计量
L L1 n U U1 n
α(0< α <1),对任意的θΘ,有Biblioteka ˆ P { } 1 L
则称 ˆ L 是θ 的置信水平为 1- α的(单侧)置信下限.
ˆ ˆ( 定义4: 设 是统计量, 若对给定的 ,..., X ) U UX 1 n
α(0<α<1), 对任意的θΘ, 有
ˆ} P { 1 U
[ x
u ,x u ] 1 2 1 2 n n
也可简记为
σ [x u1α 2 ] n
注:我们总是希望置信区间尽可能短.
在概率密度为单峰且对称的情形,一般当 c =-d 时 求得的置信区间的长度为最短.
在概率密度不对称的情形,如 分布, F分布,习惯上仍取对称(即等尾)的 分位点来计算未知参数的置信区间.
0.4 0.3 0.2 0.1 -2 u 1
2
,
-1
1
2
u 1 2
2
使
P { |
x | u } 1 1 2 n
5、变形可得 未知参数的置 信区间.
变形为
P { x u x u } 1
n
1 2
n
1 2
于是所求μ的置信度为1-α 的置信区间为
[ xu , xu ]
1 2
n
1 2
n
( 1 )
(2) 方差 2未知 , 的置信区间
S S x t ( n 1 ) ,x t ( n 1 ) 1 1 2 n n 2 ( 2 )
(3) 当 未知时, 方差 2 的置信区间
2、适当地选择两个常数 c、d, 使对给定的α(0< α<1), 有
P ( c G d )1, α
ˆ 3、将 c G d进行不等式变形化为 L
ˆ , 则有 , U
ˆ) P ( 1 L U
最后的
[ˆL , ˆU ]
就是θ 的水平为1- α的置信区间.