- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
由此即可得到a, b的矩估计:
ˆ x 3s, a
ˆ x 3s b
6.1.2 极(最)大似然估计
定义6.1.1 设总体的概率函数为P(x; ),是参 数 可能取值的参数空间,x1, x2 , …, xn 是样本, 将样本的联合概率函数看成 的函数,用L( ; x1, x2, …, xn) 表示,简记为L( ),
要使L( )达到最大,首先一点是示性函数取值 n n 应该为1,其次是1/ 尽可能大。由于1/ 是 的单调减函数,所以 的取值应尽可能小,但 示性函数为1决定了 不能小于x(n),由此给出 ˆx 。 的极大似然估计: (n)
§6.2 点估计的评价标准
6.2.1 相合性
我们知道,点估计是一个统计量,因此它是一个随 机变量,在样本量一定的条件下,我们不可能要求 它完全等同于参数的真实取值。但如果我们有足够 的观测值,根据格里纹科定理,随着样本量的不断 增大,经验分布函数逼近真实分布函数,因此完全 可以要求估计量随着样本量的不断增大而逼近参数 真值,这就是相合性,严格定义如下。
2
将 lnL(, 2) 分别关于两个分量求偏导并令 其为0, 即得到似然方程组
ln L( , 2 ) 1 n 2 ( xi ) 0 i 1 ln L( , 2 ) 1 n n 2 4 ( xi ) 2 0 2 2 i 1 2
ˆ 看作一个 若把依赖于样本量n的估计量 n ˆ 依概率收敛 随机变量序列,相合性就是 n
于,所以证明估计的相合性可应用依概率
收敛的性质及各种大数定律。
在判断估计的相合性时下述两个定理是很有用的。 定理6.2.1 设ˆn ˆn是 ( x1 , 的一个估计量,若 , xn )
ˆ n
ˆ2 比 ˆ1 有效。这表明用全部 显然,只要 n>1, 数据的平均估计总体均值要比只使用部分数据 更有效。
6.2.4 均方误差
无偏估计不一定比有偏估计更优。 评价一个点估计的好坏一般可以用:点估计值 ˆ 与参数真值 的距离平方的期望,这就是下式给 出的均方误差
MSE ( ) E ( )2
则
ˆ ˆ )0 lim limn Var( 是 的相合估计, n E(n ) , n
定理6.2.2 若 ˆ , , ˆ 分别是1, …, k 的相合估 n1 nk 计, =g(1 , …, k) 是1, …, k 的连续函数,则 ˆ , , ˆ ) 是 的相合估计。 ˆn g( n1 nk
2 ( x ) 1 2 i L( , ) exp 2 2 2 i 1 1 n 2 n / 2 2 (2 ) exp 2 ( xi ) 2 i 1 n
1 n n n 2 2 ln L( , ) 2 ( xi ) ln ln(2) 2 i 1 2 2
(6.1.9) (6.1.10)
解此方程组,由(6.1.9)可得 的极大似然估计为
1 n ˆ xi x n i 1
将之代入(6.1.10),得出 2的极大似然估计
n 1 ˆ 2 ( xi x )2 s *2 n i 1
利用二阶导函数矩阵的非正定性可以说明上述 估计使得似然函数取极大值。
6.2.2 无偏性
ˆ( x , , x ) 是 的一个估计, 定义6.2.2 设 ˆ 1 n
的参数空间为Θ,若对任意的∈Θ,有
ˆ) E (
则称 ˆ 是 的无偏估计,否则称为有偏估计。
例6.2.4 对任一总体而言,样本均值是总体均值的无 偏估计。当总体k阶矩存在时,样本k阶原点矩ak是 总体k阶原点矩 k的无偏估计。但对中心矩则不一 n 1 2 2 E ( s * ) ,样本方差s*2不是总 样,譬如,由于 n 体方差 2的无偏估计,对此,有如下两点说明: (1) 当样本量趋于无穷时,有E(s*2) 2, 我们称 s*2 为 2的渐近无偏估计。
其二 是如何对不同的估计进行评价,即估
计的好坏判断标准。
§6.1 点估计的几种方法
6.1.1 替换原理和矩法估计
一、矩法估计 替换原理是指用样本矩及其函数去替换相应的 总体矩及其函数,譬如: ˆ(X ) x; • 用样本均值估计总体均值E(X),即 E 2 ˆ X ) sn • 用样本方差估计总体方差Var(X),即 Var( • 用样本的 p 分位数估计总体的 p 分位数, • 用样本中位数估计总体中位数。
例6.1.6 设一个试验有三种可能结果,其发生概率 2 2 分别为 p1 , p2 2 (1 ), p3 (1 )
现做了n次试验,观测到三种结果发生的次数分 别为 n1 , n2 , n3 (n1+ n2+ n3 = n),则似然函数为
L( ) ( ) [2 (1 )] [(1 ) ]
2 sn 0.9185,
m0.5 28.6
由此给出总体均值、方差和中位数的估计分别 为: 28.695, 0.9185 和 28.6。 矩法估计的实质是用经验分布函数去替换总体 分布,其理论基础是格里纹科定理。
二、概率函数P(x,θ)已知时未知参数的矩法估计 设总体具有已知的概率函数 P(x, 1, …, k), x1, x2 , …, xn 是样本,假定总体的k阶原点矩k 存在,若1, …, k 能够表示成 1, …, k 的函数 j = j(1, …,k),则可给出诸j 的矩法估计为
2 n3 n 2 1
0
2n1 n2 2(n1 n2 n3 )
2n1 n2 2n2n3 源自2 (1 )2由于
2 ln L( )
2
2n1 n2
2
0
所以 ˆ 是极大值点。
例6.1.7 对正态总体N(, 2),θ=(, 2)是二维 参数,设有样本 x1, x2 , …, xn,则似然函数及 其对数分别为
均方误差是评价点估计的最一般的标准。我们希 望估计的均方误差越小越好。
注意到 MSE( ) Var( ) ( E )2,因此 (1) (2) 若 ˆ 是 的无偏估计,则 MSE( ) Var( ), 这说明用方差考察无偏估计有效性是合理的。 当 ˆ 不是 的无偏估计时,就要看其均方 ˆ)。 误差 MSE(
1 2
且至少有一个 ∈Θ使得上述不等号严格 ˆ 有效。 成立,则称 ˆ1 比 2
例6.2.6 设 x1, x2 , …, xn 是取自某总体的样本,记 ˆ1 x1, 总体均值为 ,总体方差为 2,则 ˆ 2 x, 都是 的无偏估计,但
ˆ1 ) 2 , Var( ˆ2 ) 2 / n Var(
• 设 x1, x2,…, xn 是来自总体 X 的一个样本,
ˆ ˆ( x , , x ) 的取值作 我们用一个统计量 1 n 为 的估计值, ˆ 称为 的点估计(量),简 称估计。在这里如何构造统计量 ˆ 并没有明 确的规定,只要它满足一定的合理性即可。 这就涉及到两个问题:
其一 是如何给出估计,即估计的方法问题;
L( ) L( ; x1, , xn ) p( x1; ) p( x2 ; ) p( xn ; )
称为样本的似然函数。
ˆ ˆ( x , , x ) 满足 如果某统计量 1 n ˆ) max L( L( )
则称 ˆ 是 的极(最)大似然估计,简记为MLE (Maximum Likelihood Estimate)。 人们通常更习惯于由对数似然函数lnL( )出发寻 找 的极大似然估计。 当L( )是可微函数时,求导是求极大似然估计最 常用的方法,对lnL( )求导更加简单些。
虽然求导函数是求极大似然估计最常用的方 法,但并不是在所有场合求导都是有效的。
例6.1.8 设 x1, x2 , …, xn 是来自均匀总体 U(0, )的样本,试求 的极大似然估计。
解 似然函数
L( ) 1
n
I
i 1
n
{0 xi }
1
n
I{ x
( n ) }
2
ˆ 1/ s 1
例 6.1.3 x1, x2, …, xn 是来自 (a,b) 上的均匀分布 U(a,b) 的样本, a 与 b 均是未知参数,这里 k=2 , 由于
ab EX , 2 (b a ) 2 Var( X ) , 12
不难推出
a EX 3Var( X ), b EX 3Var( X ),
2 n1 n2 2 n3
2
n2
2 n1 n 2
(1 )
2 n3 n2
其对数似然函数为
ln L( ) (2n1 n2 ) ln (2n3 n2 ) ln(1 ) n2 ln 2
将之关于 求导,并令其为0得到似然方程
2n1 n2
解之,得
ˆ
定义6.2.1 设 ∈Θ为未知参数,ˆn ˆn ( x1, , xn ) 是 的一个估计量,n 是样本容量,若对任 何一个ε>0,有
ˆ | ) 0 limn P(| n
ˆ 为 参数的相合估计。 则称 n
(6.2.1)
相合性被认为是对估计的一个最基本要求, 如果一个估计量, 在样本量不断增大时,它 都不能把被估参数估计到任意指定的精度, 那么这个估计是很值得怀疑的。 通常, 不 满足相合性要求的估计一般不予考虑。证明 估计的相合性一般可应用大数定律或直接由 定义来证.
ˆ (a , , a ), j j 1 k
其中
1 n j a j xi n i1
j 1, , k ,
例6.1.2 设总体服从指数分布,由于EX=1/, 即 =1/ EX,故 的矩法估计为