第3章 参数估计理论
- 格式:doc
- 大小:1.75 MB
- 文档页数:30
第3章 参数估计的基本理论信号检测:通过准则来判断信号有无;参数估计:由观测量来估计出信号的参数;解决1)用什么方法求取参数,2)如何评价估计质量或者效果严格来讲,这一章研究的是参数的统计估计方法,它是数理统计的一个分支。
推荐两本参考书高等教育出版社《数理统计导论》,《Nonlinear Parameter Estimation 》。
我们首先从一个估计问题入手,来了解参数估计的基本概念。
3.1 估计的基本概念3.1.1 估计问题对于观察值x 是信号s 和噪声n 叠加的情况:()x s n θ=+其中θ是信号s 的参数,或θ就是信号本身。
若能找到一个函数()f x ,利用()12,,N f x x x 可以得到参数θ的估计值 θ,相对估计值 θ,θ称为参数的真值。
则称()12,,N f x x x 为参数θ的一个估计量。
记作 ()12,,Nf x x x θ= 。
在上面的方程中,去掉n 实际上是一个多元方程求解问题。
这时,如果把n 看作是一种干扰或摄动,那么就可以用解确定性方程的方法来得出()f x 。
但是我们要研究的是参数的统计估计方法,所以上面的描述并不适合我们的讨论。
下面给出估计的统计问题描述。
(点估计)设随机变量x 具有某一已知函数形式的概率密度函数,但是该函数依赖于未知参数θ,Ω∈θ ,Ω称为参数空间。
因此可以把x 的概率密度函数表示为一个函数族);(θx p 。
N x x x ,,,21 表示随机样本,其分布取自函数族);(θx p 的某一成员,问题是求统计量 ()12,,Nf x x x θ= ,作为参数θ的一个估计量。
以上就是用统计的语言给出的参数估计问题的描述。
数。
统计量的两个特征:1,随机变量的函数,因此也是随机变量;2,不依赖于未知参数,因此当我们得到随机变量的一组抽样,就可以计算得到统计量的值。
例3-1:考虑由(1,2,,)i ix s n i N =+= ,给定的观测样本。
第三章 参数估计重点:1.总体参数与统计量2.样本均值与样本比例及其标准误差难点:1.区间估计2.样本量的确定知识点一:总体分布与总体参数统计分析数据的方法包括:描述统计和推断统计(第一章)推断统计是研究如何利用样本数据来推 断总体特征的统计学方法,包括参数估计和假设检验两大类。
总体分布是总体中所有观测值所形成的分布。
总体参数是对总体特征的某个概括性的度量。
通常有总体平均数( μ)总体方差(σ2 )总体比例( π)知识点二:统计量和抽样分布总体参数是未知的,但可以利用样本信息来推断。
统计量是根据样本数据计算的用于推断总体的某些量,是对样本特征的某个概括性度量。
统计量是样本的函数,如样本均值()、样本方差( s2)、样本比例(p)等。
构成统计量的函数中不能包括未知因素。
由于样本是从总体中随机抽取的,样本具有随机性,由样本数据计算出的统计量也就是随机的。
统计量的取值是依据样本而变化的,不同的样本可以计算出不同的统计量值。
[例题·单选题]以下为总体参数的是( )a.样本均值b.样本方差c.样本比例d.总体均值答案:d解析:总体参数是对总体特征的某个概括性的度量。
通常有总体平均数、总体方差、总体比例题·判断题:统计量是样本的函数。
答案:正确解析:统计量是样本的函数,如样本均值()、样本方差()、样本比例(p)等。
构成统计量的函数中不能包括未知因素。
[例题·判断题]在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的、唯一的。
答案:错误解析:作为推断对象的总体是唯一的,但作为观察对象的样本不是唯一的,不同的样本可以计算出不同的统计量值。
(一)样本均值的抽样分布设总体共有n个元素,从中随机抽取一个容量为n的样本,在重置抽样时,共有n n种抽法,即可以组成n n不同的样本,在不重复抽样时,共有个可能的样本。
每一个样本都可以计算出一个均值,这些所有可能的抽样均值形成的分布就是样本均值的分布。
第3章 参数估计理论参数估计的基本方法:点估计,区间估计点估计:以样本的某一函数值作为总体中未知参数的估计值。
区间估计:把总体中的参数确定在某一区间内。
第1节 点估计点估计就是以样本的某一函数值作为总体中未知参数的估计值。
设θ是总体X 的待估参数,用样本12,,,n X X X 构造一个合适的统计量12(,,,)n T X X X 来估计参数θ,通常记为ˆθ,即12ˆ=(,,,)nT X X X θ ,称为参数θ的估计量。
对样本的一组观测值12(,,,)n x x x ,统计量T 的值12ˆ=(,,,)n T x x x θ 称为参数θ的估计值。
点估计的问题就是要找一个作为待估参数θ的估计量12(,,,)n T X X X 的问题。
点估计的方法:数字特征法(矩估计法)、极大似然估计法、Bayes 估计法、最小二乘法等等。
第2节 矩估计法矩估计法由英国统计学家K.Person 在20世纪初提出,基本思想就是用样本矩去估计相应的总体矩。
理论依据是大数定律。
例1 设总体X 服从参数为θ的指数分布,即11,0(,)0,0x e x f x x θθθ-⎧>⎪=⎨⎪≤⎩12,,,n X X X 为取自总体X 的样本,求参数θ的矩估计量。
例2 设总体2~(,)X N μσ,12,,,n X X X 为取自总体X 的样本,求参数2,μσ的矩估计量。
例3 设总体2~(0,)X N σ,12,,,n X X X 为取自总体X 的样本,求参数2σ的矩估计量。
例4 设总体~(,)X U a b ,12,,,n X X X 为取自总体X 的样本,求参数,a b 的矩估计量。
ˆˆ=a X b X =+ 例5 设总体~()X P λ,12,,,n X X X 为取自总体X 的样本,求参数λ的矩估计量。
第3节 极大似然估计法极大似然估计法最初由德国数学家C.F.Gauss 于1821年提出,英国统计学家R.A.Fisher 于1922年再次提出极大似然的思想,并探讨了它的性质。
假设总体~(4,)X B p ,其中参数p 未知,现抽取容量为3的样本123,,X X X ,如果样本观察值为1、2、1,我们来估计参数p 。
极大似然估计法的步骤:● 对一组样本12,,,n X X X ,写出似然函数12(,,,)n L x x x ; ● 将似然函数12(,,,)n L x x x 取对数12ln (,,,)n L x x x ; ● 令ln =0L θ∂∂,求出ˆθ,即为θ的极大似然估计。
例1 设总体~()X P λ,12,,,n X X X 为取自总体X 的样本,求参数λ的极大似然估计量。
例2设总体~(,)X B m p ,12,,,n X X X 为取自总体X 的样本,求参数p 的极大似然估计量。
例3 设总体2~(,)X N μσ,12,,,n X X X 为取自总体X 的样本,求参数2,μσ的极大似然估计量。
例4 设总体~(,)X U a b ,12,,,n X X X 为取自总体X 的样本,求参数,a b 的极大似然估计量。
定理 1 设ˆθ是参数θ的极大似然估计,若()g τθ=存在唯一的反函数,则ˆˆ()g τθ=是()g τθ=的极大似然估计。
例5 设总体2~(,)X N μσ,2,μσ未知,12,,,n X X X 为取自总体X 的样本,求{1}P X >的极大似然估计。
第4节 Bayes 估计Bayes 公式1()()(|)(|)()()(|)i i i i ni i i P A B P A P B A P A B P B P A P B A ===∑例 对以往数据分析结果表明,当机器调整良好时,产品的合格品率为90%,而当机器发生故障时产品的合格品率为30%。
每天早上机器开动时机器调整得良好的概率为75%。
试求已知某日早上第一件产品是合格品时机器调整得良好的概率是多大?解:设事件A 为“产品为合格品”,事件B 为“机器调整得良好”。
则()0.75,()0.25,(|)0.9,(|)0.3P B P B P A B P A B ====|0.750.9(|)0.90||0.750.90.250.3P B P A B P B A P B P A B P B P A B ⨯===+⨯+⨯()()()()()()一、决策理论的基本概念统计决策理论是著名统计学家A.Wald (1902-1950)在20世纪40年代建立起来的(Wald.A. Statistical decision function. New York :John Wileysons , 1950.中译本:王福宝译,统计决策函数,上海教育出版社,1963)。
统计决策理论与经典统计学的差别在于是否涉及后果。
经典统计学重在推断上,而不考虑用在何处以及效果如何,统计决策理论引入损失函数,用来度量效益的大小,评价统计推断结果的优劣。
Bayes 分析是英国学者T.Bayes (1702-1761)首先提出,在20世纪后半叶迅速发展,它与经典统计学的差别在于是否使用先验信息。
1、决策问题与决策空间例 1 设甲乙两人进行一种游戏,甲手中有三张牌,分别标有123θθθ、、,乙手中也有三张牌,分别标有123a a a 、、。
游戏规则是双方各自独立地出牌,按下表记甲的得分与乙的失分:描述这类决策问题有三要素:● 状态集={}θΘ:状态集表示自然界或社会所有可能状态的全体。
也称为参数集或参数空间。
如本例的123={}θθθΘ、、。
● 行动集{}A a =:行动集表示决策者可能采取的行动的全体。
也称为决策集或决策空间。
如本例的123{}A a a a =、、● 收益函数(,)Q a θ:收益函数表示自然界或社会处于状态θ时,决策者采取行动a 所获的收益。
如本例的得分。
当Θ和A 都是有限集时,(,)Q a θ成为收益矩阵。
(1)先验信息:人们在过去对自然界或社会的各种状态所获得的信息。
(2)样本的信息:从与自然界或社会的状态θ有关的环境中抽样,从获得的样本中了解当今状态θ的最新信息。
如果在一个决策问题中只利用样本的信息,这种问题称为统计决策问题;如果在一个决策问题中不仅利用样本的信息,还利用先验信息,这样的问题称为Bayes 决策问题。
例2 某工厂生产的产品每100件装成一箱运交顾客,在向顾客交货前面临如下两个行动:a 1:一箱中逐一检查; a 2:一箱中都不检查若工厂选择行动a 1,则可保证交货时每件产品都是合格品。
但因每件产品检查费为0.8元,为此工厂要支付检查费80元/箱;若工厂选择行动a 2,工厂可免付每箱检查费80元,但顾客发现不合格品时,按合同不仅允许更换,而且每件还要支付12.5元的赔偿金。
2、损失函数(,)()(||)L a g a θλθθ=-()0λθ>且有限,它反映决策中由于θ的不同,即使同一个偏差||a θ-造成的危害性常不一样,而()g t 是t 的非降函数。
最常见的形式是(,)()||kL a a θλθθ=-,k 取非负整数。
常用的损失函数:(1)平方损失函数:2(,)()L a a θθ=- 或加权平方损失函数:2(,)()()L a a θλθθ=-(2)线性损失函数:01(),(,)(),k a a L a k a a θθθθθ-≤⎧=⎨->⎩其中,0 k 和1k 是两个大于0的常数,它们的选择常反映行动a 低于状态θ和高于状态θ的相对重要性。
当01k k =时,得绝对损失函数(,)||L a a θθ=- 若0 k 和1k 是θ的函数,则称为加权线性损失函数01()(),(,)()(),k a a L a k a a θθθθθθθ-≤⎧=⎨->⎩(3)0-1损失函数:0,||(,)1,||a L a a θεθθε-≤⎧=⎨->⎩这里的ε是正数。
这种损失函数常在两行动决策问题中使用,这里的0和1并不是损失的大小,是有无损失之意。
类似的有0,||(,),||a L a k a θεθθε-≤⎧=⎨->⎩或0,||(,)(),||a L a k a θεθθθε-≤⎧=⎨->⎩(4)多元二次损失函数:当θ和a 是多维向量时(,)()()T L a a A a θθθ=--其中,1212(,,,),(,,,),T Tn n a a a a A θθθθ== 为n n ⨯阶正定矩阵。
在实际问题中,我们的愿望是选择一个估计量a ,使损失函数(,)L a θ达到最小。
3、决策函数4、风险函数 (,)[(,)]R T E L a θθ= 二、Bayes 估计量1、先验分布例3 英国统计学家Savage.L.J.曾考虑如下两个问题:(1)一位常饮牛奶和茶的妇女声称,她能辨别先倒进杯子里的是茶还是牛奶,对此作了十次试验,全都成功;(2)一位音乐家声称,他能从一页乐谱辨别出是海顿(Haydn )的还是莫扎特(Mozart )的作品,在十次试验中全部成功。
2、后验分布(1)在经典统计中总体X 的分布依赖于参数θ和X 的取值 x ,即总体X 的分布为()f x θ,,而Bayes 学派认为函数()f x θ,是在随机变量θ给定某个值时X 的条件分布,所以应该记为(|)f x θ (2)根据参数θ的先验信息确定θ的先验分布()πθ(3)从总体X 中抽取样本12,,,n X X X ,则样本的联合分布为121(,,,|)(|)(|)nn i i f x x x f x f x θθθ∆===∏这个联合分布综合了样本的信息,又称为似然函数。
(4)考虑参数θ的先验信息,即把参数θ的先验信息()πθ与样本的信息12(,,,|)n f x x x θ 综合到一起,得到样本与参数的联合分布1(,)()()(|)()ni i h x f x f x θθπθθπθ===∏|(5)将样本的信息分离出来。
如果用(|)x πθ表示θ的后验分布,()g x表示样本12(,,,)n X X X X =的分布,它是样本的分布,与θ无关,即()g x不含θ的任何信息,亦即分解(,)h x θ ,分解成 1212(,)(|,,,)(,,,)(|)()n n h x x x x g x x x x g x θπθπθ==其中,()(,)d ()()d g x h x f x θθθπθθΘΘ==⎰⎰| (连续型) 或 ()()()g x f x θπθΘ=∑|(离散型)从而得到后验分布()()(|)=()f x xg x θπθπθ|(|)x πθ是离散性还是连续型,取决于θ的先验分布是离散性还是连续型。
从上述5个过程不难看出,当从总体获得样本后,公式把人们对θ的认识从()πθ调整到(|)x πθ,这个调整过程可以形象地表示为 先验信息⊕样本信息=后验信息即 ()()=(|)f x x πθθπθ⊕|例4 设总体~(1,)X B p ,其中参数p 未知,且设p 在区间(0,1)上服从均匀分布,12,,,n X X X 是来自总体X 的样本,试求p 的后验分布。