第六章参数估计
- 格式:doc
- 大小:538.01 KB
- 文档页数:9
第六章 参数估计§6.1 点估计的几种方法6.1.1 替换原理和矩法估计 一、矩法估计替换原理:(1)用样本矩去替换总体矩,这里的矩可以是原点矩也可以是中心矩;(2)用样本矩的函数去替换相应的总体矩的函数。
举例二、概率函数);(θx p 已知时未知参数的矩法估计设总体具有已知的概率函数),,;(1k x p θθ ,∈),,(1k θθ Θ是未知参数或参数向量,n x x x ,,21 是样本,假定总体的k 阶原点矩k μ存在,则对所有j ,,0k j <<j μ都存在,若假设k θθ,,1 能够表示成k μμ,,1 的函数),,(1k j j μμθθ =,则可给出诸j θ的矩法估计:k j a a kj j ,1),,,(ˆ1==θθ 其中k a a ,,1 是前k 个样本原点矩:∑==n i ji j x n a 11,进一步,如果要估计k θθ,,1 的函数),(1k g θθη =,则可直接得到η的矩法估计)ˆ,ˆ(ˆ1kg θθη=。
例1 设总体为指数分布,其密度函数为x e x p λλλ-=);(,0>xn x x x ,,21 是样本,此处1=k ,由于λ/1=EX ,亦即EX /1=λ,故λ的矩法估计为x /1ˆ=λ另外,由于2/1)(λ=X Var ,其反函数为)(/1X Var =λ,因此,从替换原理来看,λ的矩法估计也可取为s /1ˆ1=λ, s 样本标准差。
这说明矩估计可能是不唯一的,这是矩法估计的一个缺点,此时通常应该尽量采用低阶矩给出未知参数的估计。
例2设n x x x ,,21 是来自),(b a 上的均匀分布的样本,a 与b 均是未知参数,这里2=k 其密度函数为⎪⎩⎪⎨⎧≤≤-=0,1),;(bx a a b b a x p ,求a ,b 的矩估计.解 由2)(121)(,2)(a b X D b a X E -=+= 得方程组:⎪⎪⎩⎪⎪⎨⎧-==-=+∑=n i i X X n X V a r a b X b a 122.)(1)()(121,2解此方程组,得到矩估计量: .)(3ˆ , )(3ˆX Var X b X Var X a+=-= 6.1.2最大似然估计定义6.1.1 设总体的概率函数为);(θx p ,Θ∈θ,其中θ是一个未知参数或几个未知参数组成的参数向量,Θ是参数θ可能取值的参数空间,n x x x ,,21 是来自该总体的样本,将样本的联合概率函数看成θ的函数,用),,;(21n x x x L θ表示,简记为)(θL ,);();();(),,;()(2121θθθθθn n x p x p x p x x x L L ==)(θL 称为样本的似然函数。
第六章 参数值的估计 第一节 参数估计的一般问题一、估计量与估计值参数估计就是用样本统计量去估计总体参数,如用X 估计μ,用S2估计2σ,用p 估计π等。
总体参数可以笼统地用一个符号θ表示。
参数估计中,用来估计总体参数的统计量的名称,称为估计量,用θ表示,如样本均值、样本比例等就是估计量。
用来估计总体参数时计算出来的估计量的具体数值,叫做估计值。
二、点估计与区间估计——参数估计的两种方法 1、点估计用样本估计量θ的值直接作为总体参数θ的估计量值。
2、区间估计它是在点估计基础上,给出总体参数估计的一个区间,由此可以衡量点估计值可靠性的度量。
这个区间通常是由样本统计量加减抽样误差而得到。
以样本均值的区间估计来说明区间估计原理:根据样本均值的抽样分布可知,重复抽样或无限总体抽样情况下,样本均值,由此可知,样本均值落在总体均值两侧各为一个标准误差范围内的概率为0.6827,两个标准误差范围0.9545,三个标准误差范围0.9973,并可计算出样本均值落在μ的两侧任何一个标准误差范围内的概率(根据已知的μ,σ计算)。
但实际估计时,μ是未知的,因而不再是估计样本均值落在某一范围内的概率,而只能根据已设定的概率计算这个范围的大小。
例如:约有95%的样本均值会落在距μ的两个标准误差范围内,即约有95%的样本均值所构造的两个标准误差的区间会包括μ。
在区间估计中,由样本统计量所构造的总体参数的估计区间,称为置信区间,区间的最小值为置信下限,最大值为置信上限。
例如,抽取了1000个样本,根据每个样本构造一个置信区间,其中有95%的区间包含了真实的总体参数,而5%的没有包括,则称95%为置信水平/置信系数。
构造置信区间时,可以用所希望的值作为置信水平,常用的置信水平是90%,95%,99%,见下表:α称为显著性水平,表示用置信区间估计的不可靠的概率,1-为置信水平。
如何解释置信区间:如用95%的置信水平得到某班学生考试成绩的置信区间为(60,80),即在多次抽样中有95%的样本得到的区间包含了总体真实平均成绩,(60,80)这个区间有95%的可能性属于这些包括真实平均成绩的区间内的一个。
113第六章 参数估计一、 知识点1. 点估计的基本概念2. 点估计的常用方法(1) 矩估计法① 基本思想:以样本矩作为相应的总体矩的估计,以样本矩的函数作为相应的总体矩的同一函数的估计。
(2) 极大似然估计法设总体X 的分布形式已知,其中),,,(21k θθθθΛ=为未知参数,),,(21n X X X Λ为简单随机样本,相应的),,,(21n x x x Λ为它的一组观测值.极大似然估计法的步骤如下:① 按总体X 的分布律或概率密度写出似然函数∏==ni i n x p x x x L 121);();,,,(θθΛ (离散型)∏==ni i n x f x x x L 121);();,,,(θθΛ (连续型)若有),,,(ˆ21nx x x Λθ使得);,,,(max )ˆ;,,,(2121θθθn n x x x L x x x L ΛΛΘ∈=,则称这个θˆ为参数θ的极大似然估计值。
称统计量),,,(ˆ21nX X X Λθ为参数θ的极大似然估计量。
② 通常似然函数是l θ的可微函数,利用高等数学知识在k θθθ,,,21Λ可能的取值范围内求出参数的极大似然估计k l x x x nl l ,,2,1),,,,(ˆˆ21ΛΛ==θθ 将i x 换成i X 得到相应的极大似然估计量k l X X X nl l ,,2,1),,,,(ˆˆ21ΛΛ==θθ 注:当);,,,(21θn x x x L Λ不可微时,求似然函数的最大值要从定义出发。
3. 估计量的评选标准(1) 无偏性:设),,(ˆˆ21nX X X Λθθ=是参数θ的估计量,如果θθ=)ˆ(E ,则称θˆ为θ的无偏估计量。
(2) 有效性:设1ˆθ,2ˆθ是θ的两个无偏估计,如果)ˆ()ˆ(21θθD D ≤,则称1ˆθ较2ˆθ更有效。
4. 区间估计114 (1) 定义 设总体X 的分布函数族为{}Θ∈θθ),;(x F .对于给定值)10(<<αα,如果有两个统计量),,(ˆˆ111n X X Λθθ=和),,(ˆˆ122n X X Λθθ=,使得{}αθθθ-≥<<1ˆˆ21P 对一切Θ∈θ成立,则称随机区间)ˆ,ˆ(21θθ是θ的双侧α-1置信区间,称α-1为置信度;分别称1ˆθ和2ˆθ为双侧置信下限和双侧置信上限. (2) 单侧置信区间(3) 一个正态总体下未知参数的双侧置信区间(置信度为α-1)二、 习题 1. 选择题(1) 设n X X X ,,,21Λ是来自总体X 的一个样本,则以下统计量①)(211n X X + ②)2(14321n X X X X X n ++++-Λ ③)2332(101121n n X X X X +++-作为总体均值μ的估计量,其中是μ的无偏估计的个数是A.0B.1C.2D.3(2) 设321,,X X X 是来自正态总体)1,(μN 的样本,现有μ的三个无偏估计量321332123211216131ˆ;1254131ˆ;2110351ˆX X X X X X X X X ++=++=++=μμμ其中方差最小的估计量是A.1ˆμB.2ˆμC. 3ˆμD.以上都不是 (3) 设0,1,0,1,1为来自0-1分布总体B(1,p)的样本观察值,则p 的矩估计值为 。
115A.51 B.52 C.53D.54 (4) 设 0,2,2,3,3为来自均匀分布总体),0(θU 的样本观察值,则θ的矩估计值为 。
A.1B.2C.3D.4(5) 设n X X X ,,,21Λ是来自总体X 的一个样本,X 的密度函数为⎪⎩⎪⎨⎧<<-=其他 ,00),(2);(2ααααx x x f则参数α的矩估计量为αˆ= 。
A.X 31B.XC.X 3D.X 6 (6) 无论2σ是否已知,正态总体均值μ的置信区间的中心都是 。
A.μB.2σC.XD.2S(7) 设总体22),,(~σσμN X 已知,则总体均值μ的置信区间长度L 与置信度α-1的关系是 。
A.当α-1缩小时,L 缩短B. 当α-1缩小时,L 增大C. 当α-1缩小时,L 不变D.以上说法均错.2. 填空题(1) 若一个样本的观察值为0,0,1,1,0,1,则总体均值的矩估计值为_______,总体方差的矩估计值为________。
(2) 总体未知参数θ的极大似然估计θˆ就是__________函数的最大值点。
(3) 设0),,0(~>θθU X ,则θ的矩估计量和极大似然估计量分别为________________。
(4) 设总体X 服从几何分布{}Λ,2,1,)1(1=-==-k p p k X P k .n X X X ,,,21Λ是来自X 的一个样本,则p 的矩估计量和极大似然估计量分别为_______________________。
(5) 设由总体未知)θθ)(,(~x F X 的样本观察值求得9.0}5.455.35{=<<θP ,则称______________为θ的一个置信度为________的置信区间。
(6) 设由来自总体)9.0,(~2μN X 容量为9的简单随机样本的样本均值5=x ,则未知参数μ的置信度为0.95的置信区间为__________________。
116 (7) 设来自总体22),,(~σσμN X 未知,容量为16的简单随机样本的样本均值10=x ,样本方差4002=s ,则未知参数μ的置信度为α-1的置信区间为__________________。
(8) 设总体),,(~2σμN X n X X X ,,,21Λ是来自X 的样本,当用X X X ,21-及321613221X X X -+作为μ的估计时,最有效的是_______________。
(9) 设n X X X ,,,21Λ和n Y Y Y ,,,21Λ是分别来自总体)2,(~)1,(~2μμN Y N X 和的两个样本,μ的一个无偏估计有形式∑∑==+=mij j ni iY b XaT 1.则b a 和应该满足条件___________;当_______=a ,_______=b 时,T 最有效。
3. 计算题(1) 设总体),(~p m B X ,即参数为p m ,的二项分布,p 为未知参数,nX X X ,,,21Λ为简单随机样本, 分别求p 的矩估计量和极大似然估计量。
(2) 设总体X 的概率密度函数为⎩⎨⎧<<+=其它,,0,10,)1()(x x x f θθ,其中1->θ是未知参数,n X X X ,,,21Λ为简单随机样本, 分别用矩估计极大似然估计θ。
(3) 设某种元件的使用寿命X 的概率密度函数为⎩⎨⎧≤>=-θθθθx x e x f x ,0,2);()(2,0>θ为未知参数,n X X X ,,,21Λ为简单随机样本, 求参数θ的极大似然估计量。
(4) 设n X X X ,,,21Λ是来自正态总体),(2σμN 的一个样本,适当选取c ,使得()∑-=+-1121n i i i X X c 为2σ的无偏估计量。
(5) 已知某种木材横纹抗压力的实验值),(~2σμN X ,对10个试件做横纹抗压力的试验数据如下:482,493,457,471,510,446,435,418,394,496(单位:公斤/平方厘米),试以95%的可靠性估计该木材的平均横纹抗压力:①2σ未知; ② 2230=σ。
(6)为了解灯泡使用时数的均值μ及标准差σ,测量10个灯泡,得h S h x 20,1500==.如117果已知灯泡的使用时数服从正态分布,求μ和σ的95%的置信区间.(7)某厂生产的瓶装运动饮料的体积假定服从正态分布,抽取10瓶,测得体积(毫升)为595,602,610,585,618,615,605,620,600,606。
求出方差的置信度为0.90的置信区间。
(8)随机地取某种炮弹9发做试验.求得炮口速度的样本标准差11=s m/s .设炮口速度总体),(~2σμN X ,求炮口速度的均方差σ的置信度为0.95的双侧置信区间。
4. 证明题(1) 设n X X X ,,,21Λ是来自正态总体),(2σμN 的一个样本,其中μ已知.证明:估计量∑=-=n i i nX n S 122)(1μ是2σ的无偏估计量。
(2) 设n X X X ,,,21Λ为总体X 的一个样本,记μ为总体均值,),,2,1(n i i Λ=α是常数,且∑==ni i11α。
① 证明:∑=ni i iX 1α是μ的无偏估计;② 证明在μ的所有形如∑=ni i iX 1α的线性无偏估计中,以X 为最有效。
三、 练习题参考答案1. 选择题(1)C ; (2)B ; (3)C ; (4)D ; (5)C ; (6)C ; (7)A ; 2. 填空题(1)41ˆ,21ˆ==σμ(2)似然 (3) {}i n i X X ≤≤1max ,2 (4)X X 1,1 (5). (35.5, 45.5) (6) (4.412, 5.588)(7) ())15(510),15(5102121αα--+-t t (8)X (9)m n a +=44,mn b +=413.计算题(1) 解:①),(~p m B X ,,ˆ,)(X mp X E ===μμ故mXp =ˆ,即为p 的矩估计量 ②),(~p m B X ,{}km k k m p p C k X P --==)1(,似然函数为:118 ∑-∑⎪⎪⎭⎫ ⎝⎛=-===-==-∏∏ni i n i ii iii x m x ni x m ni x m x x mp p C p p C L 11)(11)1()1()(θ 求对数)1ln()(ln ln )(ln 111p x m p x C L ni i n i i ni x mi--+⎪⎭⎫⎝⎛+=∑∑∏===θ求导数∑∑-=-⎪⎪⎭⎫ ⎝⎛--++=n i i ni i x m p x p L d d 11)(1110)(ln θθ, 令0)(ln =θθd L d ,解方程⎪⎭⎫ ⎝⎛--=∑∑==ni i n i i x mn p x p 11111,即,111∑∑==-=-ni ini ixx mn pp 所以xm x n m p n i i==∑=111,故p 的极大似然估计量为mXp=ˆ。
(2) 解:①矩估计法21)1()()(111++=+===++∞∞-⎰⎰θθθμθdx xdx x xf X E ; 又因为X A ==11ˆμ,便得θ的矩估计为XX --=112ˆθ。
②极大似然估计法.由题意有⎪⎩⎪⎨⎧<<+==∏∏==其他,010,)()1();()(11i ni i n ni i x x x f L θθθθ, ∑=++=ni i x n L 1ln )1ln()(ln θθθ,∑=++=ni i x n L d d 1ln 1)(ln θθθ, 令0)(ln =θθL d d便得到θ的极大似然估计量: ∑∑==--=--=ni i ni ix n xn11ln 111ln 1ˆθ。