矩估计与极大似然估计的典型例题
- 格式:pdf
- 大小:123.38 KB
- 文档页数:5
数理统计7:矩法估计(MM)、极⼤似然估计(MLE),定时截尾实验在上⼀篇⽂章的最后,我们指出,参数估计是不可能穷尽讨论的,要想对各种各样的参数作出估计,就需要⼀定的参数估计⽅法。
今天我们将讨论常⽤的点估计⽅法:矩估计、极⼤似然估计,它们各有优劣,但都很重要。
由于本系列为我独⾃完成的,缺少审阅,如果有任何错误,欢迎在评论区中指出,谢谢!⽬录Part 1:矩法估计矩法估计的重点就在于“矩”字,我们知道矩是概率分布的⼀种数字特征,可以分为原点矩和中⼼矩两种。
对于随机变量X⽽⾔,其k阶原点矩和k阶中⼼矩为a_k=\mathbb{E}(X^k),\quad m_k=\mathbb{E}[X-\mathbb{E}(X)]^k,特别地,⼀阶原点矩就是随机变量的期望,⼆阶中⼼矩就是随机变量的⽅差,由于\mathbb{E}(X-\mathbb{E}(X))=0,所以我们不定义⼀阶中⼼矩。
实际⽣活中,我们不可能了解X的全貌,也就不可能通过积分来求X的矩,因⽽需要通过样本(X_1,\cdots,X_n)来估计总体矩。
⼀般地,由n个样本计算出的样本k阶原点矩和样本k阶中⼼矩分别是a_{n,k}=\frac{1}{n}\sum_{j=1}^{n}X_j^k,\quad m_{n,k}=\frac{1}{n}\sum_{j=1}^{n}(X_j-\bar X)^k.显然,它们都是统计量,因为给出样本之后它们都是可计算的。
形式上,样本矩是对总体矩中元素的直接替换后求平均,因此总是⽐较容易计算的。
容易验证,a_{n,k}是a_k的⽆偏估计,但m_{n,k}则不是。
特别地,a_{n,1}=\bar X,m_{n,2}=\frac{1}{n}\sum_{j=1}^{n}(X_j-\bar X)^2=\frac{n-1}{n}S^2\xlongequal{def}S_n^2,⼀阶样本原点矩就是样本均值,⼆阶样本中⼼矩却不是样本⽅差,⽽需要经过⼀定的调整,这点务必注意。
例7.1设总体X的概率密度为式中>-1是未知参数,是来自总体的一个容量为的简单随机样本,分别用矩估计法和最大似然估计法求的估计量。
分析因为总体的分布只含有一个未知参数,所以用矩估计法首先求出解由矩估计法知,令得参数的矩估计量。
似然函数为对=1,2,…n,对取对数,则有令,所以参数的最大似然估计量为注本题说明,对总体未知参数的估计,尽管利用同一样本值,但采用不同的估计方法,其结果未必相同。
[对应练习]设总体X服从参数p的几何分布,其分布律为,是总体X的一个简单随机样本,试求:(1)p的矩估计量;(2)p的最大似然估计量。
提示因为总体分布中只含有一个参数p,所以求p的矩估计量关键是求出总体的均值。
例7.2设某种元件的使用寿命的概率密度为式中>0为未知参数,又设是的一组样本观察值,求参数的最大似然估计值。
解似然函数对于,=1,2,…,n,()>0,取自然对数,则有从而所以在,=1,2,…,n时单调增加。
取时,对,,=1,2,…,n成立。
取到最大值,故的最大似然估计值为注本题虽然能给出似然方程,但似然方程无解,故不存在驻点,应在边界点上考虑函数最大值。
[对应练习]设为总体的一个样本,已知总体的密度函数为式中>0, ,是未知参数,求,的矩估计量和最大似然估计量。
提示因为总体的分布中含有两个未知参数,用矩法估计时,首先求出和,令,,可求得,的矩估计量。
例7.3某自动包装机包装洗衣粉,其重量服从正态分布,今随机抽查12袋测得其重量(单位g)分虽为1 001,1 004,1 003,1 000,997,999,1 004,1 000,996,1 002,998,999。
(1)求平均袋重的点估计值;(2)求方差的点估计值;(3)求的置信度为95%的置信区间;(4)求的置信度为95%的置信区间;(5)若已知=9,求的95%的置信区间。
解(1)(2)(3)未知,则的置信度为1-的置信区间为依题意:故的置信度为95%的区间估计为(998.577,1 001.923)。
极大似然估计例题
极大似然估计是一种统计学的估计方法,它根据已知的数据来估计参数的值,以使得估计出来的参数能够最大限度地拟合原始数据。
例如,有一个调查,其中有1000个受访者,调查了他们对特定产品的满意度,其中800人表示满意,200人表示不满意。
要用极大似然估计的方法求出满意度的比例p,即该产品的满意度的比例。
首先,我们假设p是一个未知变量,它的取值范围是[0,1]。
我们希望根据上面的调查结果,通过极大似然估计法找到一个最佳的p,使得它最大程度地拟合调查结果。
首先,我们把满意人数看作一个随机变量X,它的概率分布为二项分布:P(X=k)=C_1000^k * p^k * (1-
p)^{1000-k},其中k=800,C_1000^k表示从1000个人中取出800个满意的可能性,p表示满意度的比例。
根据极大似然估计的原理,我们需要求出满足下面的条件的最佳的p值:
L(p)=P(X=800)=C_1000^800 * p^800 * (1-p)^{200}最大
将上式带入log函数,得到:
lnL(p)=800*ln(p)+200*ln(1-p)+C最大
令上式的导数为0,可以得到:
p=800/1000=0.8
可以看出,最佳的满意度比例为80%。
极大似然估计经典例题
极大似然估计是统计学中最常用的一种参数估计方法,其基本思想是在给定一定的数据情况下,寻找最能解释这些数据的参数值。
下面我们来看一个经典的例题。
假设有一个硬币,它正反面出现的概率分别为p和1-p,现在我们抛掷了这个硬币10次,结果出现了6次正面和4次反面。
现在我们想要用极大似然估计来估计这个硬币正面出现的概率p。
首先,我们需要写出这个问题的似然函数。
由于每次抛掷硬币是独立的事件,因此整个实验的似然函数可以表示为:
L(p) = P(6次正面,4次反面| p) = p^6 * (1-p)^4
接下来,我们需要求解这个似然函数的最大值。
为了方便计算,我们可以对似然函数取对数,得到:
ln L(p) = 6lnp + 4ln(1-p)
对其求导,得到:
d(ln L(p))/dp = 6/p - 4/(1-p)
令其等于0,解得p=0.6。
因此,我们可以用极大似然估计的方法估计这个硬币正面出现的概率为0.6。
需要注意的是,极大似然估计并不一定能够得到最优的估计结果。
在实际应用中,需要结合具体问题和数据情况来选择合适的参数估计方法。
简答题1、矩估计的推断思路如何?有何优劣?2、极大似然估计的推断思路如何?有何优劣?3、什么是抽样误差?抽样误差的大小受哪些因素影响?4、简述点估计和区间估计的区别和特点。
5、确定重复抽样必要样本单位数应考虑哪些因素?计算题1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。
要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少?3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。
根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。
现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少?4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。
试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973)5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下:样本容量(个)平均电流强度(安培)电流强度标准差(安培)合格率(%)甲车间20 1.5 0.8 90乙车间40 1.6 0.6 95试推断:(1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围(2)以同样条件推断其合格率的可能范围(3)比较两车间产品质量6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求:(1)计算样本合格品率及其抽样平均误差(2)以95.45%的概率保证程度对该批产品合格品率和合格品数量进行区间估计。
研究6种氮肥施用法(K=6)对小麦的效应,每种施肥法种5盆小麦(n=5),完全随机设计,最后测定它们的含氮量(mg),其结果见表下表,试作方差分析。
表 6种施肥法小麦植株的含氮量(mg)---------------------------------------------------------1 2 3 4 5 6---------------------------------------------------------12.9 14.0 12.6 10.5 14.6 14.012.3 13.8 3.2 10.8 14.6 13.312.2 13.8 13.4 10.7 14.4 13.712.5 13.6 13.4 10.8 14.4 13.512.7 13.6 13.0 10.5 14.4 13.7---------------------------------------------------------采用ANOVA过程分析。
程序如下:1DATA new;2DO i=1 TO 5;3DO trt=1 TO 6;4INPUT y@@;5OUTPUT;6END;7END;8DROP i;9CARDS;1012.9 14.0 12.6 10.5 14.6 14.01112.3 13.8 13.2 10.8 14.6 13.31212.2 13.8 13.4 10.7 14.4 13.71312.5 13.6 13.4 10.8 14.4 13.51412.7 13.6 13.0 10.5 14.4 13.715PROC ANOVA;16CLASS trt;17MODEL y=trt;18MEANS trt/DUNCAN;19RUN;输出结果及说明Analysis of Variance Procedure 方差分析过程Class Level Information 处理水平信息Class Levels Values处理因素变量名水平数具体值TRT 6 1 2 3 4 5 6Number of observations in data set = 30 数据集中有30个观察值 Dependent Variable: Y 依变量名为ySum of MeanSource DF Squares Square F Value Pr > F变异来源自由度平方和均方 F值概率值PModel 5 44.46300000 8.89260000 164.17 0.0001Error 24 1.30000000 0.05416667Corrected Total 29 45.76300000R-Square C.V. Root MSE Y Mean所用模型的决定系数变异系数剩余标准差依变量均数0.971593 1.786165 0.232737 13.0300000Source DF Anova SS Mean Square F Value Pr > F变异来源自由度平方和均方 F值概率值PTRT 5 44.46300000 8.89260000 164.17 0.0001Analysis of Variance ProcedureDuncan's Multiple Range Test for variable: Y 用DUNCAN法测验 NOTE: This test controls the type I experimentwise error rate under the complete null hypothesis but not underpartial null hypotheses.Alpha= 0.05 df= 24 MSE= 0.054167α水平为0.05,自由度为24,MS误差为0.054167Number of Means 2 3 4 5 6Critical Range 0.3038 0.3191 0.3289 0.3358 0.3410两两比较时的界值,两平均数之差大于该界值时则两组有统计学差异Means with the same letter are not significantly different.标有相同字母的两平均数间无差异Duncan Grouping Mean N TRT测验结果各组均数例数组别A 14.4800 5 5B 13.7600 5 2B 13.6400 5 6C 13.1200 5 3D 12.5200 5 1E 10.6600 5 4在输出结果中,找CLASS语句指出的变量的Pr > F(概率)值。
求矩估计量和最大似然估计量例题一、设从某正态分布总体中随机抽取样本X1, X2, ..., Xn,其样本均值为X拔,样本方差为S2。
则该正态分布总体的矩估计量μ为?A. X拔的平方B. X拔C. S2D. 1/S2(答案:B)二、对于参数为λ的泊松分布,若从该总体中随机抽取样本X1, X2, ..., Xn,其样本均值为3,则λ的矩估计量为?A. 1/3B. 2/3C. 3D. 9(答案:C)三、设总体X的分布函数为F(x;θ),其中θ为未知参数。
现从该总体中随机抽取样本X1, X2, ..., Xn,若θ的矩估计量满足E(X)=θ,且样本均值为5,则θ的矩估计量为?A. 1/5B. 5C. 25D. 无法确定(答案:B)四、对于参数为p的二项分布B(n,p),若从该总体中随机抽取样本X1, X2, ..., Xn,且样本中成功的次数为k,则p的最大似然估计量为?A. k/nB. n/kC. kD. n(答案:A)五、设总体X的密度函数为f(x;θ)=θx(θ-1),其中0<x<1,θ>0为未知参数。
现从该总体中随机抽取样本X1, X2, ..., Xn,则θ的最大似然估计量为?A. -1/n求和(ln Xi)B. 1/n求和(ln Xi)C. n/求和(ln Xi)D. 求和(Xi)/n(答案:C)六、对于均匀分布U(a,b),若从该总体中随机抽取样本X1, X2, ..., Xn,且样本最小值为Xmin,样本最大值为Xmax,则(b-a)的最大似然估计量为?A. (Xmax-Xmin)/nB. Xmax-XminC. n*(Xmax-Xmin)D. (Xmax+Xmin)/2(答案:B)七、设总体X的密度函数为f(x;μ,σ2)=(1/2πσ)*exp[-(x-μ)2/2σ2],其中μ和σ2均为未知参数。
现从该总体中随机抽取样本X1, X2, ..., Xn,则μ的最大似然估计量为?A. 样本均值B. 样本方差C. 样本中位数D. 样本极差(答案:A)八、对于参数为λ的指数分布,若从该总体中随机抽取样本X1, X2, ..., Xn,且样本均值为1/λ拔,则λ的最大似然估计量为?A. 1/λ拔B. λ拔C. 1/n*求和(1/Xi)D. n/求和(Xi)(答案:D,但注意这里题目中的“样本均值为1/λ拔”表述有误,应为“样本均值的倒数为λ拔的估计”,因此严格来说没有正确答案,但按题意最接近的是D,如果修正题目,则D应为“1/样本均值”)。
选择题题目:设有一组样本数据来自二项分布B(n, p),其中n 已知,观测到成功的次数为x,则p 的极大似然估计值为:A. x/n(正确答案)B. n/xC. xD. 1 - x/n题目:对于正态分布N(μ, σ²),若已知样本均值¯x 和样本方差s²,则μ 的极大似然估计值为:A. s²B. ¯x(正确答案)C. 1/¯xD. √s²题目:设有一组样本数据来自泊松分布P(λ),观测到的总事件数为n,则λ 的极大似然估计值为:A. n/样本量B. 样本量/nC. n(正确答案)D. 1/n题目:对于均匀分布U(a, b),若已知样本最小值xmin 和样本最大值xmax,则 b 的极大似然估计值为:A. (xmin + xmax)/2B. xmax(正确答案)C. xminD. xmax - xmin题目:设有一组样本数据来自指数分布Exp(λ),样本的均值为¯x,则λ 的极大似然估计值为:A. 1/¯x(正确答案)B. ¯xC. ¯x²D. 1/¯x²题目:对于几何分布Geo(p),若观测到首次成功之前的失败次数为k,则p 的极大似然估计值为:A. 1/(k+1)(正确答案)B. k+1C. 1/kD. k/(k+1)题目:设有一组样本数据来自卡方分布χ²(k),样本的观测值为x,则k 的极大似然估计值通常通过什么方法获得?A. 直接计算x 的平方根B. 迭代求解(如牛顿法)(正确答案)C. 查找卡方分布表D. 取x 的整数部分题目:对于对数正态分布LogN(μ, σ²),若已知样本的对数均值¯lnx 和样本的对数方差s²lnx,则μ 的极大似然估计值为:A. s²lnxB. ¯lnx(正确答案)C. exp(¯lnx)D. ln(¯lnx)题目:设有一组样本数据来自韦布尔分布Weibull(a, b),其中a 已知,样本的均值为¯x,则b 的极大似然估计通常需要通过什么方式得到?A. 直接计算¯x/aB. 求解方程组C. 数值优化方法(如梯度下降)(正确答案)D. 查找韦布尔分布表。
关于矩估计与极大似然估计的典型例题例1,设总体X 具有分布律⎟⎟⎠⎞⎜⎜⎝⎛−−22)1()1(2321~θθθθX 其中10<<θ为未知参数。
已经取得了样本值1,2,1321===x x x ,试求参数θ的矩估计与极大似然估计。
解:(i )求矩估计量,列矩方程(只有一个未知参数)XX E =−=−×+−×+=θθθθθ23)1(3)1(22)(22得6523432x 32X 3=−=−=−=矩θ(ii ii)求极大似然估计,写出似然函数,即样本出现的概率)求极大似然估计,写出似然函数,即样本出现的概率),,()(332211x X x X x X P L ====θ)1,2,1(321====X X X P )1()2()1(321=×=×==X P X P X P )1(2)1(2522θθθθθθ−=×−×=对数似然)1ln(ln 52ln )(ln θθθ−++=L 0115)(ln =−−=θθθθd L d 得极大似然估计为65ˆ=极θ例2,某种电子元件的寿命某种电子元件的寿命((以h 记)X 服从双参数指数分布服从双参数指数分布,,其概率密度为⎪⎩⎪⎨⎧≥−−=其他,0],/)(exp[1)(µθµθx x x f 其中0>µθ,均为未知参数,自一批这种零件中随机抽取n 件进行寿命试验,设它们的失效时间分别为.,,2,1n x x x L (1)求µθ,的最大似然估计量;(2)求µθ,的矩估计量。
解:(1)似然函数,记样本的联合概率密度为∏===ni i n x f x x x f L 12,1)();,,()(µθµθ,,L ⎪⎩⎪⎨⎧≥−−=∏=其他,0,,,]/)(exp[12,11µθµθn n i i x x x x L ⎪⎩⎪⎨⎧>≤−−=∑=)1()1(1,0),/)(exp(1xx n x ni i n µµθµθ在求极大似然估计时在求极大似然估计时,,0)(=µθ,L 肯定不是最大值的似然函数值,不考虑这部分,只考虑另一部分。
§估计基本题型Ⅰ 矩估计法【例】总体X 的概率密度函数为1,01(;)00,x x f x θθθθ-⎧<<=>⎨⎩()其他,求未知参数θ的 矩估计.【分析】先由题设所给含有未知参数θ的随机变量概率密度求出数学期望,解出未知参数θ与数学期望的关系,再由样本一阶原点矩替换总体期望,即得参数θ的矩估计. 【解】为求未知参数θ用总体原点矩表示的式子,先求出EX 110(;)1EX xf x dx x x dx θθθθθ+∞--∞==⋅=+⎰⎰因而 ]EX EX θ=-在上式中用样本一阶原点矩替换总体一阶原点矩,即得未知参数θ的估计ˆ(1)X X θ=-. 【例】设总体X 服从均匀分布[,]U a b ,12(,,)n X X X L 为来自此总体的样本,求,a b 的矩估计.【分析】由于总体的分布中含有两个未知参数,a b ,故需要求出总体的两个矩,为简单起见,一般先求其一阶矩(即总体的期望)和二阶矩(也可以取总体的方差),然后按矩估计法相应的样本矩替换它们,得矩法方程,最后求解便可得到,a b 的矩估计. 【解】由于总体X 服从均匀分布[,]U a b ,故总体的期望和方差分别为12();212a b b a EX DX +-== 由矩估计法,用X 替换EX ,用2S 替换2σ,便得矩法方程组1222()12a bX b a S +⎧=⎪⎪⎨-⎪=⎪⎩,即22a b Xa b ⎧+=⎪⎨-+=⎪⎩ 于是解出,a b 的矩估计分别为ˆaX =,ˆb X =. 【例】设总体X 的概率密度函数为||1(;),(0,)2x f x e x θθθθ-=>-∞<<+∞,求θ的矩估计.【分析】由于总体的分布中只含有一个未知参数θ,但总体的一阶矩为常量,需要求总体的二阶矩,从而确定矩方程,最后求解θ的矩估计量. 【解】虽然总体X 只含有一个参数,但 ||102x EX x e dx θθ-+∞-∞=⋅=⎰不含θ,不能求解θ 故需求二阶原点矩||2212x EX x e dx θθ-+∞-∞=⋅⎰222021()()22x xx x x e dx e d θθθθθθθ--+∞+∞=⋅=⎰⎰22(3)2θθ=Γ=.令2211n i i X EX n ==∑,则有θ的矩估计量为ˆθ=基本题型Ⅱ 极大似然估计法【例】设总体X 具有概率密度函数1,01(;)00,x x f x θθθθ-⎧<<=>⎨⎩()其他,θ的极大似然估计量是 .【分析】设12,,n x x x L 为总体X 的观测值,则其极大似然函数为11()()n n L x x θθθ-=L ,对数似然函数为1ln ()ln (1)ln ni i L n x θθθ==+-∑,解似然方程1ln ()ln 0ni i d L n x d θθθ==+=∑ 得参数θ的极大似然估计值为1ˆln nii nxθ==-∑,从而得参数θ的极大似然估计量为1ˆln nii nXθ==-∑.【例】设总体X 的分布律为X 1a 2a 3a P2θ2(1)θθ-2(1)θ-又设12,,n X X X L 为来自此总体的样本,记j n 表示12,,n X X X L 中取值为,1,2,3j a j =,的个数,求θ的极大似然估计.【分析】求极大似然估计量时,关键是求似然函数,它是样本观测值的函数. 【解】设12,,n x x x L 是样本12,,n X X X L 的观测值,则参数θ的似然函数为 1()(;)nii L P x θθ==∏312123[()][()][()]n n n P x a P x a P x a ====323122122222[2(1)](1)2(1)n n n n n n n n θθθθθθ++=--=-对数似然函数为21223ln ()ln 2(2)ln (2)ln(1)L n n n n n θθθ=++++- 从而似然方程为231222ln ()01n n n n d L d θθθθ++=-=-. 得θ的极大似然估计量122ˆ2n n nθ+=. 【例】设12,,n X X X L 为总体的一个样本,求下列总体概率密度中的未知参数的极大似然估计()1,(;)0,x u ex u f x θθθ--⎧≥⎪=⎨⎪⎩其他,其中0θ>,,u θ为常数.【解】设12,,n x x x L 是样本12,,n X X X L 的观测值,则参数θ的似然函数为1(())1,(,)0,ni i x u i n e x u L u θθθ=--⎧∑⎪≥=⎨⎪⎩其他. 取对数 1ln (,)ln ()nii L u n x u θθθ==---∑.对参数,u θ求偏导,令其为0,则21ln (,)()0ln (,)0n i i L u n x u L u n u θθθθθθ=∂⎧=-+-=⎪⎪∂⎨∂⎪==⎪∂⎩∑110n i i u x x n n θθ=⎧+==⎪⎪⇒⎨⎪=⎪⎩∑. 显然,上式第二式不能求出参数,u θ的关系,但由定义,当θ固定时,要使(,)L u θ最大,只需u 最大,因12,,n u x x x ≤L ,则参数u 的似然估计值为(1)ˆux =,从而得参数θ的极大似然值为(1)ˆx x θ=-,故,u θ的极大似然估计量为(1)ˆu X =,(1)ˆX X θ=-.基本题型Ⅲ 评价估计量的标准(无偏性与有效性)【例】 样本12,,n X X X L 取自总体X ,2,EX u DX σ==,则可以作为2σ的无偏估计的是 【 】()A 当u 已知时,统计量21()ni i X u n =-∑. ()B 当u 已知时,统计量21()(1)ni i X u n =--∑.()C 当u 未知时,统计量21()ni i X u n =-∑. ()D 当u 未知时,统计量21()(1)ni i X u n =--∑.【分析】当u 已知时,21()nii Xu n =-∑为统计量,利用定义有22()i i DX E X u DX σ=-==.从而 222111[()]()nn nii i i i i E Xu E X u DX n σ===-=-==∑∑∑,故 222211[()][()]nni i i i E Xu n E X u n n n σσ==-=-==∑∑.而 222211[()(1)][()](1)1)nnii i i E Xu n E X u n n n σσ==--=--=-≠∑∑所以当u 已知时,()A 入选,()B 不能入选.当u 未知时,样本函数21()nii Xu n =-∑,21()(1)ni i X u n =--∑均不是统计量,因而不能作为2σ的估计量,更不能作为无偏估计量. 选()A .【例】设12,,n X X X L 是总体X 的简单随机样本,则下列不是总体期望u 的无偏估计 【 】()A 11ni i X n =å. ()B 120.20.50.3n X X X ++.()C 12X X + . ()D 123X X X -+. 【分析】要验证统计量是否为无偏估计,即验证ˆE θθ=.1111[]n ni i i i E X EX u n n====邋;1212[0.20.50.3]0.20.50.30.20.50.3n n E X X X EX EX EX u u u u ++=++=++=; 1212[]2E X X EX EX u u +=+=?;123123[]E X X X EX EX EX u u u u -+=-+=-+=;选()C .【例】试证明均匀分布1,0(;)0,x f x θθθ⎧<≤⎪=⎨⎪⎩其他中未知参数θ的极大似然估计量不是无偏的.【分析】 涉及总体分布时,先求估计量的概率密度(或分布律).【解】设12,,n x x x L 是样本12,,n X X X L 的观测值,则参数θ似然函数为1(),0,1,i nL x i n θθθ=<≤=L .是θ的一个单值递减函数.由于每一个i x θ≤,最大次序统计量的观测值()1max n i i nx x θ≤≤=≤ 在0,1,,i x i n θ<≤=L 中要使1()nL θθ=达到极大,就要使θ达到最小.但θ不能小于()n x ,否则样本观测值12,,n x x x L 就不是来自这一总母体,所以()ˆn x θ=是θ的极大似然估计值.故最大次序统计量()ˆn X θ=是参数θ的极大似然估计量. 为要证明估计量()ˆn X θ=不是θ的无偏估计量,需求出()[]n E X ,为此先求()n X 的概率密度.因统计量()ˆn X θ=为随机样本12,,n X X X L 的最大值,而12,,n X X X L 独立同分布,故()n X 的概率分布函数为()ˆ()()[()]n n X F x F x F x θ==,其中()F x 为总体X 的分布函数. 由X 的概率密度可知0,0(),01,xF x x x x θθθ≤⎧⎪=<≤⎨⎪>⎩.因此()111ˆˆ,0()()[()]{[()]}()()0,n n n n n X nx x f x f x F x F x nFx f x 其他θθθθ---⎧<≤''====⋅=⎨⎩从而 1ˆ()1n nnx n E xf x dx dx n θθθθθ-+∞-∞===≠+⎰⎰. 即极大似然估计量ˆθ不为参数θ的无偏估计. 【例】若未知参数θ的估计量是$θ,若θθ=)ˆ(E 称$θ是θ的无偏估计量.设$$12,θθ是未知参数θ的两个无偏估计量,若)ˆ()ˆ(21θθD D <则称$1θ较$2θ有效.【分析】由无偏估计量和有效性的定义可得.【评注】估计量的有效性是在无偏估计类的基础上定义的,这一点也特别明确. 【例】设总体2(,2)X N u :,123,,X X X 为总体的一个样本,试证明11231ˆ(2)4uX X X =++和21231ˆ()3u X X X =++均为总体期望的无偏估计,并比较哪一个更有效.【证明】由于112311ˆ()(2)(4)44E uEX EX EX EX u =++== 21231ˆ()()3E uEX EX EX u =++= 故统计量12ˆˆ,uu 均为期望u 的无偏估计,又 2211231333ˆ()(4)216882D uDX DX DX σ=++==⨯=. 2221231314ˆ()()29933D uDX DX DX σ=++==⨯=. 由于12ˆˆ()()D uD u >,故2ˆu 是比1ˆu 更有效的估计量. 【例】从总体X 中抽取样本12,,n X X X L ,设12,,n C C C L 为常数,且11nii C==∑,证明:(1)1ˆni ii uC X==∑为总体均值u 的无偏估计;(2)在所有这些无偏估计量1ˆni i i uC X ==∑中,样本均值11ni i X X n ==∑的方差最小. 【分析】注意到样本12,,n X X X L 相互独立,且与总体X 同分布,易得ˆu的无偏性及其方差ˆ()D u,利用拉格朗日乘数法则,不难证明,当ˆu X =时方差最小. 【证明】因为样本,(1,,)i X i n =L 与总体X 服从相同分布,故 ,1,2,,i EX EX u i n ===L又11nii C==∑,则11ˆ()()n ni i i i i i EuE C X C EX u =====∑∑ 从而1ˆni ii uC X==∑为总体均值u 的无偏估计.设总体方差2DX σ=,则2,1,2,i DX DX i n σ===L .又样本12,,n X X X L 相互独立,故222111ˆ()()n nniiii i i i i DuD C X CDX C σ======∑∑∑为确定u 的无偏估计量ˆu的方差ˆ()D u 在什么情况下最小,应当求ˆ()D u 满足条件11nii C==∑的条件极值.为此考虑函数 22111(,)()(1)nnn ii i i G C C CC σλ===+-∑∑L ,其中λ为常数.求偏导数(1,2,)iGi n C ∂=∂L ,并令它们等于零,得 220,1,2,i C i n σλ+==L (*)即 2,1,2,2i C i n λσ=-=L .代入11ni i C ==∑,得212n λσ-=,即22n σλ-= 代入方程(*)中,即得1,1,2,i C i n n==L 由此可知,当11ˆni i uX X n ===∑时,方差最小. 【例】设分别来自总体21(,)N u σ和22(,)N u σ中抽取容量为12,n n 的两个独立样本,其样本方差分别为21S ,22S ,试证:对于任意常数,,(1)a b a b +=,2212Z aS bS =+都是2σ得无偏估计,并确定常数,a b ,使DZ 最小.【证明】由题意,222212()EZ aES bES a b σσ=+=+=. 故对任意常数,,(1)a b a b +=,2212Z aS bS =+都为2σ得无偏估计.由于222(1)(1)n S n χσ--:,则22(1)()2(1)n S D n σ-=-,即224(1)2(1)n DS n σ-=-,故4221DS n σ=-,则 44222222121222(1)11DZ a DS b DS a a n n σσ=+=+--- 对a 求导,并令其为零,有 44122222(1)011dDZ a a da n n σσ=--=--解得 12121211,22n n a b n n n n --==+-+-.又 24421244011d DZ da n n σσ=+>--,故当12121211,22n n a b n n n n --==+-+-时,DZ 达到最小值. 11、设12,,n X X X L 为来自正态总体2(,)N u σ的简单随机样本,u 已知,22*11ˆS σ=,222ˆS σ=,22311ˆ()1n i i X X n σ==-+∑,22411ˆ()n i i X u n σ==-∑.问在21ˆσ,22ˆσ,23ˆσ,24ˆσ中(1)那个是2σ的无偏估计量;(2)那个比较有效;(3)那个方差最小;(4)那个是2σ的相合估计量.【分析】因为2222312222ˆˆˆ(1)(1)(1)n n n n σσσχσσσ+-==-:,又(0,1)i X uN σ-:,故22221()()(1)i i X uX u χσσ-=-:,由2χ分布性质知2242ˆ()n n σχσ:.从而可求诸估计量的数学期望与方差,并回答上述问题.【解】由分析知221ˆE σσ=,2222(1)ˆ()n E n nσσσ-=→→∞, 22231ˆ()1n E n n σσσ-=→→∞+,224ˆE σσ=. 且 4212ˆ0()1D n n σσ=→→∞-,24222(1)ˆ0()n D n n σσ-=→→∞, 24322(1)ˆ0()(1)n D n n σσ-=→→∞+,4242ˆ0()D n nσσ=→→∞ 从而(1)21ˆσ与24ˆσ为2σ的无偏估计量; (2)24ˆσ比21ˆσ有效;(因为2241ˆˆD D σσ<);(3)22223241ˆˆˆˆD D D D σσσσ<<<, 即估计量23ˆσ方差最小. (4)21ˆσ,22ˆσ,23ˆσ与24ˆσ均为2σ的相合估计.基本题型Ⅳ 评价估计量的标准(一致性)【例】 设总体的期望u 和方差2σ均存在,求证:(1)样本均值11ni i X X n ==∑是u 的一致估计.(2)如总体服从正态分布,则样本修正方差2211()1ni i S X X n ==--∑为2σ的一致估计. 【分析】要证明参数θ的估计量ˆθ的一致性,关键是要证明:对任意0ε>,有{}ˆlim 1n n P θθε→∞-<=.从事件对应概率{}ˆnP θθε-<的极限求解上,可以使用切比雪夫不等式,即{}2ˆ()ˆD Pθθθεε-≥≤或{}2ˆ()ˆ||1D Pθθθεε-<≥-.【证明】(1)由切比雪夫不等式有,对0ε∀>2111()11(||)111()ni ni i i D X n P X u n n nσεεε==≥-<≥-=-→→∞⋅∑∑.由夹逼定理可得,{}lim 1n P X u ε→∞-<=,即11ni i X X n ==∑为参数u 的一致估计量.(2)因为2221111[()]()11n n i i i i ES E X X E X X n n ===-=---∑∑. 22221111[][]11nn i i i i E X nX EX nEX n n ===-=---∑∑ 2222211[()()]1n i u n u n nσσσ==+-+=-∑,即2S 为2σ的无偏估计. 又样本来自正态总体,由抽样分布定律知222(1)(1)n S n χσ--:,有22(1)()2(1)n S D n σ-=-从而22424422222(1)(1)2()()()2(1)(1)(1)(1)1n S n S D S D D n n n n n σσσσσσ--===-=----.由切比雪夫不等式有,0ε∀>2422()21(||)111()(1)D S P S n n σσεεε≥-<≥-=-→→∞-从而有22lim (||)1n P S σε→∞-<=,即2S 为2σ的一致估计量.【例】设ˆn θ为θ的估计量(用容量为n 的样本),如果ˆlim n n E θθ→∞=,ˆlim 0n n D θ→∞=,则ˆnθ为θ的一致估计量.【证明一】为证ˆnθ为θ的一致估计量,下证{}ˆlim 0n n P θθε→∞-≥=. 而 {}22ˆˆ22ˆˆˆ()()ˆ()()nnn nnnE P f x dx f x dx θθθθεθθθθθθεεε+∞-∞-≥---≥=≤=⎰⎰又 22222ˆˆˆˆˆ()(2)2n n n n n E E E E θθθθθθθθθθ-=-+=-+ 22ˆˆˆ()2n n nD E E θθθθθ=+-+ 故{}22ˆ()ˆlim lim[]0n n n n E P θθθθεε→∞→∞--≥≤=,即ˆn θ为θ的一致估计量. 【证明二】由切比雪夫不等式有{}2ˆˆ(||)n nP D θθεθθε-≥≤-. 而 222ˆˆˆˆ(||)()(||)()n n n nD E E E θθθθθθθθ-=---≤-. 由证明一知,2ˆlim (||)0nn E θθ→∞-=,或者用下列方法直接证明 22ˆˆˆˆ()()n n n nE E E E θθθθθθ-=-+- 22ˆˆˆˆˆˆ()2[()()]()n n n n n n E E E E E E E θθθθθθθθ=-+--+- 222ˆˆˆˆˆ0()()2n n n n nD E D E E θθθθθθθθ=++-=+-+ 22222ˆˆˆˆ()220()n n n n D D E E n θθθθθθθθθ=++-+→-+=→∞ 故{}ˆlim 0n n P θθε→∞-≥=,即ˆnθ为θ的一致估计量. 【评注】用定义验证估计量是一致估计量,一般都不太容易,可利用上例中的结论证明之,从而将统计量的一致性的证明转化为统计量的期望与方差的极限性质的论述,这是一个比较实用的证法.【例】设随机变量X 在[0,]θ上服从均匀分布,由此总体中抽取一随机样本1X ,试证明:1121ˆˆ2,X X θθ==都不为θ的一致估计.【分析】由上例(例)可知,只需论证估计量的期望和方差的极限性质.【证明】因111ˆ(2)222E E X EX θθθ===⋅=,故1ˆθ为θ的无偏估计,且21ˆ2E EX θθθ==≠,故2ˆθ不为θ的无偏估计.为证1ˆθ不为θ的一致估计,只需证明1ˆlim 0n D θ→∞= 22111ˆlim lim (2)lim 4lim 4lim0123n n n n n D D X DX θθθ→∞→∞→∞→∞→∞===⋅=≠.故1ˆθ不为θ的一致估计. 【例】设总体X 服从均匀分布[0,]U θ,试证明:θ的极大似然估计()1max n i i nX X ≤≤=为θ的一致估计.【证明】 设总体X 的密度函数为()f x ,则1,0()0,x f x θθ⎧≤≤⎪=⎨⎪⎩其他,故最大次序统计量()n X 的概率密度函数为1,0()0,n n n nx x f x θθ-⎧≤≤⎪=⎨⎪⎩其他,从而1()0()0()1n n nnx nE X xdx n n θθθ-==→→∞+⎰ 且 1222()()2n n nnx nE Xxdx n θθθ-==+⎰ 故222()()()()()()2n n n n D X E X EX EX θθθ=-=-+ 2222220()21(1)(2)n n n n n n n θθθθ=-+=→→∞++++ 由前例可知,θ的极大似然估计()1max n i i nX X ≤≤=为θ的一致估计.基本题型Ⅴ 求置信区间相关题型【例】设θ是总体X 中的参数,称),(θθ为θ的置信度a -1的置信区间,即【 】()A ),(θθ以概率a -1包含θ . ()B θ 以概率a -1落入),(θθ.()C θ以概率a 落在),(θθ之外 . ()D 以),(θθ估计θ的范围,不正确的概率是a -1.【分析】由置信区间的定义可知, 区间(),θθ为随机区间. 选()A .【例】设),(~2σμN X 且2σ未知,若样本容量为n ,且分位数均指定为“上侧分位数”时,则μ的95%的置信区间为 【 】()A )(025.0u n X σ±.()B ))1((05.0-±n t nS X .()C ))((025.0n t nS X ±. ()D ))1((025.0-±n t nS X .【分析】由题意,总体),(~2σμN X ,且2σ未知,故应构造统计量(1)X T t n =-:,则参数μ的置信水平为195%α-=的置信区间为))1((025.0-±n t nS X .选()D .【例】假设00.2,80.0,25.1,50.0是总体X 的简单随机样本值,已知X Y ln =服从正态分布)1,(μN .(1)求X 的数学期望EX (记EX 为b ); (2)求μ的置信度为95.0的置信区间;(3)利用上述结果求b 的置信度为95.0的置信区间.【解】(1)Y 的概率密度为: +∞<<-∞=--y y f e y ,21)(22)(μπ,于是,(令μ-=y t )dy Ee EX b ee y y Y ⎰+∞∞---===2)(221μπ22111222(1)2t t t dt dt e e eem m m +??+-+--+??===蝌(2)当置信度95.01=-α时,05.0=α.标准正态分布的水平为05.0=α的分位数为96.105.0=μ.故由)41,(~μN Y ,可得95.096.12196.12196.121=⎭⎬⎫⎩⎨⎧⨯+<<⨯-=⎭⎬⎫⎩⎨⎧<-Y Y P Y P μμ其中01ln 41)2ln 125.0ln 8.0ln 5.0(ln 41==+++=Y . 于是 {}95.098.098.0=<<-μP 从而)98.0,98.0(-就是μ的置信度为95.0的置信区间. (3)由函数xe 的严格递增性,有{}e e eP P 48.148.02148.12148.095.0<<=⎭⎬⎫⎩⎨⎧<+<-=+-μμ 因此b 的置信度为95.0的置信区间为),(48.148.0e e-.【例】某工厂生产滚珠,从某日生产的产品中随机抽取9个,测得直径(单位:毫米)如下,,,,,,,,设滚珠直径服从正态分布,若(1) 已知滚珠直径的标准差为0.15σ=毫米; (2) 未知标准差σ;求直径均值u 的置信度的置信区间.【分析】对于正态分布总体,若已知标准差σ时,均值u 的置信度1α-的置信区间为/2/2X u X u αα⎛-+ ⎝;未知标准差σ时,均值μ的置信度1α-的置信区间为/2/2((X t n X t n αα⎛--+- ⎝,其中S 时样本的标准差.【解】(1)0.025 1.96u =,9n =.经计算14.91x =.故已知滚珠直径的标准差0.15σ=毫米时,直径u 的置信度的置信区间为:()14.91 1.96 1.9614.81,15.01⎛-+= ⎝.(2)经计算:样本标准差0.2028S =,查表可知0.025(8) 2.306t =,于是直径u 的置信度的置信区间为:()14.91 2.306 2.30614.75,15.07⎛-+= ⎝.【例】设某糖厂用自动包装机装箱外运糖果,由以往经验知标准差为,某日开工后在生产线上抽测9箱,测得数据如下(单位:kg ),,,,,,,,(1)试估计生产线上包装机装箱糖果的期望重量的区间估计(0.05α=);(2)试求总体标准差σ的置信度为的置信区间,并判断以前经验数据标准差为是否仍然合理可用?【解】(1)由题设可知,总体方差 1.15σ=为已知,根据经验数据有911899.899.9899i i x x ====∑,当0.05α=时,查表可得0.02521.96U U α==,故参数u 的置信度为的置信区间为0.0250.025((99.23,100.73)x U x U -+=.(2)由题设可知总体均值未知,故根据经验数据有2211() 1.4694n i i S x x n ==-=∑,当0.05α=时,查表可得220.9750.025(8) 2.180,(8)17.35χχ==,从而参数2σ的置信度为的置信区间为22220.0250.975(1)(1),(0.6704,5.3923)(8)(8)n S n S χχ⎛⎫--= ⎪⎝⎭,故参数σ的置信度为的置信区间为(0.8188,2.3221).而以往经验数据标准差为 1.15S =,仍然在(0.8188,2.3221)内,故认为仍然合理可用.【例】设总体X 服从正态分布2(,)N u σ,已知220σσ=,要使总体均值u 对应于置信水平1α-的置信区间的长度不大于l ,问应抽取多大容量的样本?【解】由于2(,)X N u σ:,且220σσ=为已知,因此当置信水平1α-时,均值u 的置信区间为22(,)X X αα,其区间长度为2α,于是有2l α≤,即可得220224n U l ασ≥. 【例】设总体X 服从正态分布2(,)N u σ,20,u σ均为未知参数,12,,n X X X L 为来自总体X 的一个随机样本,求关于u 的置信水平为1α-的置信区间的长度l 的平方的数学期望.【解】因20σ未知,选用统计量(1)X T t n =-:.得参数u 的置信水平为1α-的置信区间为/2/2((X t n X t n αα⎛--+- ⎝,其区间长度为/22(l t n α=-,于是2222222/2/2/244[4(1)](1)()(1)S El E t n t n E S t n n n n nααασ=-=-=-.【例】在甲乙两城市进行家庭消费调查,在甲市抽取500户,平均每户每年消费支出3000元,标准差为1400S =元;在乙市抽取100户,平均每户每年支出4200元,标准差为2500S =元,设两城市家庭消费支出均服从正态分布211(,)N u σ和222(,)N u σ,试求: (1)甲乙两城市家庭平均每户年消费支出间差异的置信区间(置信度为);(2)甲乙两城市家庭平均每户消费支出方差比的置信区间(置信度为).【解】(1)在本题中虽211,u σ和222,u σ均未知,但由于抽取样本500,1000n m ==都很大(在使用中只要大于50即可),故可用U 统计量,即参数12u u -的置信度为1α-的置信区间为X Y uX Y u ⎛---+ ⎝,故由3000X =,4200Y =,1400S =,2500S =以及10.95α-=即0.05α=,查表可得0.025 1.96u =,因此30004000 1.96120046.79X Y u ⎛-±=-±-± ⎝ 即甲乙两城市家庭平均每户年消费支出间差异的置信度为的置信区间为(1246.79,1153.21)--,由于此置信区间的上限小于零,在实际问题中可认为乙市家庭平均每户年消费支出要比甲市大.(2)由500,1000n m ==,1400S =,2500S =,10.90α-=即0.1α=,查表可得: 0.052(1,1)(499,999) 1.13F n m F α--==,0.9510.05211(1,1)(499,999)(999,499) 1.11F n m F F α---=== ,且2212224000.64500S S == 于是所求的置信区间为22112220.0520.95110.64,(,0.64 1.11)(0.566,0.710)(499,999)(499,999) 1.13S S S F S F ⎛⎫=⨯= ⎪⎝⎭ 由于置信区间上限小于1,故可认为乙市家庭平均每户年消费支出的方差要比甲市大. 【例】某商店销售的一种商品来自甲乙两个厂家,为考察商品性能上的差异,现从甲乙两个厂家生产产品中分别抽取了8见和9件产品,测其性能指标X 得到两组样本观测值,经计算得 2.190X =, 2.238Y =,210.006S =,220.008S =假设性能指标X 均服从正态分布2(,)(1,2)i iN u i σ=,试求方差比2122σσ及均值差12u u -的90%的置信区间.【解】(1)先求方差比2122σσ置信度为90%的置信区间.由10.90α-=即0.1α=,查F 分布表可得0.052(1,1)(7,8) 3.5F n m F α--==,0.9510.05211(1,1)(7,8)(8,7) 3.73Fn m F F α---===故所求置信区间为22112220.0520.95110.00610.006,(, 3.73)(0.214,2.798)(7,8)(7,8)0.0083.500.008S S S F S F ⎛⎫=⨯= ⎪⎝⎭. 由于此区间包含1,故可认为2212σσ=.(3)由(1)可知,2212,σσ未知,但22212σσσ==,因此12u u -的置信区间为()/220.048 1.75310.0840.4860.0480.0716X Y t n m S α-±+-=-±⨯⨯=± 即(0.1196,0.0236)-,其中0.05(15) 1.7531t =,()()22122110.00712wn S m S S n m -+-==+-,即两个厂家生产的产品性能上无显著性差异.§历年考研真题评析1、【02.3.3】 设总体X 的概率密度为(),,(;)0,.x e x f x x q q q q --ìï³ï=íï<ïî,而12,,,n X X X L 是来自总体X 的简单随机样本,则未知参数q 的矩估计量为_________.【分析】由于()()1x E X xe dx q qq +?--==+ò,因此,()1E X q =-,q 的矩估计量为11ˆ11ni i X X n q ==-=-å.2、【04.3.4】设总体X 服从正态分布21(,)N m s ,总体Y 服从正态分布22(,)N m s ,112,,,n X X X L 和 212,,,n Y Y Y L 分别是来自总体X 和 Y 的简单随机样本,则12221112()()2n n i i i j X X Y Y E n n ==轾犏-+-犏犏=犏+-犏犏臌邋__________. 【分析】由于11222211111(),()(1)1n n i i i i E X X EX X n n s s ==骣骣鼢珑鼢-=-=-珑鼢珑鼢-桫桫邋;22221()(1)n i j E Y Y n s =骣÷ç÷-=-ç÷ç÷ç桫å. 因此, 原式1212n n =+-1222211()()n n i i i j E X X Y Y s ==骣÷ç÷-+-=ç÷ç÷ç桫邋. 3、【】设总体X 的概率密度为(1),01()0,x x f x θθ⎧+<<=⎨⎩其他其中1θ>-是未知参数,12,,n x x x L 是来自总体X 的一个容量为n 的简单随机样本,分别用矩估计法和极大似然估计法求θ的估计值.【解】总体X 的数学期望为1101()(1)2EX xf x dx x dx θθθθ+∞+-∞+==+=+⎰⎰ 令12X θθ+=+,得参数θ的矩估计量为21ˆ1X X θ-=-. 设12,,n x x x L 是相应于样本12,,n X X X L 的一组观测值,则似然函数为1(1),01(1,2,)0,n ni i i x x i n L θθ=⎧⎛⎫+<<=⎪ ⎪=⎨⎝⎭⎪⎩∏L 其他 当01(1,2,)i x i n <<=L 时,0L >且1ln ln(1)ln nii L n xθθ==++∑令1ln ln 01ni i d L n x d θθ==+=+∑,得θ的极大似然估计值为 1ˆ1ln nii nxθ==--∑.从而θ的极大似然估计量为1ˆ1ln nii nXθ==--∑.4、【】设总体X 的概率密度函数为36(),0()0,xx x f x θθθ⎧-<<⎪=⎨⎪⎩其他,12,,n X X X L 是取自总体X 的简单随机样本.(1)求θ的矩估计量ˆθ; (2)求ˆθ的方差ˆ()D θ. 【解】(1)236()()2x EX xf x dx x dx θθθθ+∞-∞==-=⎰⎰记11n i i X X n ==∑,令2X θ=,得θ的矩估计量ˆ2X θ=. (2)由于32223066()()20x EX x f x dx x dx θθθθ+∞-∞==-=⎰⎰222226()()20220DX EX EX θθθ=-=-=因此ˆ2X θ=的方差为 24ˆ(2)4()5D D X D X DX n nθθ====. 5、【00.1.6】设某种元件的使用寿命X 的概率密度函数为2()2,(,)0,x e x f x x θθθθ--⎧>=⎨≤⎩,其中0θ>为未知参数,又设12,,n x x x L 是X 的一组样本观测值,求参数θ的最大似然估计值.【解】似然函数为12()122,(1,2,)()(,,;)0,ni i x ni n e x i n L L x x x θθθθ=--⎧∑⎪≥===⎨⎪⎩L L 其他 当(1,2,)i x i n θ≥=L 时,()0L θ>,取对数,得 1ln ()ln 22()nii L n x θθ==--∑因为ln ()20d L n d θθ=>,所以()L θ单调增加.由于θ必须满足(1,2,)i x i n θ≥=L ,因此当θ取12,,n x x x L 中的最小值时,()L θ取最大值,所以θ的最大似然估计值为12ˆmin(,,)n x x x θ=L ,最大似然估计量为12ˆmin(,,)nX X X θ=L . 6、【04.1.9】 设总体X 的分布函数为11,1(,)0,1x F x xx ββ⎧->⎪=⎨⎪≤⎩,其中未知参数1β>,12,,n X X X L 为来自总体X 的简单随机样本,求(1)β的矩估计量; (2)β的极大似然估计量.【解】X 的概率密度函数为1,1(,)0,1x f x x x βββ+⎧>⎪=⎨⎪≤⎩(1)由于11(;)1EX xf x dx xdx xβββββ+∞+∞+-∞===-⎰⎰令1X ββ=-,解得ˆ1X X β=-,故参数β的矩估计量为ˆ1X X β=-. (2)似然函数为1121,1(1,2,)()(,)()0,1nni i n i x i n L f x x x x x ββββ+=⎧>=⎪==⎨⎪≤⎩∏L L当1(1,2,)i x i n >=L 时,()0L β>,取对数得1ln ()ln (1)ln nii L n x βββ==-+∑,两边对β求导,得1ln ()ln ni i d L n x d βββ==-∑, 令ln ()0d L d ββ=,可得1ˆln nii nxβ==∑,故β的极大似然估计量为1ˆln nii nXβ==∑.7、【06.1.9】设总体X 的概率密度为,01(,)1,120,x f x x θθθ<<⎧⎪=-≤≤⎨⎪⎩其他,其中(01)θθ<<是未知参数,12,,n X X X L 为来自总体的简单随机样本,记N 为样本值12,,n x x x L 中小于1的个数,求θ的最大似然估计.【解】 由题意,设样本12,,n x x x L 按照从小到大为序(即顺序统计量的观测值)有如下关系:(1)(2)()(1)()1N N n x x x x x +≤≤≤≤≤≤≤L L L似然函数为(1)(2)()(1)()(1),1()0,N n N N N n x x x x x L θθθ-+⎧-≤≤≤≤≤≤≤=⎨⎩L L L 其他对似然函数非零部分取对数得到 ln ()ln ()ln(1)L N n N θθθ=+--ln ()01d L N n N d θθθθ-=-=-,从而ˆN n θ=,即θ的最大似然估计值为N n. 【评注】本题着重考察了最大似然估计的概念和求似然估计的基本方法,本题的难点是“N 为样本值12,,n x x x L 中小于1的个数”的理解.8、【09.1.11】设总体X 的概率密度为2,0()0,x xe x f x λλ-⎧>=⎨⎩其他,其中参数λλ>(0)未知,12,,n X X X L 是来自总体X 的简单随机样本 (1)求参数λ的矩估计量;(2)求参数λ的最大似然估计量. 【解】(1)由题意,2202x EX x e dx X λλλ+∞-===⎰,从而2ˆXλ=为总体的矩估计量. (2)构造似然函数121211(,,;)(;)nii nnx nn iii i L x x x f x x eλλλλ=-==∑==⋅∏∏L .取对数11ln 2ln ln nniii i L n x x λλ===+-∑∑.令ln 0d L d λ=,有120n i i n x λ=-=∑,故λ的最大似然估计值为1122ˆ1nn i i i i n x x n λ====∑∑ 故其最大似然估计量为122ˆ1ni i XX n λ===∑. 9、【04.3.13】设随机变量X 的分布函数为1(),(,,)0,x F x xx βαααβα⎧->⎪=⎨⎪≤⎩,其中参数0,1αβ>>,设12,,n X X X L 为来自总体X 的简单随机样本.(1)当1α=时,求未知参数β的矩估计量; (2)当1α=时,求未知参数β的最大似然估计量; (3)当2β=时,求未知参数α的最大似然估计量.【解】当1α=时,X 的概率密度为1,1(,)0,1x f x x x βββ+⎧>⎪=⎨⎪≤⎩(1)由于11(,)1EX xf x dx x dx xβββββ+∞+∞+-∞==⋅=-⎰⎰令1X ββ=-,解得1XX β=- 从而得未知参数β的矩估计量为ˆ1XX β=-. (2)对于总体X 的样本值12,,n x x x L ,似然函数为1121,1(1,2,)()(;)()0,nni i n i x i n L f x x x x ββββ+=⎧>=⎪==⎨⎪⎩∏L L 其他当1(1,2,)i x i n >=L 时,()0L β>,取对数得1ln ()ln (1)ln ni i L n x βββ==-+∑对β求导数,得似然方程1[ln ()]ln 0ni i d L n x d βββ==-=∑ 解得 1ln nii nxβ==∑,于是β的最大似然估计量为1ˆln nii nXβ==∑.(3)当2β=时,X 的概率密度为232,(,)0,x f x x x ααβα⎧>⎪=⎨⎪≤⎩对于总体X 的样本值12,,n x x x L ,似然函数为231212,(1,2,)()(;)()0,n nni i n i x i n L f x x x x ααββ=⎧>=⎪==⎨⎪⎩∏L L 其他当(1,2,)i x i n α>=L 时,α越大,()L α越大,即α的最大似然估计值为12ˆmin{,,}n x x x α=L . 于是α的最大似然估计量为12ˆmin{,,}n X X X α=L . 10、【03.1.8】设总体X 的概率密度函数为2()2,(,)0,x e x f x x θθθθ--⎧>=⎨≤⎩,其中0θ>为未知参数.从总体X 中抽取简单随机样本12,,n X X X L ,记12ˆmin(,,)nX X X θ=L . (1)求总体X 的分布函数()F x ;(2)求统计量ˆθ的分布函数ˆ()F x θ; (3)如果用ˆθ作为θ的估计量,讨论它是否具有无偏性. 【解】(1)2()1,()()0,x xe x F xf t dt x θθθ---∞⎧->==⎨≤⎩⎰(2)ˆ12ˆ(){}{min(,,)}nF x P x P X X X x θθ=≤=≤L 12121{min(,,)}1{,,}n n P X X X x P X x X x X x =->=->>>L L2()1,1[1()]0,n x ne x F x x θθθ--⎧->=--=⎨≤⎩(3)ˆθ概率密度为 2()ˆˆ()2,()0,n x dF x ne x f x dx x θθθθθ--⎧>==⎨≤⎩因为 2()ˆ01ˆ()22n x E xf x dx nxe dx nθθθθθ+∞+∞---∞===+≠⎰⎰ 所以ˆθ作为θ的估计量不具有无偏性. 11、【07.1.11】设总体X 的概率密度为1,021(,),12(1)0,x f x x θθθθθ⎧<<⎪⎪⎪=≤≤⎨-⎪⎪⎪⎩其他,其中(01)θθ<<是未知参数,12,,n X X X L 为来自总体的简单随机样本,X 是样本均值.(1)求参数θ的矩估计量ˆθ; (2)判断24X 是否为2θ的无偏估计量,并说明理由. 【解】(1)10(,)22(1)x xEX xf x dx dx dx θθθθθ+∞-∞==+-⎰⎰⎰11(1)4424θθθ=++=+. 令124X θ+=,其中11n i i X X n ==∑,解方程得θ的矩估计量为:1ˆ22X θ=-. (2) 2222(4)4()4[()]4[()]DXE X E X DX E X E X n==+=+ 而22122(,)22(1)x x EX x f x dx dx dx θθθθθ+∞-∞==+-⎰⎰⎰22221111()()()36624DX E X E X θθθ=-=++-+211366θθ=++2115121248θθ=-+. 故2222313135(4)4[()]312DX n n n E X E X n n n nθθθ+-+=+=++≠所以24X 不是2θ的无偏估计量.12、【(3).11】设12,,n X X X L 是总体2(,)N u σ的简单随机样本,记11n i i X X n ==∑,2211()1n ii S X X n ==--∑,221T X S n=- (1) 证T 是2u 的无偏估计量; (2) 当0,1u σ==时,求DT .【分析】(1)要证2ET u =;(2)求DT 时,利用2X 与2S 独立性.【解】(1)222211()()()ET E X S E X E S n n=-=- 222222111()()()D X E X E S u u n n nσσ=+-=+-=所以T 是2u 的无偏估计量.(2)当0,1u σ==时,(0,1)X N :,1(0,),0X N ET n=:2222211()()()DT D X S D X D S n n=-=+22222111[(1)](1)D D n S n n n =+-- 22221122(1)(1)(1)n n n n n n =+⋅-=--. 【评注】若2(,)X N u σ:,则22222222111,,,()2(1),((1))n n EX u DX ES D S n S n n σσχσσ--====--:.13、【03.1.4】已知一批零件的长度X (单位cm )服从正态分布(,1)N m ,从中随机地抽取16个零件,得到长度的平均值为40(cm ),则m 的置信度为的置信区间是_____.(注:标准正态分布函数值(1.96)0.975,(1.645)0.95F =F =).【分析】这是一个正态分布方差已知求期望值m 的置信区间问题,该类型置信区间公式为(,)I x x=-+ 其中l 由{||}0.95P U l <=确定((0,1)U N :),即 1.96l =,将40,1,16x n s ===及1.96l =代入得到m 的置信度为的置信区间为(,).14、【05.3.13】设12,,(2)n X X X n >L 为来自总体2(0,)N σ的简单随机样本,X 为样本均值,记,1,2,i i Y X X i n =-=L ,求 (1)i Y 的方差,1,2,i DY i n =L ; (2)1Y 与n Y 的协方差1(,)n Cov Y Y ;(3)若21()n c Y Y +是2σ的无偏估计量,求常数c .【解】由题设12,,(2)n X X X n >L 是简单随机样本,因此12,,(2)n X X X n >L 相互独立,且与总体同分布,即22(0,),0,(1,2,)i i i X N EX DX i n σσ===:L .(1)111(1)n i i j i j j iY X X X X n n=≠=-=-+-∑.111()[(1)]n i i j i j j iDY D X X D X X n n=≠=-=-+-∑22222211111(1)1()(1)n n j i j j j ij in n DX DX DX DX n n n n nσ==≠≠--=-+-=+=∑∑. (2)12,,(2)n X X X n >L 相互独立,所以 ,(,),1,2,,0,i i j DX i jCov X X i j n i j L =⎧==⎨≠⎩11(,)(,)n n Cov Y Y Cov X X X X =--11(,)(,)(,)(,)n n Cov X X Cov X X Cov X X Cov X X =--+;2111111111(,)(,)(,)n n i i i i Cov X X Cov X X Cov X X DX n n n nσ======∑∑;类似地, 21(,)n n Cov X X DX n nσ==又因为2DX nσ=,故22221(,)0n Cov Y Y nnnnσσσσ=--+=-.(3)首先计算21()n E Y Y +.由于11()0n n E Y Y EY EY +=+=所以 21111()()2cov(,)n n n n E Y Y D Y Y DY Y Y DY +=+=++22221122(2)n n n n n n nσσσσ---=+-= 若21()n c Y Y +是2σ的无偏估计量,c 应满足下面等式2222112(2)[()][()]n n c n E c Y Y cE Y Y nσσ-=+=+=故 2(2)nc n =-.§习题全解( A )1、设总体X 服从参数为N 和p 的二项分布,n X X X ,,,21Λ为取自X 的一个样本,试求参数p 的矩估计量与极大似然估计量.【解】由题意,X 的分布律为: ()(1),0k N kN P X k p p k N k -⎛⎫==-≤≤ ⎪⎝⎭. 总体X 的数学期望为(1)(1)011(1)(1)1NNk N k k N k k k N N EX k p p Np p p k k ----==-⎛⎫⎛⎫=-=- ⎪ ⎪-⎝⎭⎝⎭∑∑ 1((1))N Np p p Np -=+-=则EXp N=.用X 替换EX 即得未知参数p 的矩估计量为ˆX pN =. 设12,,n x x x L 是相应于样本12,,n X X X L 的样本值,则似然函数为111211(,,;)()(1)nniii i nnx nN x n i i i i N L x x x p P X x p p x ==-==∑∑⎛⎫===⋅- ⎪⎝⎭∏∏L取对数111ln ln ln ()ln(1)nnni i i i i i N L x p nN x p x ===⎛⎫=+⋅+-⋅- ⎪⎝⎭∑∑∑,11ln (1)nni i i i x nN x d L dp p p ==-=--∑∑.令ln 0d L dp =,解得p 的极大似然估计值为 11ˆn i i x n p N==∑. 从而得p 的极大似然估计量为 11ˆni i X X n pN N===∑. 2、设n X X X ,,,21Λ为取自总体X 的一个样本,X 的概率密度为22,0(;)0,xx f x θθθ⎧<<⎪=⎨⎪⎩其它.其中参数0θ>,求θ的矩估计. 【解】取n X X X ,,,21Λ为母体X 的一个样本容量为n 的样本,则2022()3xEX xf x dx x dx θθθ+∞-∞==⋅=⎰⎰32EX θ⇒=用X 替换EX 即得未知参数θ的矩估计量为3ˆ2X θ=. 3、设12,,,n X X X L 总体X 的一个样本, X 的概率密度为⎪⎩⎪⎨⎧≤>=--0,0,0,);(1x x e x x f x αλαλαλ其中0>λ是未知参数,0>α是已知常数,求λ的最大似然估计. 【解】设12,,,n x x x L 为样本12,,,n X X X L 的一组观测值,则似然函数为1()1121(),0(,,,;)0,ni i n x n n i i n i x e x L x x x αλαλαλ=--=⎧∑⎪⋅≥=⎨⎪⎩∏L 其他取对数 11ln ln ln (1)(ln )()n niii i L n n x x αλααλ===++--∑∑.解极大似然方程1ln 0n i i d L n x d αλλ==-=∑,得λ的极大似然估计值为1ˆni i nx αλ==∑.4、设总体X 服从几何分布 ,10,,2,1,)1()(1<<=-==-p k p p k X P k Λ试利用样本值n x x x ,,,21Λ,求参数p 的矩估计和最大似然估计.【解】因11111(1)(1)k k k k EX k p p p k p p∞∞--===⋅-=⋅-=∑∑, 用X 替换EX 即得未知参数p 的矩估计量为1ˆpX=.在一次取样下,样本值12(,,,)n x x x L ,即事件1122{},{},,{}n n X x X x X x ===L 同时发生,由于12,,,nX X X L 相互独立,得联合分布律为121122(,,,;)()(),,()n n n L x x x p P X x P X x P X x ====L L12111(1)(1)(1)n x x x p p p p p p ---=-⋅--L ,即得极大似然函数为1()(1)ni i x nnL p p p =-∑=-取对数 1ln ()ln ()ln(1)ni i L p n p x n p ==+--∑解极大似然方程1ln ()01ni i x nd L p n dp p p=-=-=-∑得p 的极大似然估计值为11ˆ1ni i px n ==∑,从而得p 的极大似然估计量为111ˆ1ni i pXX n ===∑. 5、设总体X 的概率密度为()1;exp ,2x f x σσσ⎧⎫=-⎨⎬⎩⎭0σ>为未知参数, n X X X ,,,21Λ为总体X 的一样本,求参数σ的最大似然估计.【解】设12,,,n x x x L 为样本12,,,n X X X L 的一组观测值,则似然函数为 121111(,,,;)(;)(;)exp{||}(2)nn n ini L x x x f x f x x σσσσσ====-∑L L取对数1211ln (,,,;)ln(2)||nn ii L x x x n x σσσ==--∑L . 解极大似然方程21ln 1||0nii d L n x d σσσ==-+=∑.得σ的极大似然估计值11ˆ||ni i x n σ==∑. 6、证明第5题中σ的最大似然估计量为σ的无偏估计量.【证明】由第5题知σ的最大似然估计量为11ˆ||ni i X n σ==∑ 故 1111ˆ(||)||n ni i i i E E X E X n n σ====∑∑ 又 1||||||exp{}2i x E X x dx σσ+∞-∞=⋅-⎰ 0012exp{}exp{}()2x x x x dx x d σσσσ+∞+∞=⋅-=⋅-⎰⎰00[exp{}|exp{}]x xx dx σσσ+∞+∞=-⋅---=⎰.从而 ˆE σσ=,即ˆσ是σ的无偏估计. 7,、设总体X 的概率密度为()222220;0x x e x f x σσσ-⎧⎪>=⎨⎪⎩,,,其它.,20σ>为未知参数,n X X X ,,,21Λ为总体X 的一个样本,求参数2σ的的矩估计量和最大似然估计量.。
1.设,0()0, 0x e x f x x θθ-⎧>=⎨≤⎩,求θ的矩估计。
Ex=2. 岩石密度的测量误差服从正态分布,随机抽测12个样品,得2.0=s ,求2σ的置信区间()1.0=α。
(总体均值未知,求2σ的置信区间)3. 一地质学家研究密歇根湖湖地区的岩石成分,随机地自该地区取100个样品,每个样品有10块石子,记录了每个样品中属石灰石的石子数。
假设这100次观察相互独立,并由过去经验知,它们都服从参数为n=10,P 的二项分布。
P 是该地区一块石子是石灰石的概率。
求p 的极大似然估计值,该地质学家所得的数据如下4. 设X 1,X 1,…,X n 为总体的样本,求各未知参数的极大似然估计值和估计量(1)⎩⎨⎧>=+-其它,0,)()1(cx x c θx f θθ其中c >0为已知,θ>1,θ为未知参数。
(2)⎪⎩⎪⎨⎧≤≤=-.,010,)(1其它x x θx f θ其中θ>0,θ为未知参数。
5. 设某电子元件的寿命服从正态分布),(2σμN ,抽样检查10个元件,得样本均值)(1200h x =,样本标准差)(14h s =。
求 总体均值μ置信水平为%99的置信区间;6. 设样本12,,n X X X 来自总体~(,0.25)X N u ,如果要以99.7%的概率保证0.1Xu -<,试问样本容量n 应取多大?7. 为了解灯泡使用时数均值μ及标准差σ,测量了10个灯泡,得1650=x 20s =小时。
如果已知灯泡使用时间服从正态分布,求μ和σ的95%的置信区间。
8. 设总体X 具有分布律XP k其中θ(0<θ<1)为未知参数。
已知取得了样本值x1=1,x2=2,x3=1,试求θ的矩估计值和最大似然估计值。
关于矩估计与极大似然估计的典型例题
例1,设总体X 具有分布律
⎟⎟⎠
⎞⎜⎜⎝⎛−−22)1()1(2321
~θθθθX 其中10<<θ为未知参数。
已经取得了样本值1,2,1321===x x x ,试求参数θ的矩估计与极大似然估计。
解:(i )求矩估计量,列矩方程(只有一个未知参数)
X
X E =−=−×+−×+=θθθθθ23)1(3)1(22)(22得
6
5234
32x 32X 3=−
=−=−=矩θ(ii ii)求极大似然估计,写出似然函数,即样本出现的概率
)求极大似然估计,写出似然函数,即样本出现的概率)
,,()(332211x X x X x X P L ====θ)1,2,1(321====X X X P )1()2()1(321=×=×==X P X P X P )
1(2)1(2522θθθθθθ−=×−×=对数似然
)
1ln(ln 52ln )(ln θθθ−++=L 0115)(ln =−−=θ
θθθd L d 得极大似然估计为
6
5ˆ=
极θ
例2,某种电子元件的寿命某种电子元件的寿命((以h 记)X 服从双参数指数分布服从双参数指数分布,,其概率密度为
⎪⎩
⎪⎨⎧≥−−=其他,0],/)(exp[1
)(µ
θµθ
x x x f 其中0>µθ,
均为未知参数,自一批这种零件中随机抽取n 件进行寿命试验,设它们的失效时间分别为.
,,2,1n x x x L (1)求µθ,
的最大似然估计量;(2)求µθ,
的矩估计量。
解:(1)似然函数,记样本的联合概率密度为
∏===n
i i n x f x x x f L 1
2,1)
();,,()(µθµθ,,L ⎪⎩
⎪⎨⎧≥−−=∏=其他,0,,,]/)(exp[1
2,11µθµθn n i i x x x x L ⎪⎩
⎪⎨⎧>≤−−=∑=)1()1(1,0),/)(exp(1
x
x n x n
i i n µµθµθ在求极大似然估计时在求极大似然估计时,
,0)(=µθ,L 肯定不是最大值的似然函数值,不考虑这部分,只考虑另一部分。
取另一部分的对数似然函数
)
1(1
,/)(ln ),(ln x n x n L n
i i ≤−−−=∑=µθµθµθ
⎪
⎪⎩
⎪⎪⎨
⎧
>=∂∂=−+−=∂∂∑=0),(ln 0),(ln 2
1
θµµθθµθθµθn
L n x n L n
i i 可知关于µθ,
的驻点不存在,但能判定单调性由
0),(ln >=∂∂θ
µµθn
L 知,
,/)(ln ),(ln )1(1
x n x n L n
i i ≤−−−=∑=µθµθµθ关于µ是增函数,故
)1(ˆx =极µ
将之代入到
0),(ln 2
1
=−+−=∂∂∑=θ
µ
θ
θµθn x
n
L n
i i
中得
)1(ˆx x −=极
θ则)1(ˆx =极µ,)1(ˆx x −=极θ一定能使得似然函数达到最大,故
µθ,的极大似然估计为
⎪⎩⎪⎨
⎧=−=)1()
1(ˆˆx x x 极极µ
θ
(2)列矩方程组(两个未知参数)
⎪⎪⎩
⎪⎪⎨⎧
=++=−−==+=−−=∫∑∫∞+=∞+µµθθµθµθθµθµθn i i
X n dx x x X E X dx x x X E 1222221)(]/)(exp[1)(]/)(exp[1)(解出
⎪⎪⎩
⎪
⎪⎨
⎧−−=−=∑∑==n i i n i i
X X n X X X n 12
12)(1ˆ)(1ˆ矩
矩µθ例3,设总体],0[~θU X ,其中0>θ为未知参数为未知参数,,n X X X ,,,21K 为来自总体X 的一组简单随机样本的一组简单随机样本,,n x x x ,,,21K 为样本观察值为样本观察值,
,求未知参数θ的极大似然估计。
解:似然函数,即样本的联合概率密度
⎪⎩⎪⎨⎧≤≤===∏−else
x x x x f x x x f L n n n
i i n ,0,,,0,1
)();,,,()(21121θ
θ
θθL L 0)(=θL 肯定不是最大值,考虑另一部分的最大值,
取对数似然
)
(,ln )(ln n x n L ≥−=θθθ0
)(ln <−=θ
θθn d L d
知θ
θln )(ln n L −=在)
(n x ≥θ内是单调递减的,故
θ
取)(n x 能使得似然函数达到最大,则θ的极大似然估计值为
)(ˆn x =极θ,极大似然估计量为)
(ˆn X =极θ。