第六章_点估计汇总
- 格式:doc
- 大小:828.50 KB
- 文档页数:19
第6章估计与样本容量6.1 概述这一章我们介绍估计下列总体参数数值的方法:总体均值、比例和方差。
我们还讲述确定这些参数估计所需要的样本容量方法。
6.2 估计总体均值:大样本这一节的主要目标:已知一个集合中样本数据多于30个,讨论总体均值μ的估计值。
假设1.n>30(样本中的数据超过30个)。
2.样本是一个简单随机样本(相同容量的所有样本被选出的可能性相同)。
不仔细收集的数据绝对是毫无价值的,即使样本很大。
这一节中的方法假设,那些样本之间的差异是由于可能的随机波动造成的,而不是因为一些不合理的抽样方法。
定义估计量(estimator)是指使用样本数据来估计总体参数的公式或过程。
估计值(estimate)是指用来近似总体参数的特定数值或数值的范围。
点估计值(point estimate)是用来近似总体参数的一个数值(或点)。
样本均值x是总体均值μ的最优点估计值。
虽然我们可以使用其他统计量,例如样本中位数、中列数或众数作为总体均值μ的估计值,但研究显示,样本均值x通常会特供最优的估计值,原因有两点。
第一,对于很多总体来说,样本均值x的分布比其他样本统计量的分布有更好的一致性。
第二,对于所有的总体,样本均值x是总体均值μ的一个无偏估计量,这意味着样本均值分布的中心趋近于总体均值μ的中心。
我们为什么需要置信区间?置信区间或区间估计是由一个数值范围(或一个区间)构成的,而不是仅由一个点构成的。
定义置信区间(或区间估计)是指用来估计总体参数真实值的一个数据范围(或一个区间)。
一个置信区间和一个置信度相联系,例如0.95(或95%)。
置信度会告诉我们,有百分之多少的时间,置信区间真的包含了总体参数,这里假设这个估计过程可以重复很多次。
在置信度的定义中,用α(希腊字母阿尔法的小写)表示一个概率或面积。
α的值是置信度的补。
当置信度为0.95(95%)时,α=0.05。
当置信度为0.99(99%)时,α=0.01。
113第六章 参数估计一、 知识点1. 点估计的基本概念2. 点估计的常用方法(1) 矩估计法① 基本思想:以样本矩作为相应的总体矩的估计,以样本矩的函数作为相应的总体矩的同一函数的估计。
(2) 极大似然估计法设总体X 的分布形式已知,其中),,,(21k θθθθΛ=为未知参数,),,(21n X X X Λ为简单随机样本,相应的),,,(21n x x x Λ为它的一组观测值.极大似然估计法的步骤如下:① 按总体X 的分布律或概率密度写出似然函数∏==ni i n x p x x x L 121);();,,,(θθΛ (离散型)∏==ni i n x f x x x L 121);();,,,(θθΛ (连续型)若有),,,(ˆ21nx x x Λθ使得);,,,(max )ˆ;,,,(2121θθθn n x x x L x x x L ΛΛΘ∈=,则称这个θˆ为参数θ的极大似然估计值。
称统计量),,,(ˆ21nX X X Λθ为参数θ的极大似然估计量。
② 通常似然函数是l θ的可微函数,利用高等数学知识在k θθθ,,,21Λ可能的取值范围内求出参数的极大似然估计k l x x x nl l ,,2,1),,,,(ˆˆ21ΛΛ==θθ 将i x 换成i X 得到相应的极大似然估计量k l X X X nl l ,,2,1),,,,(ˆˆ21ΛΛ==θθ 注:当);,,,(21θn x x x L Λ不可微时,求似然函数的最大值要从定义出发。
3. 估计量的评选标准(1) 无偏性:设),,(ˆˆ21nX X X Λθθ=是参数θ的估计量,如果θθ=)ˆ(E ,则称θˆ为θ的无偏估计量。
(2) 有效性:设1ˆθ,2ˆθ是θ的两个无偏估计,如果)ˆ()ˆ(21θθD D ≤,则称1ˆθ较2ˆθ更有效。
4. 区间估计114 (1) 定义 设总体X 的分布函数族为{}Θ∈θθ),;(x F .对于给定值)10(<<αα,如果有两个统计量),,(ˆˆ111n X X Λθθ=和),,(ˆˆ122n X X Λθθ=,使得{}αθθθ-≥<<1ˆˆ21P 对一切Θ∈θ成立,则称随机区间)ˆ,ˆ(21θθ是θ的双侧α-1置信区间,称α-1为置信度;分别称1ˆθ和2ˆθ为双侧置信下限和双侧置信上限. (2) 单侧置信区间(3) 一个正态总体下未知参数的双侧置信区间(置信度为α-1)二、 习题 1. 选择题(1) 设n X X X ,,,21Λ是来自总体X 的一个样本,则以下统计量①)(211n X X + ②)2(14321n X X X X X n ++++-Λ ③)2332(101121n n X X X X +++-作为总体均值μ的估计量,其中是μ的无偏估计的个数是A.0B.1C.2D.3(2) 设321,,X X X 是来自正态总体)1,(μN 的样本,现有μ的三个无偏估计量321332123211216131ˆ;1254131ˆ;2110351ˆX X X X X X X X X ++=++=++=μμμ其中方差最小的估计量是A.1ˆμB.2ˆμC. 3ˆμD.以上都不是 (3) 设0,1,0,1,1为来自0-1分布总体B(1,p)的样本观察值,则p 的矩估计值为 。
第六章点估计1. 本章重点概括本章要求学生正确理解参数点估计的概念。
掌握矩估计法,明确其实质是用样本矩来替换总体矩,即皮尔逊替换原则。
掌握极大似然估计法,明确其基本思想是选取估计量,使得该样本发生的可能性最大,能熟练地求出某些常见分布中未知参数的极大似然估计量。
掌握关于判别估计量优良性的一致性、无偏性、有效性这三个准则,并能熟练地加以运用。
掌握罗-克拉美(Rao-Cramer)不等式的条件、结论,能求一些常见分布中未知参数的无偏估计量之方差的罗-克拉美下界,会求一些常见分布中未知参数的有效估计,或会证明某∧θ是θ的有效估计。
掌握充分统计量的概念和奈曼(Neyman)因子分解定理,并会加以应用。
点估计方法一般有两种,一种为矩估计法,一种为极大似然估计法。
矩估计法比较直观,对任何总体都适用,方法简单,但需要保证总体的相应的矩存在,若不存在就不能用矩估计的方法。
而极大似然估计对任何总体也都适用,从它得到估计量一般有有效性,并且常常具有无偏性,即使不具有无偏性,也可以修正偏差使估计值与待估计参数的真实值充分接近。
极大似然估计法的缺点是往往要解一个似然方程,而这个方程在有些情况下是很难解的。
在分析估计量的好坏时,应首先考虑一致性,即看估计量是否依概率收敛于所估计的参数,不具备一致性的估计量我们一般是不予考虑的。
估计量是一个随机变量,对于不同的样本值,一般给出参数不同的估计值,因而在考虑估计量的优劣时,应该从某种整体性能去衡量,而不能看它在个别样本之下表现如何。
一般来说,矩估计和极大似然估计都不一定是无偏估计。
无偏估计要111112求估计量的数学期望等于待估参数,但无偏估计不一定是有效估计,如正态总体期望的估计量∑==n i i i X k 1ˆμ,其中∑==n i i k 11是无偏估计,但只有当n n nk i ,,2,1,1 ==时,μˆ才是有效估计。
由于统计量很多,那么怎样的统计量才是最佳的呢?直观的想法是,一方面要尽可能的简单,另一方面又要能提供样本所含的“全部信息”,由此引出了充分统计量的定义。
第六章参数估计6.1 点估计问题概述习题1总体X在区间[0,θ]上均匀分布,X1,X2,⋯,Xn是它的样本,则下列估计量θ是θ的一致估计是().(A)θ=Xn; (B)θ=2Xn;(C)θ=X¯=1n∑i=1nXi;(D)θ=Max{X1,X2,⋯,Xn}.解答:应选(D).由一致估计的定义,对任意ɛ>0,P(∣Max{X1,X2,⋯,Xn}-θ∣<ɛ)=P(-ɛ+θ<Max{X1,X2,⋯,Xn}<ɛ+θ)=F(ɛ+θ)-F(-ɛ+θ).因为FX(x)={0,x<0xθ,0≤x≤θ1,x>θ, 及F(x)=FMax{X1,X2,⋯,Xn}(x)=FX1(x)FX2(x)⋯FXn(x),所以F(ɛ+θ)=1, F(-ɛ+θ)=P(Max{X1,X2,⋯,Xn}<-ɛ+θ)=(1-xθ)n,故P(∣Max{X1,X2,⋯,Xn}-θ∣<ɛ)=1-(1-xθ)n→1(n→+∞).习题2设σ是总体X的标准差,X1,X2,⋯,Xn是它的样本,则样本标准差S是总体标准差σ的().(A)矩估计量;(B)最大似然估计量;(C)无偏估计量;(D)相合估计量.解答:应选(D).因为,总体标准差σ的矩估计量和最大似然估计量都是未修正的样本标准差;样本方差是总体方差的无偏估计,但是样本标准差不是总体标准差的无偏估计.可见,样本标准差S是总体标准差σ的相合估计量.习题3设总体X的数学期望为μ,X1,X2,⋯,Xn是来自X的样本,a1,a2,⋯,an是任意常数,验证(∑i=1naiXi)/∑i=1nai(∑i=1nai≠0)是μ的无偏估计量.解答:E(X)=μ,E(∑i=1naiXi∑i=1nai)=1∑i=1nai⋅∑i=1naiE(Xi)(E(Xi)=E(X)=μ)=μ∑i=1nai∑i=1n=μ,综上所证,可知∑i=1naiXi∑i=1nai是μ的无偏估计量.习题4设θ是参数θ的无偏估计,且有D(θ)>0, 试证θ2=(θ)2不是θ2的无偏估计.解答:因为D(θ)=E(θ2)-[E(θ)]2, 所以E(θ2)=D(θ)+[E(θ)]2=θ2+D(θ)>θ2,故(θ)2不是θ2的无偏估计.习题5设X1,X2,⋯,Xn是来自参数为λ的泊松分布的简单随机样本,试求λ2的无偏估计量.解答:因X服从参数为λ的泊松分布,故D(X)=λ, E(X2)=D(X)+[E(X)]2=λ+λ2=E(X)+λ2,于是E(X2)-E(X)=λ2, 即E(X2-X)=λ2.用样本矩A2=1n∑i=1nXi2,A1=X¯代替相应的总体矩E(X2),E(X), 便得λ2的无偏估计量λ2=A2-A1=1n∑i=1nXi2-X¯.习题6设X1,X2,⋯,Xn为来自参数为n,p的二项分布总体,试求p2的无偏估计量.解答:因总体X∼b(n,p), 故E(X)=np,E(X2)=D(X)+[E(X)]2=np(1-p)+n2p2=np+n(n-1)p2=E(X)+n(n-1)p2,E(X2)-E(X)n(-1)=E[1n(n-1)(X2-X)]=p2,于是,用样本矩A2,A1分别代替相应的总体矩E(X2),E(X),便得p2的无偏估计量p2=A2-A1n(n-1)=1n2(n-1)∑i=1n(Xi2-Xi).习题7设总体X服从均值为θ的指数分布,其概率密度为f(x;θ)={1θe-xθ,x>00,x≤0,其中参数θ>0未知. 又设X1,X2,⋯,Xn是来自该总体的样本,试证:X¯和n(min(X1,X2,⋯,Xn))都是θ的无偏估计量,并比较哪个更有效.解答:因为E(X)=θ, 而E(X¯)=E(X),所以E(X¯)=θ, X¯是θ的无偏估计量.设Z=min(X1,X2,⋯,Xn),因为FX(x)={0,x≤01-e-xθ,x>0,FZ(x)=1-[1-FX(x)]n={1-e-nxθ,x>00,x≤0,所以fZ(x)={nθe-nxθ,x>00,x≤0,这是参数为nθ的指数分布,故知E(Z)=θn, 而E(nZ)=E[n(min(X1,X2,⋯,Xn)]=θ,所以nZ也是θ的无偏估计.现比较它们的方差大小.由于D(X)=θ2, 故D(X¯)=θ2n.又由于D(Z)=(θn)2, 故有D(nZ)=n2D(Z)=n2⋅θ2n2=θ2.当n>1时,D(nZ)>D(X¯),故X¯较nZ有效.习题8设总体X服从正态分布N(m,1),X1,X2是总体X的子样,试验证1=2 X1+1 X2, 2=1 X1+ X2,=12X1+12X2,都是m的无偏估计量;并问哪一个估计量的方差最小?解答:因为X服从N(m,1), 有E(Xi)=m,D(Xi)=1(i=1,2),得E( 1)=E(23X1+13X2)=23E(X1)+13E(X2)=23m+13m=m,D( 1)=D(23X1+13X2)=49D(X1)+19D(X2)=49+19=59,同理可得:E( 2)= ,D( 2)= ,E( )= ,D( )=12.所以, 1, 2,都是m的无偏估计量,并且在 1, 2,中,以的方差为最小.习题9设有k台仪器. 已知用第i台仪器测量时,测定值总体的标准差为σi(i=1,2,⋯,k), 用这些仪器独立地对某一物理量θ各观察一次,分别得到X1,X2,⋯,Xk. 设仪器都没有系统误差,即E(Xi)=θ(i=1,2,⋯,k), 问a1,a2,⋯,ak应取何值,方能使用=∑i=1kaiXi估计θ时, 是无偏的,并且D( )最小?解答:因为E(Xi)=θ(i=1,2,⋯,k), 故E( )=E(∑i=1kaiXi)=∑i=1kaiE(Xi)=θ∑i=1kai,欲使E( )=θ, 则要∑i=1kai=1.因此,当∑i=1kai=1时,=∑i=1kaiXi为θ的无偏估计,D( )=∑i=1kai2σi2, 要在∑i=1kai=1的条件下D( )最小,采用拉格朗日乘数法.令L(a1,a2,⋯,ak)=D()+λ(1-∑i=1kai)=∑i=1kai2σi2+λ(1-∑i=1kai),{∂L∂ai=0,i=1,2,⋯,k∑i=1kai=1,即2aiσi2-λ=0,ai=λ2i2;又因∑i=1kai=1,所以λ∑i=1k12σi2=1, 记∑i=1k1σi2=1σ02, 所以λ=2σ02, 于是ai=σ02σi2 (i=1,2,⋯,k),故当ai=σ02σi2(i=1,2,⋯,k)时, =∑i=1kaiXi是θ的无偏估计,且方差最小.习题6.2 点估计的常用方法习题1设X1,X2,⋯,Xn为总体的一个样本,x1,x2,⋯,xn为一相应的样本值,求下述各总体的密度函数或分布律中的未知参数的矩估计量和估计值及最大似然估计量.(1)f(x)={θcθx-(θ+1),x>c0,其它, 其中c>0为已知,θ>1,θ为未知参数.(2)f(x)={θxθ-1,0≤x≤10,其它, 其中θ>0,θ为未知参数.(3)P{X=x}=(mx)px(1-p)m-x, 其中x=0,1,2,⋯,m,0<p<1,p为未知参数.解答:(1)E(X)=∫c+∞x⋅θcθx-(θ+1)dx=θcθ∫c+∞x-θdx=θcθ-1,解出θ=E(X)E(X)-c,令X¯=E(X),于是=X¯X¯-c为矩估计量,θ的矩估计值为=x¯x¯-c,其中x¯=1n∑i=1nxi.另外,似然函数为L(θ)=∏i=1nf(xi;θ)=θncnθ(∏i=1nxi)-(θ+1),xi>c,对数似然函数为lnL(θ)=nlnθ+nθlnc-(θ+1)∑i=1nlnxi,对lnL(θ)求导,并令其为零,得dlnL(θ)dθ=nθ+nlnc-∑i=1nlnxi=0,解方程得θ=n∑i=1nlnxi-nlnc,故参数的最大似然估计量为=n∑i=1nlnXi-nlnc.(2)E(X)=∫01x⋅θxθ-1dx=θθ+1,以X¯作为E(X)的矩估计,则θ的矩估计由X¯=θθ+1解出,得=(X¯1-X¯)2,θ的矩估计值为=(x¯1-x¯)2,其中x¯=1n∑i=1nxi为样本均值的观测值.另外,似然函数为L(θ)=∏i=1nf(xi;θ)=θn/2(∏i=1nxi)θ-1,0≤xi≤1,对数似然函数为lnL(θ)=n2lnθ+(θ-1)∑i=1nlnxi,对lnL(θ)求导,并令其为零,得dlnL(θ)dθ=n2θ+12θ∑i=1nlnxi=0,解方程得θ=(-n∑i=1nlnxi)2,故参数的最大似然估计量为=(n∑i=1nlnXi)2.(3)X∼b(m,p),E(X)=mp,以X¯作为E(X)的矩估计,即X¯=E(X),则参数p的矩估计为=1 X¯=1 ⋅1n∑i=1nXi,p的矩估计值为=1 x¯=1 ⋅1n∑i=1nxi.另外,似然函数为L(θ)=∏i=1nf(xi;θ)=(∏i=1nC xi) ∑i=1nxi(1- )∑i=1n( -xi),xi=0,1,⋯,m,对数似然函数为lnL(θ)=∑i=1nlnC xi+(∑i=1nxi)ln +(∑i=1n( -xi))ln(1-p),对lnL(θ)求导,并令其为零,得dlnL(θ)dθ=1 ∑i=1nxi-11- ∑i=1n( -xi)=0,解方程得 =1 n∑i=1nxi,故参数的最大似然估计量为=1 n∑i=1nXi=1 X¯.习题2设总体X服从均匀分布U[0,θ],它的密度函数为f(x;θ)={1θ,0≤x≤θ0,其它,(1)求未知参数θ的矩估计量;(2)当样本观察值为0.3,0.8,0.27,0.35,0.62,0.55时,求θ的矩估计值.解答:(1)因为E(X)=∫-∞+∞xf(x;θ)dx=1θ∫0θxdx=θ2,令E(X)=1n∑i=1nXi,即θ2=X¯,所以=2X¯.(2)由所给样本的观察值算得x¯=16∑i=16xi=16(0. +0. +0.27+0. +0.62+0. )=0. 17,所以=2x¯=0.96 .习题3设总体X以等概率1θ取值1,2,⋯,θ, 求未知参数θ的矩估计量.解答:由E(X)=1×1θ+2×1θ+⋯+θ×1θ=1+θ2=1n∑i=1nXi=X¯,得θ的矩估计为=2X¯-1.习题4一批产品中含有废品,从中随机地抽取60件,发现废品4件,试用矩估计法估计这批产品的废品率.解答:设p为抽得废品的概率,1-p为抽得正品的概率(放回抽取). 为了估计p,引入随机变量Xi={1,第i次抽取到的是废品0,第i次抽取到的是正品,于是P{Xi=1}=p,P{Xi=0}=1-p=q, 其中i=1,2,⋯,60,且E(Xi)=p, 故对于样本X1,X2,⋯,X60的一个观测值x1,x2,⋯,x60, 由矩估计法得p的估计值为=160∑i=160xi= 60=11 ,即这批产品的废品率为115.习题5设总体X具有分布律X 1 2 3pi θ2 2θ(1-θ) (1-θ)2其中θ(0<θ<1)为未知参数. 已知取得了样本值x1=1,x2=2,x3=1, 试求θ的矩估计值和最大似然估计值.解答:E(X)=1×θ2+2×2θ(1-θ)+ ×(1-θ)2=3-2θ,x¯=1/ ×(1+2+1)= / .因为E(X)=X¯,所以=(3-x¯)/2= /6为矩估计值,L(θ)=∏i=1 P{Xi=xi}=P{X1=1}P{X2=2}P{X =1}=θ4⋅2θ⋅(1-θ)=2θ5(1-θ),lnL(θ)=ln2+5lnθ+ln(1-θ),对θ求导,并令导数为零dlnLdθ=5θ-11-θ=0,得=56.习题6(1)设X1,X2,⋯,Xn来自总体X的一个样本, 且X∼π(λ), 求P{X=0}的最大似然估计.(2)某铁路局证实一个扳道员五年内所引起的严重事故的次数服从泊松分布,求一个扳道员在五年内未引起严重事故的概率p的最大似然估计,使用下面122个观察值统计情况. 下表中,r表示一扳道员某五年中引起严重事故的次数,s表示观察到的扳道员人数.习题6.3 置信区间习题1对参数的一种区间估计及一组观察值(x1,x2,⋯,xn)来说,下列结论中正确的是().(A)置信度越大,对参数取值范围估计越准确;(B)置信度越大,置信区间越长;(C)置信度越大,置信区间越短;(D)置信度大小与置信区间有长度无关.解答:应选(B).置信度越大,置信区间包含真值的概率就越大,置信区间的长度就越大,对未知参数的估计精度越低.反之,对参数的估计精度越高,置信区间的长度越小,它包含真值的概率就越低,置信度就越小.习题2设(θ1,θ2)是参数θ的置信度为1-α的区间估计,则以下结论正确的是().(A)参数θ落在区间(θ1,θ2)之内的概率为1-α;(B)参数θ落在区间(θ1,θ2)之外的概率为α;(C)区间(θ1,θ2)包含参数θ的概率为1-α;(D)对不同的样本观察值,区间(θ1,θ2)的长度相同.解答:应先(C).由于θ1,θ2都是统计量,即(θ1,θ2)是随机区间,而θ是一个客观存在的未知常数,故(A),(B)不正确.习题3设总体的期望μ和方差σ2均存在,如何求μ的置信度为1-α的置信区间?解答:先从总体中抽取一容量为n的样本X1,X2,⋯,Xn.根据中心极限定理,知U=X¯-μσ/n→N(0,1)(n→∞).(1)当σ2已知时,则近似得到μ的置信度为1-α的置信区间为(X¯-uα/2σn,X¯+uα/2σn).(2)当σ2未知时,用σ2的无偏估计S2代替σ2, 这里仍有X¯-μS/n→N(0,1)(n→∞),于是得到μ的1-α的置信区间为(X¯-uα/2Sn,X¯+uα/2Sn),一般要求n≥ 0才能使用上述公式,称为大样本区间估计.习题4某总体的标准差σ=3cm, 从中抽取40个个体,其样本平均数x¯=6 2c ,试给出总体期望值μ的95%的置信上、下限(即置信区间的上、下限).解答:因为n=40属于大样本情形,所以X¯近似服从N(μ,σ2n)的正态分布,于是μ的95%的置信区间近似为(X¯±σnuα/2),这里x¯=6 2,σ= ,n= 0≈6. 2,uα/2=1.96, 从而(x¯±σnuα/2)=(6 2± 0×1.96)≈(6 2±0.93),故μ的95%的置信上限为642.93, 下限为641.07.习题5某商店为了了解居民对某种商品的需要,调查了100家住户,得出每户每月平均需求量为10kg, 方差为9,如果这个商店供应10000户,试就居民对该种商品的平均需求量进行区间估计(α=0.01), 并依此考虑最少要准备多少这种商品才能以0.99的概率满足需求?解答:因为n=100属于大样本问题,所以X¯近似服从N(μ,σ2/n),于是μ的99%的置信区间近似为(X¯±Snuα/2), 而x¯=10,s= ,n=100,uα/2=2.58,习题7某城镇抽样调查的500名应就业的人中,有13名待业者,试求该城镇的待业率p的置信度为0.95置信区间.解答:这是(0-1)分布参数的区间估计问题. 待业率p的0.95置信区间为( 1, 2)=(-b-b2-4ac2a,-b+b2-4ac2a).其中a=n+uα/22,b=-2nX¯-(uα/2)2, c=nX¯2,n= 00,x¯=1 00,uα/2=1.96.则( 1, 2)=(0.015,0.044).习题8设X1,X2,⋯,Xn为来自正态总体N(μ,σ2)的一个样本,求μ的置信度为1-α的单侧置信限.解答:这是一个正态总体在方差未知的条件下,对μ的区间估计问题,应选取统计量:T=X¯-μS/n∼t(n-1).因为只需作单边估计,注意到t分布的对称性,故令P{T<tα(n-1)}=1-α和P{T>tα(n-1)}=1-α.由给定的置信度1-α, 查自由度为n-1的t分布表可得单侧临界值tα(n-1). 将不等式T<tα(n-1)和T>tα(n-1), 即X¯-μS/n<tα(n-1)和X¯-μS/n>tα(n-1)分别变形,求出μ即得μ的1-α的置信下限为X¯-tα(n-1)Sn.μ的1-α的置信上限为X¯+tα(n-1)Sn,μ的1-α的双侧置信限(X¯-tα/2(n-1)Sn,X¯+tα/2(n-1)Sn).习题6.4 正态总体的置信区间习题1已知灯泡寿命的标准差σ=50小时,抽出25个灯泡检验,得平均寿命x¯= 00小时,试以95%的可靠性对灯泡的平均寿命进行区间估计(假设灯泡寿命服从正态分布).解答:由于X∼N(μ,502), 所以μ的置信度为95%的置信区间为(X¯±uα/2σn),这里x¯= 00,n=2 ,σ=50,uα/2=1.96, 所以灯泡的平均寿命的置信区间为(x¯±uα/2σn)=( 00± 02 ×1.96)=( 00±19.6)=( 0. , 19.6).习题2一个随机样本来自正态总体X,总体标准差σ=1.5, 抽样前希望有95%的置信水平使得μ的估计的置信区间长度为L=1.7, 试问应抽取多大的一个样本?解答:因方差已知,μ的置信区间长度为L=2uα/2⋅σn,于是n=(2σLuα/2)2.由题设知,1-α=0.95,α=0.05,α2=0.025. 查标准正态分布表得u0.025=1.96,σ=1.5,L=1.7,所以,样本容量n=(2×1. ×1.961.7)2≈11.96.向上取整数得n=12, 于是欲使估计的区间长度为1.7的置信水平为95%, 所以需样本容量为n=12.习题3设某种电子管的使用寿命服从正态分布. 从中随机抽取15个进行检验,得平均使用寿命为1950小时,标准差s为300小时,以95%的可靠性估计整批电子管平均使用寿命的置信上、下限.解答:由X∼N(μ,σ2), 知μ的95%的置信区间为(X¯±Sntα/2(n-1)),这里x¯=19 0,s= 00,n=1 ,tα/2(14)=2.145, 于是(x¯±sntα/2(n-1))=(19 0± 001 ×2.1 )≈(19 0±166.1 1)=(17 . ,2116 .15).即整批电子管平均使用寿命的置信上限为2116.15, 下限为1783.85.习题4人的身高服从正态分布,从初一女生中随机抽取6名,测其身高如下(单位:cm): 149 158.5 152.5 165 157 142求初一女生平均身高的置信区间(α=0.05).解答:X∼N(μ,σ2),μ的置信度为95%的置信区间为(X¯±Sntα/2(n-1)),这里x¯=1 ,s=8.0187, t0.025(5)=2.571, 于是(x¯±sntα/2(n-1))=(1 ± .01 76×2. 71)≈(1 ± . 16)≈(1 . ,162. 2) .习题5某大学数学测验,抽得20个学生的分数平均数x¯=72,样本方差s2=16, 假设分数服从正态分布,求σ2的置信度为98%的置信区间.解答:先取χ2分布变量,构造出1-α的σ2的置信区间为((n-1)S2χα/22(n-1),(n-1)S2χ1-α/22(n-1)).已知1-α=0.98,α=0.02,α2=0.01,n=20, S2=16.查χ2分布表得χ0.012(19)=36.191,χ0.992(19)=7.633,于是得σ2的98%的置信区间为(19×16 6.191,19×167.6 ),即(8.400,39.827).习题6随机地取某种炮弹9发做试验,得炮口速度的样本标准差s=11(m/s).设炮口速度服从正态分布,求这种炮弹的炮口速度的标准差σ的置信度为0.95的置信区间.解答:已知n=9,s=11(m/s),1-α=0.95.查表得χ0.0252(8)=17.535, χ0.9752(8)=2.180,σ的0.95的置信区间为(8sχ0.0252(8),8sχ0.9752(8)), 即(7.4,21.1).习题7设来自总体N(μ1,16)的一容量为15的样本,其样本均值x1¯=1 .6;来自总体N(μ2,9)的一容量为20的样本,其样本均值x2¯=1 .2;并且两样本是相互独立的,试求μ1-μ2的90%的置信区间.解答:1-α=0.9,α=0.1, 由Φ(uα/2)=1-α2=0.95, 查表,得uα/2=1.645,再由n1=15,n2=20, 得σ12n1+σ22n2=161 +920=9160≈1.2 2,uα/2σ12n1+σ22n2=1.6 ×1.2 2≈2.0 ,x¯1-x¯2=1 .6-13.2=1.4,所以,μ1-μ2的90%的置信区间为(1.4-2.03,1.4+2.03)=(-0.63,3.43).习题8物理系学生可选择一学期3学分没有实验课,也可选一学期4学分有实验的课. 期未考试每一章节都考得一样,若有上实验课的12个学生平均考分为84,标准差为4,没上实验课的18个学生平均考分为77,标准差为6,假设总体均为正态分布且其方差相等,求两种课程平均分数差的置信度为99%的置信区间.解答:设有实验课的考分总体X1∼N(μ1,σ2), 无实验课的考分总体X2∼N(μ2,σ2). 两方差相等但均未知,求μ1-μ2的99%的置信区间,应选t分布变量,T=X1¯-X2¯-(μ1-μ2)SW1n1+1n2∼t(n1+n2-2),其中SW=(n1-1)S12+(n2-1)S22n1+n2-2.μ1-μ2的1-α的置信区间为习题10设两位化验员A,B独立地对某种聚合物含氯量用相同的方法各作10次测定,其测定值的样本方差依次为 sA2=0.5419,sB2=0.6065. 设σA2,σB2分别为A,B所测定的测定值的总体方差,又设总体均为正态的,两样本独立,求方差比σA2/σB2的置信水平为0.95的置信区间.解答:选用随机变量F=SA2σA2/SB2σB2∼F(n1-1,n2-1),依题意,已知sA2=0.5419, sB2=0.6065, n1=n2=10.对于1-α=0.95, 查F分布表得F0.025(9,9)=1F0.025(9,9)=14.03, 于是得σA2σB2的0.95的置信区间为(sA2sB21Fα/2(9,9),sA2sB2Fα/2(9,9))≈(0.222,3.601).总习题解答习题1设总体X服从参数为λ(λ>0)的指数分布,X1,X2,⋯,Xn为一随机样本,令Y=min{X1,X2,⋯,Xn}, 问常数c为何值时,才能使cY是λ的无偏估计量.解答:关键是求出E(Y). 为此要求Y的密度fY(y).因Xi的密度函数为fX(x)={λe-λx,x>00,x<0;Xi的分布函数为FX(x)={1-e-λx,x>00,x≤0,于是FY(y)=1-[1-FX(y)]n={1-e-nλy,y>00,y≤0.两边对y求导得fY(y)=ddyFY(y)={nλe-nλy,y>00,y≤0,即Y服从参数为nλ的指数分布,故E(Y)=nλ.为使cY成为λ的无偏估计量,需且只需E(cY)=λ, 即cnλ=λ, 故c=1n.习题2设X1,X2,⋯,Xn是来自总体X的一个样本,已知E(X)=μ, D(X)=σ2.(1)确定常数c, 使c∑i=1n-1(Xi+1-Xi)2为σ2的无偏估计;(2)确定常数c, 使(X¯)2-cS2是μ2的无偏估计(X¯,S2分别是样本均值和样本方差).解答:(1)E(c∑i=1n-1(Xi+1-Xi)2)=c∑i=1n-1E(Xi+12-2XiXi+1+Xi2)=c∑i=1n-1{D(Xi+1)+[E(Xi+1)]2-2E(Xi)E(Xi+1)+D(Xi)+[E(Xi)+[E(Xi)]2}=c(n-1)(σ2+μ2-2μ2+σ2+μ2)=2(n-1)σ2c.令2(n-1)σ2c=σ2, 所以c=12(n-1).(2)E[(X¯)2-cS2]=E(X¯2)-cE(S2)=D(X¯)+[E(X¯)]2-cσ2=σ2n+μ2-cσ2.令σ2n+μ2-cσ2=μ2, 则得c=1n.习题3设X1,X2,X3,X4是来自均值为θ的指数分布总体的样本,其中θ未知. 设有估计量T1=16(X1+X2)+13(X3+X4),T2=X1+2X2+3X3+4X45,T3=X1+X2+X3+X44.(1)指出T1,T2,T3中哪几个是θ的无偏估计量;(2)在上述θ的无偏估计中指出一个较为有效的.解答:(1)θ=E(X),E(Xi)=E(X)=θ,D(X)=θ2=D(Xi),i=1,2,3,4.E(T1)=E(16(X1+X2)+13(X3+X4))=(26+23)θ=θ,E(T2)=15E(X1+2X2+3X3+4X4)=15(1+2+3+4)θ=2θ,E(T3)=14E(X1+X2+X3+X4)=θ,因此,T1,T3是θ的无偏估计量.(2)D(T1)=236θ2+29θ2=1036θ2, D(T3)=116⋅4θ2=14θ2=936θ2,所以D(T3)<D(T1), 作为θ的无偏估计量,T3更为有效.习题4设从均值为μ, 方差为σ2(σ>0)的总体中,分别抽取容量为n1,n2的两独立样本,X1¯和X2¯分别是两样本的均值,试证:对于任意常数a,b(a+b=1),Y=aX1¯+bX2¯都是μ的无偏估计;并确定常数a,b, 使D(Y)达到最小.解答:E(Y)=E(aX1¯+bX2¯)=aE(X1¯)+bE(X2¯)=(a+b)μ.因为a+b=1, 所以E(Y)=μ.因此,对于常数a,b(a+b=1),Y都是μ的无偏估计,D(Y)=a2D(X1¯)+b2D(X2¯)=a2σ2n1+b2σ2n2.因a+b=1, 所以D(Y)=σ2[a2n1+1n2(1-a)2], 令dD(Y)da=0, 即2σ2(an1-1-an2)=0, 解得a=n1n1+n2,b=n2n1+n2是惟一驻点.又因为d2D(Y)da2=2σ2(1n1+1n2)>0, 故取此a,b二值时,D(Y)达到最小.习题5设有一批产品,为估计其废品率p, 随机取一样本X1,X2,⋯,Xn, 其中Xi={1,取得废品0,取得合格品, i=1,2,⋯,n,证明: =X¯=1n∑i=1nXi是p的一致无偏估计量.解答:由题设条件E(Xi)=p⋅1+(1-p)⋅0=p,D(Xi)=E(Xi2)-[E(Xi)]2=p⋅12+(1-p)02-p2=p(1-p),E( )=E(X¯)=E(1n∑i=1nE(Xi))=1n∑i=1nE(Xi)=1n∑i=1np=p.由定义, 是p的无偏估计量,又D( )=D(X¯)=D(1n∑i=1nXi)=1n2∑i=1nD(Xi)=1n2∑i=1np(1-p)=1n2np(1-p)=pqn.由切比雪夫不等式,任给ɛ>0P{∣ -p∣≥ɛ}=P{∣X¯-p∣≥ɛ}≤1ɛ2D(X¯)=1ɛ2p(1-p)n→0,n→∞所以limn→∞P{∣ -p∣≥ɛ}=0, 故=X¯是废品率p的一致无偏估计量.习题6设总体X∼b(k,p), k是正整数,0<p<1,k,p都未知,X1,X2,⋯,Xn是一样本,试求k和p的矩估计.解答:因总体X服从二项分布b(k,p), 故{a1=E(X)=kpa2=E(X2)=D(X)+[E(X)]2=kp(1-p)+(kp)2,解此方程组得p=a1+a12-a2a1,k=a12a1+a12-a2.用A1=1n∑i=1nXi=X¯,A2=1n∑i=1nXi2分别代替a1,a2, 即得p,k的矩估计为=X¯-S2X¯,k=[X¯2X¯-S2],其中S2=1n∑i=1n(Xi-X¯)2,[x]表示x的最大整数部分.习题7求泊松分布中参数λ的最大似然估计.解答:总体的概率函数为P{X=k}=λkk!e-λ,k=0,1,2,⋯.设x1,x2,⋯,xn为从总体中抽取的容量为n的样本,则似然函数为L(x1,x2,⋯,xn;λ)=∏i=1nf(xi;λ)=∏i=1nλxixi!e-λ=λ∑i=1nxi∏i=1nxi!e-nλ, lnL=(∑i=1nxi)lnλ-nλ-∑i=1nlnxi!,令dlnLdλ=1λ∑i=1nxi-n=0, 得λ的最大是然估计为λ=1n∑i=1nxi=x¯,即x¯=1n∑i=1nxi就是参数λ的最大似然估计.习题8已知总体X的概率分布P{X=k}=C2k(1-θ)kθ2-k,k=0,1,2,求参数的矩估计.解答:总体X为离散型分布,且只含一个未知参数θ, 因此,只要先求离散型随机变量的数学期望E(X), 然后解出θ并用样本均值X¯代替E(X)即可得θ的矩估计.由E(X)=∑k=02kC2k(1-θ)kθ2-k=1×2(1-θ)θ+2(1-θ)2=2-2θ, 即有θ=1-E(X)2.用样本均值X¯代替上式的E(X), 得矩估计为=1-X¯2.习题9设总体X的概率密度为f(x)={(θ+1)xθ,0<x<10,其它,其中θ>-1是未知参数,X1,X2,⋯,Xn为一个样本,试求参数θ的矩估计和最大似然估计量. 解答:因E(X)=∫01(θ+1)xθ+1dx=θ+1θ+2. 令E(X)=1n∑i=1nXi=X¯, 得θ+1θ+2=X¯, 解得θ的矩估计量为θ=2X¯-11-X¯.设x1,x2,⋯,xn是样本X1,X2,⋯,Xn的观察值,则似然函数L(x1,x2,⋯,xn,θ)=∏i=1n(θ+1)xiθ=(θ+1)n(x1x2⋯xn)θ(0<xi<1,i=1,2,⋯,n),取对数得lnL=nln(θ+1)+θ∑i=1nlnxi, 从而得对数似然方程dlnLdθ=nθ+1+∑i=1nlnxi=0,解出θ, 得θ的最大似然估计量为θ=-n∑i=1nlnXi.由此可知,θ的矩估计和最大似然估计是不相同的.习题10设X具有分布密度f(x,θ)={θxe-θx!,x=0,1,2,⋯0,其它,0<θ<+∞,X1,X2,⋯,Xn是X的一个样本,求θ的最大似然估计量.解答:似然函数L(θ)=∏i=1nθxie-θxi!=e-nθ∏i=1nθxixi!,lnL(θ)=-nθ+∑i=1nxilnθ-∑i=1nln(xi!),ddθ(lnL(θ))=-n+1θ∑i=1nxi,令ddθ(lnL(θ))=0, 即-n+1θ∑i=1nxi=0⇒θ=1n∑i=1nxi,故θ最大似然估计量为θ=X¯=1n∑i=1nXi.习题11设使用了某种仪器对同一量进行了12次独立的测量,其数据(单位:毫米)如下:232.50 232.48 232.15 232.53 232.45 232.30232.48 232.05 232.45 232.60 232.47 232.30试用矩估计法估计测量值的均值与方差(设仪器无系统误差).解答:设测量值的均值与方差分别为μ与σ2,因为仪器无系统误差,所以θ= =X¯=1n∑i=1nXi=232+112∑i=1n(Xi-232)=232+1/12×4.76≈232.3967.用样本二阶中心矩B2估计方差σ2, 有2=1n∑i=1n(Xi-X¯)2=1n∑i=1n(Xi-a)2-(X¯-a)2=112∑i=112(Xi-232)2-(232.3967-232)2=0.1819-0.1574=0.0245.习题12设随机变量X服从二项分布P{X=k}=Cnkpk(1-p)n-k,k=0,1,2,⋯,n,X1为其一个样本,试求p2的无偏估计量.解答:\becauseX∼b(n,p),∴E(X)=np, D(X)=np(1-p)=E(X)-np2⇒p2=1n[E(X)-D(X)]=1n[E(X)-E(X2)+(EX)2]⇒p2=1n[E(X(1-X))]+1nn2p2=1nE(X(1-X))]+np2⇒p2=E[X(X-1)]n(n-1), 由于E[X(X-1)]=E[X1(X1-1)],故2=X1(X1-1)n(n-1).习题13设X1,X2,⋯,Xn是来自总体X的随机样本,试证估计量X¯=1n∑i=1nXi和Y=∑i=1nCiXi(Ci≥0为常数,∑i=1nCi=1)都是总体期望E(X)的无偏估计,但X¯比Y有效.解答:依题设可得E(X¯)=1n∑i=1nE(Xi)=1n×nE(X)=E(X),E(Y)=∑i=1nCiE(Xi)=E(X)∑i=1nCi=E(X).从而X¯,Y均为E(X)的无偏估计量,由于D(X¯)=1n2∑i=1nD(Xi)=1nD(X),D(Y)=D(∑i=1nCiXi)=∑i=1nCi2D(Xi)=D(X)∑i=1nCi2.应用柯西—施瓦茨不等式可知1=(∑i=1nCi)2≤(∑i=1nCi2)(∑i=1n12)=n∑i=1nCi2, ⇒1n≤∑i=1nCi2,所以D(Y)≥D(X¯), 故X¯比Y有效.习题14设X1,X2,⋯,Xn是总体X∼U(0,θ)的一个样本,证明:θ1=2X¯和θ2=n+1nX(n)是θ的一致估计.解答:因E( 1)= , D( 1)= 2 n; E( 2)= ,D( 2)=θn(n+2),X(n)=max{Xi}.依切比雪夫不等式,对任给的ɛ>0, 当n→∞时,有P{∣θ1-θ∣≥ɛ}≤D( 1)ɛ2=θ23nɛ2→0,(n→∞)P{∣θ2-θ∣≥ɛ}≤D( 2)ɛ2=θ2n(n+1)ɛ2→0,(n→∞)所以,θ1和θ2都是θ的一致估计量.习题15某面粉厂接到许多顾客的订货,厂内采用自动流水线灌装面粉,按每袋25千克出售. 现从中随机地抽取50袋,其结果如下:25.8, 24.7, 25.0, 24.9, 25.1, 25.0, 25.2,24.8, 25.4, 25.3, 23.1, 25.4, 24.9, 25.0,24.6, 25.0, 25.1, 25.3, 24.9, 24.8, 24.6,21.1, 25.4, 24.9, 24.8, 25.3, 25.0, 25.1,24.7, 25.0, 24.7, 25.3, 25.2, 24.8, 25.1,25.1, 24.7, 25.0, 25.3, 24.9, 25.0, 25.3,25.0, 25.1, 24.7, 25.3, 25.1, 24.9, 25.2,25.1,试求该厂自动流水线灌装袋重总体X的期望的点估计值和期望的置信区间(置信度为0.95). 解答:设X为袋重总体,则E(X)的点估计为E(X)=X¯=1 0(2 . +2 .7+⋯+25.1)=24.92kg.因为样本容量n=50, 可作为大样本处理,由样本值算得x¯=24.92, s2≈0.4376, s=0.6615, 则E(X)的置信度为0.95的置信区间近似为(X¯-uα/2Sn,X¯+uα/2Sn),查标准正态分布表得uα/2=u0.025=1.96, 故所求之置信区间为(24.92-1.96×0.661 0,2 .92+1.96×0.661 0)=(2 .7 7,2 .10 ),即有95%的把握,保证该厂生产的面粉平均每袋重量在24.737千克至25.103千克之间.习题16在一批货物的容量为100的样本中,经检验发现有16只次品,试求这批货物次品率的置信度为0.95的置信区间.解答:这是(0-1)分布参数区间的估计问题.这批货物次品率p的1-α的置信区间为( 1, 2)=(12a(-b-b2-4ac),12a(-b+b2-4ac)).其中a=n+uα/22,b=-(2nX¯+uα/22), c=nX¯2.由题意,x¯=16100=0.16,n=100,1-α=0.95,u0.025=1.96. 算得a=100+1.962=103.842,b=-(2×100×0.16+1.962)=-35.842,c=100×0.162=2. 6.p的0.95的置信区间为( 1, 2)=(12a(-b±b2-4ac)), 即(12×10 . 2( . 16±221.2 2 )),亦即(0.101,0.244).习题17在某校的一个班体检记录中,随意抄录25名男生的身高数据,测得平均身高为170厘米,标准差为12厘米,试求该班男生的平均身高μ和身高的标准差σ的置信度为0.95的置信区间(假设测身高近似服从正态分布).解答:由题设身高X∼N(μ,σ2), n=2 , x¯=170, s=12,α=0.05.(1)先求μ置信区间(σ2未知),取U=X¯-μS/n∼t(n-1),tα/2(n-1)=t0.025(24)=2.06.故μ的0.95的置信区间为(170-122 ×2.06,170+122 ×2.06)=(170-4.94,170+4.94)=(165.06,174,94).(2)σ2的置信区间(μ未知),取U=(n-1)S2σ2∼χ2(n-1),χα/22(n-1)=χ0.0252(24)=39.364, χ1-α/22(n-1)=χ0.9752(24)=12.401,故σ2的0.95的置信区间为(24×12239.364,24×12212.401)≈(87.80,278.69), σ的0.95的置信区间为(87.80,278.69)≈(9.34,16.69).习题18为研究某种汽车轮胎的磨损特性,随机地选择16只轮胎,每只轮胎行驶到磨坏为止. 记录所行驶的路程(以千米计)如下:41250 40187 43175 41010 39265 41872 42654 4128738970 40200 42550 41095 40680 43500 39775 40440假设这些数据来自正态总体N(μ,σ2). 其中μ,σ2未知,试求μ的置信水平为0.95的单侧置信下限.解答:由P{μ>X¯-Sntα(n-1)=1-α, 得μ的1-α的单侧置信下限为μ¯=X¯-Sntα(n-1).由所给数据算得x¯≈41119.38,s≈1345.46,n=16.查t分布表得t0.05(15)=1.7531, 则有μ的0.95的单侧置信下限为μ¯=41119.38-1345.464×1.7531≈40529.73.习题19某车间生产钢丝,设钢丝折断力服从正态分布,现随机在抽取10根,检查折断力,得数据如下(单位:N):578,572,570,568,572,570,570,572,596,584.试求钢丝折断力方差的置信区间和置信上限(置信度为0.95).解答:(1)这是一个正态总体,期望未知,对方差作双侧置信限的估计问题,应选统计量χ2=(n-1)S2σ2∼χ2(n-1).σ2的1-α的置信区间是((n-1)S2χα/22(n-1),(n-1)S2χ1-α/22(n-1)).由所给样本值得x¯=575.2, (n-1)s2=∑1=110(xi-x¯)2=681.6;根据给定的置信度1-α=0.95(即α=0.05).查自由度为10-1=9的χ2分布表,得双侧临界值χα/22(n-1)=χ0.0252(9)=19.0, χ1-α/22(n-1)=χ0.9752(9)=2.7,代入上公式得σ2的95%的置信区间为(681.619.0,681,62.70)=(35.87,232.44),即区间(35.87,232.44)包含σ2的可靠程度为0.95.(2)这是一个正态总体期望未知时,σ2的单侧区间估计问题,σ2的置信度为1-α=95%(α=0.05)的单侧置信上限为(n-1)S2χ1-α2(n-1)=∑i=110(xi-x¯)2χ1-α2(n-1),已算得(n-1)S2=∑i=110(xi-x¯)2=681.6, 根据自由度1-α=0.95.查自由度10-1=9的χ2分布表得单侧临界值χ1-α2(n-1)=χ0.952(9)=3.325,代入上式便得σ2的0.95的置信上限为681.63.325=205, 即有95%的把握,保证σ2包含在区间(0,205)之内,当然也可能碰上σ2超过上限值205的情形,但出现这种情况的可能性很小,不超过5%.习题20设某批铝材料比重X服从正态分布N(μ,σ2),现测量它的比重16次,算得x¯=2.705,s=0.029,分别求μ和σ2的置信度为0.95的置信区间。
第六章参数估计在实际问题中, 当所研究的总体分布类型已知, 但分布中含有一个或多个未知参数时, 如何根据样本来估计未知参数,这就是参数估计问题.参数估计问题分为点估计问题与区间估计问题两类.点估计就是用某一个函数值作为总体未知参数的估计值;区间估计就是对于未知参数给出一个范围,并且在一定的可靠度下使这个范围包含未知参数.参数估计问题的一般提法:设有一个统计总体, 总体的分布函数为),(x F ,其中为未知参数(可以是向量). 现从该总体中随机地抽样, 得一样本nX X X ,,,21,再依据该样本对参数作出估计, 或估计参数的某已知函数).(g 第一节点估计问题概述一、点估计的概念设n X X X ,,,21是取自总体X 的一个样本, n x x x ,,,21是相应的一个样本值. 是总体分布中的未知参数, 为估计未知参数, 需构造一个适当的统计量),,,,(?21n X X X 然后用其观察值),,,(?21n x x x 来估计的值.称),,,(?21n X X X 为的估计量. 称),,,(?21n x x x 为的估计值. 在不致混淆的情况下,估计量与估计值统称为点估计,简称为估计, 并简记为?.注: 估计量),,,(?21n X X X 是一个随机变量, 是样本的函数,即是一个统计量, 对不同的样本值,的估计值?一般是不同的.例1设X 表示某种型号的电子元件的寿命(以小时计),它服从指数分布:.0,00,1),(~/xx ex f X x 为未知参数, 0. 现得样本值为168, 130, 169, 143, 174, 198, 108, 212, 252,试估计未知参数.二、评价估计量的标准估计量的评价一般有三条标准:无偏性; 有效性; 相合性(一致性).1.无偏性定义1设),,(?1n X X 是未知参数的估计量, 若,)?(E 则称?为的无偏估计量.注: 无偏性是对估计量的一个常见而重要的要求, 其实际意义是指估计量没有系统偏差,只有随机偏差. 在科学技术中, 称)?(E 为用?估计而产生的系统误差.定理1 设n X X ,,1为取自总体X 的样本,总体X 的均值为, 方差为2.则(1) 样本均值X 是的无偏估计量;(2) 样本方差2S 是2的无偏估计量;(3) 样本二阶中心矩ni iX X n12)(1是2的有偏估计量.2.有效性定义2设),,(??111n X X 和),,(??122n X X 都是参数的无偏估计量, 若)?()?(21D D ,则称1?较2?有效.注:在数理统计中常用到最小方差无偏估计, 其定义如下:设n X X ,,1是取自总体X 的一个样本, ),,(?1n X X 是未知参数的一个估计量,若?满足:(1) ,)?(E 即?为的无偏估计;(2) ),?()?(E ?是的任一无偏估计.则称?为的最小方差无偏估计(也称最佳无偏估计).3.相合性(一致性) 定义 3 设),,(??1n X X 为未知参数的估计量, 若?依概率收敛于, 即对任意0, 有,1}|?{|lim P n或,0}|?{|lim P n则称?为的(弱)相合估计量.例2设总体),0(~2N X ,n x x x ,,,21是来自这一总体的样本.(1) 证明ni ix n1221?是2的无偏估计;(2) 求).?(2D 例3设n X X X ,,,21为来自总体X 的样本, X ,),,2,1(n i X i 均为总体均值)(X E 的无偏估计量, 问哪一个估计量有效?例4 设总体),(~2N X ,n X X ,,1为其样本. 试证样本方差2S 是2的相合估计量.课堂练习设总体X 的k 阶矩)1)((kX E kk存在, 又设nX X X ,,,21是X 的一个样本. 试证明不论总体服从什么分布, k 阶样本矩ni k ikXnA 11是k 阶总体矩k的无偏估计量.课后作业:P137 T 3、4第二节点估计的常用方法(1)一、矩估计法矩估计法的基本思想是用样本矩估计总体矩. 因为由在大数定理知, 当总体的k 阶矩存在时,样本的k 阶矩依概率收敛于总体的k 阶矩.例如, 可用样本均值X 作为总体均值)(X E 的估计量, 一般地, 记总体k 阶矩);(kkX E 样本k 阶矩ni kik X n A 11;总体k 阶中心矩;)]([kk X E X E V 样本k 阶中心矩.)(11ni kikX X nB 用相应的样本矩去估计总体矩的方法就称为矩估计法. 用矩估计法确定的估计量称为矩估计量. 相应的估计值称为据估计值. 矩估计量与矩估计值统称为矩估计.求矩估计的方法:设总体X 的分布函数),,;(1k x F 中含有k 个未知参数k,,1, 则(1) 求总体X 的前k 阶矩k,,1,一般都是这k 个未知参数的函数, 记为k i g ki i,,2,1),,,(1(*)(2) 从(*)中解得kjh kj j,,2,1),,,(1(3) 再用),,2,1(k ii 的估计量i A 分别代替上式中的i,即可得),,2,1(k i j的矩估计量:.,,2,1),,,(?1k j A A h k j j注:求,,,1k V V 类似于上述步骤,最后用kB B ,,1代替k V V ,,1,求出矩估计j?),,2,1(k I。
第六章 参数值的估计 第一节 参数估计的一般问题一、估计量与估计值参数估计就是用样本统计量去估计总体参数,如用X 估计μ,用S2估计2σ,用p 估计π等。
总体参数可以笼统地用一个符号θ表示。
参数估计中,用来估计总体参数的统计量的名称,称为估计量,用θ表示,如样本均值、样本比例等就是估计量。
用来估计总体参数时计算出来的估计量的具体数值,叫做估计值。
二、点估计与区间估计——参数估计的两种方法 1、点估计用样本估计量θ的值直接作为总体参数θ的估计量值。
2、区间估计它是在点估计基础上,给出总体参数估计的一个区间,由此可以衡量点估计值可靠性的度量。
这个区间通常是由样本统计量加减抽样误差而得到。
以样本均值的区间估计来说明区间估计原理:根据样本均值的抽样分布可知,重复抽样或无限总体抽样情况下,样本均值,由此可知,样本均值落在总体均值两侧各为一个标准误差范围内的概率为0.6827,两个标准误差范围0.9545,三个标准误差范围0.9973,并可计算出样本均值落在μ的两侧任何一个标准误差范围内的概率(根据已知的μ,σ计算)。
但实际估计时,μ是未知的,因而不再是估计样本均值落在某一范围内的概率,而只能根据已设定的概率计算这个范围的大小。
例如:约有95%的样本均值会落在距μ的两个标准误差范围内,即约有95%的样本均值所构造的两个标准误差的区间会包括μ。
在区间估计中,由样本统计量所构造的总体参数的估计区间,称为置信区间,区间的最小值为置信下限,最大值为置信上限。
例如,抽取了1000个样本,根据每个样本构造一个置信区间,其中有95%的区间包含了真实的总体参数,而5%的没有包括,则称95%为置信水平/置信系数。
构造置信区间时,可以用所希望的值作为置信水平,常用的置信水平是90%,95%,99%,见下表:α称为显著性水平,表示用置信区间估计的不可靠的概率,1-为置信水平。
如何解释置信区间:如用95%的置信水平得到某班学生考试成绩的置信区间为(60,80),即在多次抽样中有95%的样本得到的区间包含了总体真实平均成绩,(60,80)这个区间有95%的可能性属于这些包括真实平均成绩的区间内的一个。
人教版初一数学第六章实数重点知识点梳理单选题1、下列计算正确的是()A.√22=2B.√22=±2C.√42=2D.√42=±2答案:A解析:根据算数平方根的定义可判断:若一个正数的平方等于a,则这个正数就是a的算数平方根.解:A、√22=√4=2,选项正确,符合题意;B、√22=√4=2,选项错误,不符合题意;C、√42=4,选项错误,不符合题意;D、√42=4,选项错误,不符合题意;故选:A.小提示:本题考查了算术平方根的定义,解题的关键是注意区别算数平方根和平方根.2、下列实数中,最大的数是()A.﹣1B.0C.√3D.13答案:C解析:根据实数的大小比较,负数总是小于零,正数总是大于零,同负绝对值大的反而小,同为正可以进行估算比较大小.解:∵√3≈1.732>1,3∴﹣1<0<1<√3,3∴最大的数是√3.故选:C.小提示:本题主要考查实数的大小比较,可以根据负数总是小于零,正数总是大于零,同负绝对值大的反而小进行判断.3、估计√7+1的值在()A.2和3之间B.3和4之间C.4和5之间D.5和6之间答案:B解析:直接利用2<√7<3,进而得出答案.解:∵2<√7<3,∴3<√7+1<4,故选B.小提示:此题主要考查了估算无理数的大小,正确得出√7的取值范围是解题关键.4、√3−1的相反数是()A.1+√3B.1−√3C.−1+√3D.−1−√3答案:B解析:根据相反数的定义,只有符号不同的两个数互为相反数,实数的性质求解即可√3−1的相反数是1−√3,故选B小提示:本题考查了实数的性质,相反数的定义,理解相反数的定义是解题的关键.5、下列四个数中,最大的有理数是()A.-1B.-2019C.√3D.0答案:D解析:根据有理数大小比较判断即可;已知选项中有理数大小为0>−1>−2019,故答案选D.小提示:本题主要考查了有理数比大小,准确判断是解题的关键.6、√(−3)2化简后的结果是()A.√3B.3C.±√3D.±3答案:B解析:试题分析:“√a”表示的是a的算术平方根,“±√a”表示的是a的平方根.√(−3)2=√9=3,故选B.7、下列四个实数中,是无理数的为()A.0B.√3C.﹣1D.13答案:B解析:因为0,﹣1,13是有限小数或无限循环小数,√3是无限不循环小数,所以√3是无理数,故选B.8、已知√a 3=0.1738,√5.283=1.738,则a 的值为( )A .0.528B .0.0528C .0.00528D .0.000528答案:C解析:根据立方根的变化规律如果被开方数缩小1000倍,它的值就缩小10倍,从而得出答案∵√a 3=0.528 ,√5.283=1.738 , ∴a=0.00528,故选C.小提示:此题考查了立方根,熟练掌握立方根的变化规律是本题的关键.填空题9、√16的算术平方根是 _____.答案:2解析:解:∵√16=4,4的算术平方根是2,∴√16的算术平方根是2.所以答案是:2小提示:此题考查了求一个数的算术平方根,这里需注意:√16的算术平方根和16的算术平方根是完全不一样的;因此求一个式子的平方根、立方根和算术平方根时,通常需先将式子化简,然后再去求,避免出错.10、若(x−1)3=−8,则x=____________.答案:-1解析:根据立方根的定义可得x-1的值,继而可求得答案. ∵(x−1)3=−8,∴x-1=√−83,即x-1=-2,∴x=-1,故答案为-1.小提示:本题考查了立方根的定义,熟练掌握是解题的关键.11、已知实数−12,4π,√3,0.101001000100001,√25,√43,其中无理数有________个.答案:3解析:根据无理数就是无限不循环小数逐一进行判断即可得出答案.√25=5,无理数有4π,√3,√43,共3个,所以答案是:3.小提示:本题主要考查无理数,掌握无理数的概念是解题的关键.12、已知√23的整数部分为a,小数部分为b,则a-b=____.答案:8-√23解析:直接利用√23的取值范围得出a,b的值,进而得出答案.解:∵4<√23<5,∴√23的整数部分为a=4,小数部分为b=√23-4.∴a-b=4-(√23-4)=8-√23,故答案为8-√23.小提示:此题主要考查了估算无理数的大小,正确得出√23的取值范围是解题关键.13、若√3的整数部分是a,小数部分是b,则√3a−b=______.答案:1解析:解:∵√3的整数部分为a,小数部分为b,∴a=1,b=√3−1,∴√3a-b=√3−(√3−1)=1.所以答案是:1解答题14、已知√x−2+|x2−3y−13|=0,求x+y的值.答案:-1解析:根据二次根式与绝对值的非负性即可求解.依题意得x-2=0,x2-3y-13=0解得x=2,y=-3,∴x+y=-1小提示:此题主要考查实数的性质,解题的关键是熟知实数的性质.15、阅读下面的文字,解答问题.大家知道√2是无理数,而无理数是无限不循环小数,因此√2的小数部分我们不可能全部地写出来,于是小明用√2-1来表示√2的小数部分,你同意小明的表示方法吗?事实上,小明的表示方法是有道理的,因为√2的整数部分是1,•将这个数减去其整数部分,差就是小数部分.请解答:已知:10+√3=x+y,其中x是整数,且0<y<1,求x-y的相反数.答案:√3-12解析:本题主要考查了无理数的公式能力,解题关键是估算无理数的整数部分和小数部分. 根据题意的方法,估计√3的大小,易得10+√3的范围,进而可得xy的值;再由相反数的求法,易得答案.解:∵1<√3<2,∴1+10<10+√3<2+10,∴11<10+√3<12,∴x=11,y=10+√3-11=√3-1,x-y=11-(√3-1)=12-√3,∴x-y的相反数√3-12.。
第六章实数6.1 平方根1、平方根如果一个数的平方等于a,那么这个数就叫做a的平方根(或二次方跟).一个数有两个平方根,它们互为相反数;零的平方根是零;负数没有平方根.正数a的平方根记做“”.2、算术平方根正数a的正的平方根叫做a的算术平方根,记作“a”.正数和零的算术平方根都只有一个,零的算术平方根是零.()()a aaa a⎧≥⎪==⎨-<⎪⎩;注意a的双重非负性:0a≥⎪⎩例:求下列各数的算术平方根(1)64;(2)2)3(-;(3)49151.例:若数m的平方根是32+a和12-a,求m的值.解:∵负数没有平方根,故m必为非负数.(1)当m为正数时,其平方根互为相反数,故(32+a)+(12-a)=0,解得3=a,故32+a=9332=+⨯,912312-=-=-a,从而8192==a.(2)当m为0时,其平方根仍是0,故032=+a且0433=-a,此时两方程联立无解.GAGGAGAGGAFFFFAFAFGAGGAGAGGAFFFFAFAF例:估计10+1的值是( )(A )在2和3之间 (B )在3和4之间 (C )在4和5之间(D )在5和6之间6.2 立方根如果一个数的立方等于a ,那么这个数就叫做a 的立方根(或a 的三次方根).其中3是根指数.一个正数有一个正的立方根;一个负数有一个负的立方根;零的立方根是零. 注意:33a a -=-,这说明三次根号内的负号可以移到根号外面.例:已知:M a a b =++-82是a +8的算术数平方根,N b a b =--+324是b -3立方根,求M N +的平方根.分析:由算术平方根及立方根的意义可知a +≥8022243a b a b +-=⎧⎨-+=⎩,解方程组,得:a b ==13,GAGGAGAGGAFFFFAFAF代入已知条件得:M N ==903,,∴M N +=+=+=903033故M +N 的平方根是±3.6.3 实数 1、实数的分类正有理数有理数 零 有限小数和无限循环小数 实数 负有理数 正无理数无理数 无限不循环小数 负无理数整数包括正整数、零、负整数. 正整数又叫自然数.正整数、零、负整数、正分数、负分数统称为有理数.2、无理数:无限不循环小数在理解无理数时,要抓住“无限不循环”这一点,归纳起来有四类: (1)开方开不尽的数,如32,7等;(2)有特定意义的数,如圆周率π,或化简后含有π的数,如3π+8等;GAGGAGAGGAFFFFAFAF(3)有特定结构的数,如0.1010010001…等; (4)某些三角函数,如sin60o等 例:在所给的数据:,13,π,0.57, 0.585885888588885…(相邻两个5之间8的个数逐次增加1个)其中无理数个数( B ).(A)2个 (B)3 (C)4个 (D)5个3、相反数实数与它的相反数是一对数(只有符号不同的两个数叫做互为相反数,零的相反数是零),从数轴上看,互为相反数的两个数所对应的点关于原点对称,如果a 与b 互为相反数,则有a+b=0,a=-b ,反之亦成立. 4、绝对值一个数的绝对值就是表示这个数的点与原点的距离,0a ≥.零的绝对值是它本身,若a a =,则0a ≥;若a a =-,则0a ≤.正数大于零,负数小于零,正数大于一切负数,两个负数,绝对值大的反而小. 5、倒数如果a 与b 互为倒数,则有ab=1,反之亦成立.倒数等于本身的数是1和-1.零没有倒数. 例:比较a aa 、、1的大小.GAGGAGAGGAFFFFAFAF①当01<<a 时,取a =001.,则110001aa ==、.,显然有1aa a >>GAGGAGAGGAFFFFAFAF②当a =1时,a aa ==1,③当a >1时,仿①取特殊值可得a a a>>1 例:解方程()2136x +=.解:∵()2136x +=∴x+1看着是36的平方根. 16x +=±. ∴15x=, 27x =-.例:已知一个数的平方根是2a -1和a -11,求这个数.解:由2a -1+a -11=0,得a =4,∴2a -1=2×4-1=7.∴这个数为72=49.例:已知2a -1和a -11是一个数的平方根,求这个数.解:根据平方根的定义,可知2a -1和a -11相等或互为相反数. 当2a -1=a -11时,a =-10,∴2a -1=-21,这时所求得数为(-21)2=441;当2a -1+a -11=0时,a =4,∴2a -1=7,这时所求得数为72=49. 综上可知所求的数为49或441.实数大小进行比较的常用方法方法一:差值比较法差值比较法的基本思路是设a ,b 为任意两个实数,先求出a 与b 的差,再GAGGAGAGGAFFFFAFAF根据当a -b ﹥0时,得到a ﹥b.当a -b ﹤0时,得到a ﹤b.当a -b =0,得到a=b.例1:(1)比较513-与51的大小. (2)比较1-2与1-3的大小.解 ∵513--51=523-<0 , ∴513-<51. 解 ∵(1-2)-(1-3)=23->0 , ∴1-2>1-3.方法二:商值比较法商值比较法的基本思路是设a ,b 为任意两个正实数,先求出a 与b 得商.当ba <1时,a <b ;当ba >1时,a >b ;当ba =1时,a=b.来比较a 与b 的大小.例2:比较513-与51的大小.GAGGAGAGGAFFFFAFAF解:∵513-÷51=13-<1 ∴513-<51 方法三:倒数法倒数法的基本思路是设a ,b 为任意两个正实数,先分别求出a 与b 的倒数,再根据当a1>b1时,a <b.来比较a 与b 的大小.例3:比较2004-2003与2005-2004的大小.解∵200320041-=2004+2003,200420051-=2005+2004又∵2004+2003<2005+2004 ∴2004-2003>2005-2004(超纲,不作要求)方法四:平方法平方法的基本是思路是先将要比较的两个数分别平方,再根据a >0,b >0时,可由2a >2b 得到a >b 来比较大小,这种方法常用于比较无理数的大小. 例5:比较62+与53+的大小解:1228)62(2+=+, 2)53(+=8+215.又∵8+212<8+215 ∴62+<53+.方法五:估算法估算法的基本是思路是设a ,b 为任意两个正实数,先估算出a ,b 两数或两数中某部分的取值范围,再进行比较.例4:比较8313-与81的大小解:∵3<13<4 ∴13-3<1 ∴8313-<81方法六:移动因式法(穿墙术)移动因式法的基本是思路是,当a>0,b>0,若要比较形如a db c与的大小,可先把根号外的因数a与c平方后移入根号内,再根据被开方数的大小进行比较.例6:比较27与33的大小GAGGAGAGGAFFFFAFAFGAGGAGAGGAFFFFAFAF解:∵27=722•=28,33=332•=27.又∵28>27, ∴27>33.方法七:取特值验证法比较两个实数的大小,有时取特殊值会更简单.例7:当10 x 时,2x ,x ,x1的大小顺序是______________.解:(特殊值法)取x =21,则:2x =41,x1=2.∵41<21<2,∴2x <x <x1.例:设a =20,b =(-3)2,cd =112-⎛⎫⎪⎝⎭,则a 、b 、c 、d 按由小到大的顺序排列正确的是( )A.c <a <d <bB.b <d <a <cC.a <c <d <bD.b <c <a <d 分析 可以分别求出a 、b 、c 、d 的具体值,从而可以比较大小. 解:∵a =20=1,b =(-3)2=9,cd =112-⎛⎫⎪⎝⎭=2<1<2<9,∴c <a <d <b .故应选A .除以上七种方法外,还有利用数轴上的点,右边的数总比左边的数大;以及绝对值比较法等比较实数大小的方法.对于不同的问题要灵活用简便合理的方法来解题.能快速地取得令人满意的结果.精品文档如有侵权请联系告知删除,感谢你们的配合!22721 58C1 壁< Q28079 6DAF 涯r37902 940E 鐎*[25846 64F6 擶35585 8B01 謁kiU27717 6C45 汅GAGGAGAGGAFFFFAFAF。
点估计与区间估计方法例题和知识点总结在统计学中,点估计和区间估计是两种常用的估计方法,用于从样本数据中推断总体的参数。
下面我们将通过一些例题来深入理解这两种估计方法,并对相关知识点进行总结。
一、点估计点估计是用样本统计量来估计总体参数,给出一个具体的值。
常见的点估计方法有矩估计法和最大似然估计法。
矩估计法矩估计法的基本思想是用样本矩来估计总体矩。
例如,设总体 X 服从参数为λ的泊松分布,即 P(X = k) =(λ^k e^(λ))/ k! (k = 0, 1, 2,),从该总体中抽取容量为 n 的样本 X₁, X₂,, Xₙ,求λ的矩估计值。
因为总体的一阶矩 E(X) =λ,而样本的一阶矩(即样本均值)为X =(X₁+ X₂++ Xₙ) / n 。
根据矩估计法,令样本一阶矩等于总体一阶矩,即X=λ,所以λ的矩估计值为λ̂=X。
最大似然估计法最大似然估计法的基本思想是在给定样本观测值的情况下,使得样本出现的概率最大的参数值作为估计值。
例如,设总体 X 服从正态分布N(μ, σ²),从该总体中抽取容量为 n 的样本 X₁, X₂,, Xₙ,求μ和σ²的最大似然估计值。
首先写出样本的联合概率密度函数(似然函数)L(μ, σ²),然后分别对μ和σ²求偏导数,并令偏导数等于 0,解方程组即可得到μ和σ²的最大似然估计值。
μ的最大似然估计值为μ̂=X,σ²的最大似然估计值为σ̂²=(1 /n) Σ(XᵢX)²。
二、区间估计区间估计是在点估计的基础上,给出一个区间,认为总体参数以一定的概率落在这个区间内。
区间估计的关键是确定置信水平和置信区间。
置信水平表示区间估计的可靠性,常用的置信水平有 90%、95%和 99%。
置信区间则是根据样本数据和置信水平计算得到的一个区间。
一个常见的例子假设我们要估计某地区成年人的平均身高。
抽取了一个样本,样本均值为 170 厘米,样本标准差为 10 厘米,样本容量为 100。
第六章点估计1. 本章重点概括本章要求学生正确理解参数点估计的概念。
掌握矩估计法,明确其实质是用样本矩来替换总体矩,即皮尔逊替换原则。
掌握极大似然估计法,明确其基本思想是选取估计量,使得该样本发生的可能性最大,能熟练地求出某些常见分布中未知参数的极大似然估计量。
掌握关于判别估计量优良性的一致性、无偏性、有效性这三个准则,并能熟练地加以运用。
掌握罗-克拉美(Rao-Cramer)不等式的条件、结论,能求一些常见分布中未知参数的无偏估计量之方差的罗-克拉美下界,会求一些常见分布中未知参数的有效估计,或会证明某∧θ是θ的有效估计。
掌握充分统计量的概念和奈曼(Neyman)因子分解定理,并会加以应用。
点估计方法一般有两种,一种为矩估计法,一种为极大似然估计法。
矩估计法比较直观,对任何总体都适用,方法简单,但需要保证总体的相应的矩存在,若不存在就不能用矩估计的方法。
而极大似然估计对任何总体也都适用,从它得到估计量一般有有效性,并且常常具有无偏性,即使不具有无偏性,也可以修正偏差使估计值与待估计参数的真实值充分接近。
极大似然估计法的缺点是往往要解一个似然方程,而这个方程在有些情况下是很难解的。
在分析估计量的好坏时,应首先考虑一致性,即看估计量是否依概率收敛于所估计的参数,不具备一致性的估计量我们一般是不予考虑的。
估计量是一个随机变量,对于不同的样本值,一般给出参数不同的估计值,因而在考虑估计量的优劣时,应该从某种整体性能去衡量,而不能看它在个别样本之下表现如何。
一般来说,矩估计和极大似然估计都不一定是无偏估计。
无偏估计要111112求估计量的数学期望等于待估参数,但无偏估计不一定是有效估计,如正态总体期望的估计量∑==n i i i X k 1ˆμ,其中∑==n i i k 11是无偏估计,但只有当n n nk i ,,2,1,1 ==时,μˆ才是有效估计。
由于统计量很多,那么怎样的统计量才是最佳的呢?直观的想法是,一方面要尽可能的简单,另一方面又要能提供样本所含的“全部信息”,由此引出了充分统计量的定义。
直接从定义出发判断一个统计量是不是充分统计量有时很困难,奈曼给出了一个较为方便的因子分解定理。
2. 基本概念1) 点估计设总体X 的分布已知,θ是待估参数。
n X X X ,,,21 为来自该总体一个样本,若n X X X ,,,21 构造一个统计量),,,(ˆˆ21nX X X θθ=,并 用θˆ估计θ,则称θˆ是θ的估计量。
2) 一致性若θˆ是θ的估计量,如果对于任意0>ε,总有 1}ˆ{lim =<-∞→εθθP n , 则称θˆ为θ的一致估计量。
3) 无偏性若未知参数θ的估计量满足θθ=)ˆ(E 则称θˆ具有无偏性,并称θˆ是θ的无偏估计量。
4) 渐近无偏性若未知参数θ的一个估计θˆ有偏,但当∞→n 时,113,)ˆ(θθ→E 则称θˆ为θ的渐近无偏估计量。
5) 有效性若1ˆθ和2ˆθ都是θ的无偏估计量,且)ˆ()ˆ(21θθD D ≤,则称1ˆθ较2ˆθ有效。
若对固定的样本容量n ,)ˆ(θD 达到最小,则称θˆ为θ的最小方差无偏估计,记为UMVUE 。
6) 罗—克拉美(Rao-Cramer)不等式设n X X X ,,,21 是取自总体X 的一个样本,);(~θx f X ,又),,,(21n X X X u =η是)(θg 的一个无偏估计,且满足正则条件:(a)集合}0);(:{>θx f x 与θ无关;(b))(θg '与θθ∂∂);(x f 存在,且对一切Θ∈θ, dx x f dx x f ⎰⎰∂∂=∂∂θθθθ);();( ⎰⎰∂∂n n n dx dx x f x f x x u 111);();(),,(θθθ n ni i n dx dx x f x x u 111);(),,(⎥⎦⎤⎢⎣⎡∂∂=∏⎰⎰=θθ (c) 令0);(log )(2>⎪⎭⎫ ⎝⎛∂∂=θθθθX f E I 称为信息量,则 )()]([2θθηθnI g D '≥ 这个不等式称为罗—克拉美不等式。
罗—克拉美不等式指出,在样本容量n 给定时,)(θg 的无偏估计的方差不可能无限的小,它有一个下界114)()]([2θθnI g ',称这个下界为R C -下界。
7) 有效估计若θ的一个无偏估计θˆ使罗—克拉美不等式中等式⎥⎥⎦⎤⎢⎢⎣⎡⎪⎭⎫ ⎝⎛∂∂=2);(log 1)ˆ(θθθX f nE D成立,则称θˆ为θ的有效估计。
8) 有效率若θˆ是θ的一个无偏估计,且罗—克拉美不等式下界存在,则称)ˆ(θD 与)(θnI 的比)ˆ()(1θθD nI e = 为估计θˆ的有效率。
9) 充分统计量设n X X X ,,,21 是取自总体X 的一个样本,);(~θx f X ,设),,,(21n X X X u =η是一个统计量,有概率密度);(θy g . 若),(]);([);();(111n n n x x h x x u g x f x f =θθθ 成立,且每当),,,(21n x x x u =η取一固定值时,y =η发生条件下的条件概率函数),(1n x x h 不依赖于θ,则称η为θ的一个充分统计量。
3. 基本方法、定理1) 矩估计法由于总体分布中的未知参数往往是总体X 的一些原点矩或原点矩的函115数,所以矩估计方法的主要思想就是用样本的各阶原点矩去估计相应的总体的各阶原点矩。
求θ的矩估计量θˆ的步骤如下: (1) 求出总体的前k 阶原点矩(用参数k θθθ,,,21 表示)),()(1k l l l v X E v θθ ==,k l ,,2,1 =(2) 从这k 个方程中解出k θθθ,,,21 :),(1k l l v v h =θ,k l ,,2,1 =(3) 用lX 替换上述方程中的l v ,k l ,,2,1 =,则得到l θ的矩估计: ),,(ˆ1kl l X X h =θ,k l ,,2,1 = 不难看出,只要参数k θθθ,,,21 可用原点矩),,,21k X X X 表示,则矩法估计就能进行,无须知道总体分布。
2) 极大似然估计法(1) 总体为离散型。
设总体X 的分布律为);()(θi i a p a X P ==,Θ∈=θ,,2,1 i其中θ为未知参数。
n X X X ,,,21 为X 的一个样本,其观测值为,1x n x x ,,2 ,每个i x 取 ,,21a a 中的某个值,则似然函数为∏==ni i x p L 1),()(θθ选取θˆ作为θ的估计,使)(max )ˆ(θθθL L Θ∈= 则称θθ即为ˆ极大似然估计。
(2) 总体为连续型。
设总体X 的概率密度函数为);(θx f ,其中θ是总体的未知参数,n X X X ,,,21 为X 的一个样本,其观测值为,,,21 x x n x 。
求θ的最大似然估计量θˆ的步骤如下:116 0ln )3(),(ln ln )2()(),()()1(11===∑∏==θθθθθθd L d x f L L x f L ni i n i i 建立并求解似然方程对似然函数取对数的函数为其中写出似然函数的极大似然估计量。
即为,则,确定其最大值求得似然函数的驻点后θθθˆˆ 3)奈曼(Neyman)因子分解定理设n X X X ,,,21 是取自总体X 的一个样本,);(~θx f X ,Θ∈θ,则统计量),,,(21n X X X u =η是一个充分统计量的充要条件是存在两个非负函数1K 和2K ,使得等式),,()],,([);();(12111n n n x x K x x u K x f x f =θθ成立,并且当),,,(21n x x x u =η取一定值时,函数),,(12n x x K 不依赖于θ。
3. 一些说明1) 关于极大似然估计的极大似然估计量。
,即为方法,求出最大值点利用多元函数求极值的组:数,似然方程就是方程元函就为时,似然函数含有多个未知参数)若总体(法,应注意一下问题:似然估计的概率最大。
在用极大取,数,使得的分布参求得总体是通过样本值较大,极大似然估计就的概率取,由概率意义知道,测值得样本观,想是:一次观测样本极大似然估计的统计思mm im n n n n n n n m i L m L X x x x X X X X x x x x x x X X X x x x X X X θθθθθθθθθθ,,,ˆ,,ˆ,ˆ,,2,10ln ,,,1,,,,,,,,,,,,,,,,,,,21212121212121212121 ==∂∂117(2) 并不是对所有的似然函数都可求解似然方程0ln =θd L d 的方法解出极大似然估计量。
例如求均匀分布的未知参数θ的极大似然估计量,设其概率密度为⎪⎩⎪⎨⎧≤<=其他001);(θθθx x f就不能按照求解似然方程的方法来做。
都是最大似然估计量。
唯一,而它的解也未必,似然方程组的解未必估计量来,但也有例外程组能够求出最大似然法。
一般来说,求解方要条件而采取的一种方只是根据极值存在的必求解似然方程组mi L i m ,,2,10),,,(ln )3(21 ==∂∂θθθθ1) 2)关于无偏性和有效性“无偏性”是指估计量的平均值接近于真正的参数值;“有效性”是指存在多个无偏估计量中相对方差较小的一个。
点估计的优良性取决于这些估计量是否具有无偏性和有效性。
不管总体X 服从什么样的分布,下面的结论成立:(1) 样本均值X 是总体均值μ的最小方差无偏估计量;(2) 样本方差2S 是总体方差2σ的最小方差无偏估计量。
例1 填空题118(1) 设总体0,),0(~>θθU X ,n X X X ,,21是来自X 的样本,则θ的矩估计量为 ;极大似然估计量为 .(2) 设射手的命中率为p ,在向同一目标的80次射击中,命中75次,则p 的极大似然估计值为 .(3) 设总体⎩⎨⎧<<+=其它010)1();(~x x x f X ααα,n X X X ,,21是来自X 的样本,则θ的极大似然估计量为 .解 (1)X 2;),,max(1n X X . 因为210θθθ==⎰dx x EX ,则有EX 2=θ,故θ的矩估计量为X 2ˆ=θ; 而似然函数为n i x L i n ,,2,1,0)( =≤≤=-θθθ由似然函数可以看出,要使L 最大,就要使θ尽可能地小,但θ又不能小于),,max(1n x x ,所以θ取),,max(1n x x 时就使L 最大,故θ极大似然估计量为),,max(ˆ1nL X X =θ. (2)1615. 记⎩⎨⎧=射击没有命中目标射击命中目标,,01X , 则X 服从两点分布,⎥⎦⎤⎢⎣⎡-p pP X101, 即有1,0)1()(1=-==-x p p x X P x x ,似然函数为 ∑-∑=-===-=-∏n i i n i i i i x n x n i x x p pp pp L 11)1()1()(11,)1ln()(ln )(ln 11p x n p x L n i ini i --+=∑∑==119 令0ln =dpL d ,得x p L =ˆ 故p 的极大似然估计值为16158075ˆ===x pL . (3) ∑=--n i ixn1ln 1. 因为似然函数为 ααααα)()1()1()(11∏∏==+=+=ni i nn i i x x L , ∑=++=ni i x n L 1)1ln(ln αα 令0ln =αd L d ,得∑=--=n i iL x n 1ln 1ˆα.例2 单选题 (1) 设1021,,X X X 是来自总体X 的样本,下列统计量中不是μ=EX 的无偏估计量的是( ).A. ∑==1011101i i X T ;B. ∑∑==+=106512203201i i i i X X T ; C. ∑==1013551i i iX T ; D. ∑∑==+=1065145151i i i i X X T (2) 设0)ˆ(lim ˆ=∞→θθθD n 的无偏估计,且为,则( ). A. θˆ是θ的矩估计; B. θˆ是θ的有效估计;C. θˆ是θ的极大似然估计;D. θˆ是θ的一致估计120 (3) 设的无偏估计为θθˆ,且0ˆ≠θD ,则2ˆθ必为2θ的( ). A. 无偏估计 ; B. 一致估计 ;C. 有效估计;D. 有偏估计(4)*设总体X 的方差为2σ,),,(21n X X X 是来自X 的样本,∑==n i i X n X 11,212)(11X X n S n i i --=∑=,则( ). A. 2S 是2σ的无偏估计量; B. 2S 是2σ的极大似然估计量;C. 2S 是2σ的一致估计;D. S 与X 独立 解 (1)D. 因为μ==∑=1011101i i EX ET ; μμμ=+=+=∑∑==2015205203201106512i i i i EX EX ET ; μμ===∑∑==101101355551i i i i iEX ET ; μ25151106514=+=∑∑==i i i i EX EX ET 所以4T 不是μ=EX 的无偏估计量 .(2)D. 因为对任意0>ε,有2ˆ)|ˆˆ(|)|ˆ(|εθεθθεθθD E P P <>-=>-∞→→n ,0 所以θˆ是θ的一致估计.(3) D. 因为2222ˆ)ˆ(ˆ)ˆ(θθθθθθ≠+=+=D E D E , 所以2ˆθ必为2θ的有偏估计.121(4)C. 因为由大数定律知,对任意0>ε,有1}|1{|lim 1=<-∑=∞→εμni i n X n P , 所以∑==ni i X n X 11是μ的一致估计量.又21221)(1)(1X X n X X n n i i n i i -=-∑∑==,其中由大数定律知∑=n i iX n 121依概率收敛于2EX ,从而21)(1X X n ni i -∑=依概率收敛于22)(EX EX -2σ=.又11lim =-∞→n n n ,所以212)(11X X n S n i i --=∑=是2σ的一致估计量. 例3 设总体X 的概率密度为00],[1),;(2211221>⎪⎩⎪⎨⎧+∈=θθθθθθθ其它x x f求参数1θ和2θ的矩估计.解 矩矩相应的替代,它是将含样本的某阶法估计是点估计的一种.ˆ,ˆ,,,21121估计量并将其作为未知参数的可以解出的方程,从此方程中就和样本估参数而可以得到一个包含待对应总体的某阶矩,从θθθθnx x在本例中,参数1θ和2θ并不是总体分布的矩,但它们与总体的原点矩、 中心矩有如下关系:21212211θθθθθθ+=⋅=⎰+dx x EX31222121222211θθθθθθθθ++=⋅=⎰+dx x EX12212)(2222θ=-=EX EX DX由此可解得:DX DX EX 32ˆ,3ˆ21=-=θθ, 我们以样本矩代替总体矩,即取2,S DX X EX ==,得到1θ和2θ的矩估计量为S S X 32ˆ,3ˆ21=-=θθ. 例4设总体X 的概率密度为⎪⎩⎪⎨⎧∈-=其它],[1),;(b a x ab b a x f求参数a 和b 的极大似然估计.解 本题的na b b a L )(1),(-=,)ln(ln a b n L --=,如再对a 和b 分别求偏导,不可能解出b a ,,所以这种方法不能用. 因此,转为按定义求出使似然函数L 达到最大值的a 和b .由于na b b a L )(1),(-=,故只要选取),,,min(ˆ21n x x x a= ),,,max(ˆ21nx x x b = 就能使),(b a L 在b aˆ,ˆ处达到最大值,它们就是a 和b 的极大似然估计 . 例5 设总体X 的概率密度为00],0[1);(>⎪⎩⎪⎨⎧∈=θθθθ其它x x f ,n X X ,,1 是来自总体X 的样本,令),,max(43ˆ3211X X X =θ,),,min(4ˆ3212X X X =θ为θ的估计,问哪一个较好? 解 令),,max(321X X X =ξ,),,min(321X X X =η,则123ξ的分布函数为θθξ<<⎪⎭⎫⎝⎛==x x x F x F i X 0,)]([)(33,概率密度为 323)(θξx x f =;η的分布函数为θθη<<⎪⎭⎫⎝⎛--=x x x F 0,11)(3,概率密度为 213)(⎪⎭⎫⎝⎛-=θθηx x f则dx x x E E ⎰⋅==θθξθ032133434ˆθ=, dx xx E E ⎰-⋅==θθθηθ022)1(344ˆθ=,故1ˆθ和2ˆθ都是θ的无偏估计. 20322221111513)43(916)(916)ˆˆ(ˆθθθξξθθθθ=⋅-=-=-=⎰dx x x E E E E D22022222253)1(3)41(16)(16)ˆˆ(ˆθθθθηηθθθθ=-⋅-=-=-=⎰dx x x E E E E D 故知 21ˆˆθθD D <,即1ˆθ比2ˆθ有效. 例6*设总体0,),0(~>θθU X ,n X X X ,,21是来自X 的样本,在例1(1)中已经得到θ的两个估计X 2ˆ1=θ及),,max(ˆ12nX X =θ,试比较两者的无偏性与有效性.124解 (1)因为θθθ=⋅==22)2()ˆ(1X E E故1ˆθ是θ的无偏估计.为求),,max(1n X X 的数学期望,先求它的概率密度. 记),,max(1n X X Z =,)()]([)(1z f z F n z f X n X Z -= 于是 dx x n x X X E n n θθθ1)()],,[max(101-⎰⋅=θ1+=n n 可见),,max(1n X X 不是θ的无偏估计,但修正估计量),,max(11n X X nn +则是θ的无偏估计. (2) 22131124)2()ˆ(θθθnnX D D =⋅==. dx x n x X X E E n n θθθθ1)()],,[max()ˆ(1022122-⎰⋅== 22θ+=n n22222)2()1()1(2)ˆ(θθθθ++=+-+=n n nn n n n D 显见)ˆ()ˆ(12θθD D <,故2ˆθ比1ˆθ有效,而且随着n 的增大,2ˆθ比1ˆθ的优势会越来越明显.这是极大似然估计优于矩估计的有名例子.125例7*设总体X 服从Γ分布,0,0000)(1);(1>>⎪⎩⎪⎨⎧≤>Γ=--θθθθr x x e x r x f x r r,n X X X ,,21是来自X 的样本,若参数r 已知,θ未知,试证rX是θ的UMVUE .证 因为由矩法估计知θ=)(rXE ,所以它是θ的无偏估计. 0,ln ln )(ln );(ln 1>-+-Γ-=-x xx r r x f r θθθ2);(ln θθθθxr x f +-=∂∂则2223242222234222)(θθθθθθθθθθθr r r r r r rX X E I =+-+=⎥⎦⎤⎢⎣⎡+-= 因此R C -下界为rn 2θ,而rn nDX r r X D 221θ==⎪⎪⎭⎫ ⎝⎛ 所以rX是θ的UMVUE . 例8*设n X X ,,1 是独立同分布的随机变量,都服从几何分布10,2,1,0)1();(<<=-=θθθθ x x f x则∑==ni in XT 1是θ的充分统计量.证 由于n X X ,,1 的联合概率密度为,2,1,0)1(),,(11=∑-==i x n n x x x f ni iθθ126取=1k ∑-=ni ix n1)1(θθ,12=k ,则由奈曼因子分解定理知,∑==ni in XT 1是θ的充分统计量.1. 填空题(1) 设总体X 具有几何分布,分布列为,2,1,)1()(1=-==-k p p k X P k ,其中10<<p .n X X ,,1 是来自总体X 的样本, 则(1)p 的矩估计量是 ;(2)p 的极大似然估计量是 .(2) 设总体),0(~θU X ,n X X X ,,21是来自X 的样本,则θ的矩估计量为 ;θ的极大似然估计量为 .(3) 设n X X X ,,21是来自均匀分布)1()1,(>+θθθU 总体X 的样本,则未知参数θ的矩估计θˆ的方差=θˆD . (4) 设θθθ是,21ˆˆ的2个独立的无偏估计量,且假定)ˆ(2)ˆ(21θθD D =,令2211ˆˆˆθθθc c +=,若θθ为ˆ的无偏估计,又使)ˆ(θD 达到最小值,则=1c __ ____;=2c _______.2. 选择题(1)设的无偏估计为θθˆ,且0ˆlim =∞→θD n ,则θˆ1nn -( ). A. 是θ的无偏估计 ; B. 是θ的一致估计 ; C. 是θ的有效估计; D. 以上均不正确(2) 设总体μσμ),,(~2N X 已知,),,(21n X X X 是来自X 的样本,则2σ的有效估计量为( ).127A. 22)(ˆμσ-=X ; B. 212)(1ˆμσ-=∑=ni i X n ; C. 212)(11ˆX n n i i --=∑=σ ; D. 212)(1ˆX X n n i i -=∑=σ (3) 子样n X X ,,1 来自总体X ,2,σμ==DX EX ,则( )可以作为2σ的无偏估计. A. μ已知时,统计量∑=-ni in X12/)(μ; B. μ已知时,统计量)1/()(12--∑=ni in Xμ;C. μ未知时,统计量∑=-ni in X12/)(μ ; D. μ未知时,统计量)1/()(12--∑=ni in Xμ3.设总体X 的概率密度为⎩⎨⎧>=+-其它)()1(c x x c x f θθθ其中0>c 已知,1>θ未知,n X X ,,1 是来自总体X 的样本,试分别用矩法估计和极大似然估计求θ的估计量 .4.设总体X 的概率密度2132,00,03);(X X x x x f ,其它⎪⎩⎪⎨⎧<<<=θθθθ是来自总体X 的样本,试证: (1)),max(67),(32212211X X T X X T =+=都是θ 的无偏估计;128(2)在形为),max(21X X C T c =的估计中,78T 最有效5.若总体),0(~2σN X ,n X X ,,1 是来自总体X 的样本,令∑==n i i n 1221ˆξσ,证明:22ˆσσ是的一致估计 . 6. 设n X X ,,1 是独立同分布的随机变量,都服从参数为λ的普哇松分布,则∑==ni in XT 1是λ的充分统计量.自检题答案或提示1. 填空题 (1) X /1;X /1; (2) X 2;)(n X ; (3)n121; (4) 1/3;2/32. 选择题 (1) B ; (2) B; (3) A3. 矩估计cX X-=θˆ; 极大似然估计∑=-=ni iLcn Xn1ln ln ˆθ4.(1)因为θ=1ET , θ=2ET 所以),max(67),(32212211X X T X X T =+=都是θ 的无偏估计 (2)196322θC DT C =最小78=⇒C5.因为∞→→==n nD E ,02ˆ,ˆ4222σσσσ所以22ˆσσ是的一致估计 .1296. n X X ,,1 的联合概率密度为,2,1,0!),,(111=∑=∏=-=i ni in x n x x e x x f ni iλλ取=1k λλn x e ni i-∑=1,112!-=⎪⎪⎭⎫ ⎝⎛=∏n i i x k ,则由奈曼因子分解定理知, ∑==ni i n X T 1是λ的充分统计量.。