第7章 参数估计
- 格式:doc
- 大小:763.50 KB
- 文档页数:35
第7章参数估计主要内容:1 了解评估点估计的标准2 了解点估计的优缺点3 了解区间估计的思想、推导过程4 掌握各种情况区间估计的算法7.1 参数估计的一般问题7.1.1 估计量与估计值参数估计:就是用样本统计量去估计总体的参数符号:总体参数——θ统计量——ˆθ即如何用ˆθ来估计θ估计量:在参数估计中,用来估计总体参数的统计量的名称称为估计量。
如:样本均值、样本比例、样本方差等。
估计值:根据一个具体样本计算出来的估计量的数值。
7.1.2 点估计与区间估计1 点估计就是用样本统计量ˆθ的某个取值直接作为总体参数θ的估计值。
具体方法:矩估计法、最大似然估计、最小二乘法、顺序统计量法例 已知某企业生产的灯泡寿命2(,)XN μσ,2μσ与均未知。
现随机抽取4只,测得其寿命分别为1502,1453,1367,1650小时,请估计μσ与。
解:1ˆ(1502145313671650)14934x μ==⨯+++=()()()()2222222()ˆ1115021493145314931367149316501493314069ix x s n σ-==-⎡⎤=-+-+-+-⎣⎦=∑ˆ118.6s σ=== 2 点估计的评价标准 A 一致性是指随着样本量的增大,点估计量的值越来越接近被估计的总体参数 样本均值、方差、比例分别为总体均值、方差、比例的一致估计。
B 无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。
设总体参数为θ,所选择的估计量为ˆθ如果ˆ()E θθ= 则称ˆθ为θ的无偏估计。
可以证明:()E x μ=22()E s σ=()E p π=即样本均值、方差、比例分别为总体均值、方差、比例的无偏估计。
C 有效性是指对同一个总体参数的两个无偏估计量,标准差小的估计量更有效。
即1ˆθ与2ˆθ均为总体参数θ的无偏估计,若1ˆ()D θ2ˆ()D θ< 则称1ˆθ是比2ˆθ更有效的一个估计量。
也可以证明,样本均值、方差、比例分别为总体均值、方差、比例的有效估计2 区间估计① 定义:是在点估计的基础上,给出总体参数估计的一个区间范围。
该区间通常由样本统计量加减抽样误差得到。
即可以根据样本统计量的抽样分布对样本统计量与总体参数的接近程度给出一个概率度量。
② 统计思想A 例:为了考察某厂生差的水泥构件的平均抗压强度(单位:千克力/平方厘米),随机抽取了25件样本进行测试,得到25个数据125,,x x ,并由此计算得415x=。
由历史数据知,该厂生产的水泥构件的抗压强度(,400)X N μ,其中μ未知,现希望抽样所获得的信息给出μ的一个区间估计。
B 思路:由于415x =是μ的一个较优的点估计,因此一个合理的区间估计应该是[],x d x d -+问题:d取多大比较合理这样给出的区间估计的可靠程度如何矛盾:d 越大,可靠程度越高;但区间过宽没有实际的意义d 越小,精确程度越高,但可靠的程度会很低。
C 解决办法: 抽样前,区间估计[],x d x d -+是一个随机区间,用这个随机区间覆盖未知参数μ的概率的大小来度量可靠程度通过这个概率的确定来确定区间估计的宽度 即先定可靠性,再定精确性()1P X d X d μα-≤≤+≥-02X d X dX d X d X d X d d X dμμμμμμ-≤≤+⇔--≤≤-+⇔-≤≤-+⇔-≤-≤1/21/2()1()11211/12//P X d X d P d X d d X dP d d d Z d Z ααμαμαμαασασσσ---≤≤+≥-⇔-≤-≤≥---⇔≤≤≥-⎛⎫⇔Φ-≥- ⎪⎝⎭⎛⎫⇔Φ≥- ⎪⎝⎭⇔≥⇔≥取端点12d Znασ-=整理得1122,X Z X Z αασσ--⎡⎤-+⎢⎥⎣⎦此时就满足了()1P X d X d μα-≤≤+≥-的要求,D 对于这个具体的问题,当0.05α=,则0.975121.96ZZ α-==1122,X Z X Z αασσ--⎡⎤-+⎢⎣415 1.9620/ 1.9620/⎡⇔-⨯+⨯⎣[]4157.84,4157.84⇔-+[]407.16,422.84⇔表明:从样本观测值提供的数据,推断出以95%的可靠程度,保证该厂生产的水泥构件的抗压强度在407。
16~422.84(千克力/平方厘米)之间。
进一步解释:一旦一个样本确定,由其确定的区间或者包括未知参数μ,或者不包括。
95%的可靠性是说,如果抽样100次,按照同样方法构造的100个区间中,至少有95个区间覆盖/包括了未知参数μ均值③定义的数学表述设()12,,,nX X X是取自总体X的一个样本,对于未知参数θ,给定α,01α<<。
如果存在两个统计量()12,,,nX X Xθ和()12,,,n X X X θ,使得()()1212(,,,,,,)1n n P X X X X X X θθθα≤≤≥-那么,称,θθ⎡⎤⎣⎦为θ的双侧1α-的置信区间;称1α-为置信水平;α为显著性水平直观意义:对同一个未知参数θ反复使用同一置信区间()()1212,,,,,,,n n X X X X X X θθ⎡⎤⎣⎦尽管不能保证每一次,θθθ⎡⎤∈⎣⎦ 但至少有约100(1)%α-次使得,θθθ⎡⎤∈⎣⎦成立。
置信区间——精确程度置信水平——可靠程度 显著性水平——不可靠程度 ④ 求解置信区间的一般步骤 第1步,求出未知参数θ的一个较优的点估计()12ˆ,,,n X X X θ第2步,以ˆθ为基础,寻找一个随机变量()1,,;n J J X X θ=要求:必须包含、也只能包含这个未知参数θJ的分位数能通过查表或计算得到具体数值努力的方向:标准正态、卡方、t、F分布第3步,把J的2α分位数记为a,12α-分位数记为b ,于是()1P a J b α≤≤=-第4步,把不等式a J b≤≤作等价变形,使它成为()()1212,,,,,,n n X X X X X X θθθ≤≤这个,θθ⎡⎤⎣⎦便是一个双侧1α-的置信区间对把α平分的解释:为了置信区间不要太宽7.2 一个总体参数的区间估计内容7.2.1总体均值μ的区间估计1 正态总体均值μ的区间估计(1)2σ已知寻找一个点估计ˆx μ=以x 为基础构造估计量2(,)XN μσ,所以2(,)XN nσμ标准化(0,1)/X N μσ-概率形式:2121X P Z Z ααμα-⎛⎫-≤≤=- ⎪⎝⎭整理:212212212122/X Z Z Z X Z X Z X Z X Z X Z ααααααααμσσσμσσμσσμ-----≤≤≤-≤-+≤-≤-+-≤≤-标准正态分布概率密度函数的关于Y 轴对称性212Z Z αα-=-所以2σ已知时μ的双侧1α-的置信区间为1212X Z X Z αασσ--⎡⎤-+⎢⎥⎣⎦,或者记做12X Z ασ-± ;或者2x Z ασ±注意:置信区间的构造2Z ασ称为 边际误差置信区间就是 均值±边际误差边际误差两部分组成:σ——统计量的标准差,总体与样本容量确定,这个值就确定下来12Z α-——决定区间的宽度,即估计的精度,α越大,区间约宽,精度越差例:一家食品生产袋装食品的企业,每天的产量大约为8000袋左右。
按规定每袋的重量应为100g 。
为对产量进行监测,企业质检部门经常要进行抽检,以分析每袋质量是否符合要求。
现从某天生产的一批食品中随机抽取25袋,测得每袋重量如下112.5101.0 103.0 102.0 100.5 102.6 107.5 95.0 108.8 115.6 100.0 123.5 102.0 101.6 102.2 116.6 95.4 97.8 108.6 105.0 136.8102.8101.598.493.3已知产品重量服从正态分布,且总体标准差为10g ,试估计该天产品平均重量的置信区间,置信水平为95%。
解:由题意可知,10σ=,25n =,105.36x =,0.05α=,查表可得0.975Z 1.96=所以,1210105.361.96105.36 3.92x Z ασ-±=±⨯=± 即[101.44,109.28],该批食品平均重量95%的置信区间为101.44g~109.28g 。
(2)2σ未知寻找一个点估计ˆx μ=以x为基础构造估计量2(,)XN μσ,2σ未知,所以(1)/X t n s μ-~-概率形式:2121/X P t t s ααμα-⎛⎫-≤≤=- ⎪⎝⎭整理:22222222-/X t t s s s t X t s sX t X t s sX t X t ααααααααμμμμ-≤≤-≤-≤--≤-≤-+-≤≤+所以2σ未知μ的双侧1α-的置信区间为22X t X t αασσ⎡⎤-+⎢⎥⎣⎦或记做2s X t α±例:已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命如下(单位:小时)请建立这批灯泡使用寿命95%的置信区间。
解:由题意可得,正态总体、2σ未知对μ的估计,置信区间为2s X t α±16n =,0.05α=,查表得20.025(1)(15) 2.131t n t α-==计算得11(151014801470)149016i x x n ==+++=∑24.77s ===带入置信区间公式224.771490 2.131149013.2s x t α±=±⨯==±即[1476.8,1503.2],该种灯泡平均使用寿命的95%的置信区间为1476.8~1503.22 非正态总体均值的区间估计只能解决大样本(通常30n ≥)的情况。
2σ已知时,μ的双侧1α-的置信区间为12X Z ασ-±2σ未知时,μ的双侧1α-的置信区间为12sX Zα-±7.2.2总体方差的区间估计(限于正态总体)寻找一个点估计22ˆs σ=以2s为基础构造估计量2(,)X Nμσ,所以222(1)(1) n snχσ--概率形式:2221222(1)1n sPααχχασ-⎛⎫-≤≤=- ⎪⎝⎭整理:22222122221222222222212(1)1(1)(1)(1)(1)n sn s n s n sn sααααααχχσχχσσχχ----≤≤≤≤----≤≤即总体方差2σ的1α-的置信区间为2222212(1)(1),n s n s ααχχ-⎡⎤--⎢⎥⎢⎥⎣⎦例:一家食品生产袋装食品的企业,每天的产量大约为8000袋左右。
按规定每袋的重量应为100g 。
为对产量进行监测,企业质检部门经常要进行抽检,以分析每袋质量是否符合要求。