第7章 参数估计
- 格式:doc
- 大小:168.50 KB
- 文档页数:5
第七章 参数估计教学目的:了解参数估计的类型;理解参数估计的意义与原理;掌握点估计与区间估计方法。
教学重点:点估计、区间估计的原理;总体平均数估计的步骤与方法 教学时数:6学时当在研究中从样本获得一组数据后,如何通过这组数据信息,对总体特征进行估计,也就是如何从局部结果推论总体的情况,称为总体参数估计。
参数估计有两类,一类是用一个具体的值(根据样本数据计算出来的)来代替总体的参数,如用样本平均数代替总体均值,用样本标准差S n-1代替总体标准差,这种参数估计称为点估计;另一类是根据样本信息给出总体参数的可能范围,他不能精确地指出总体参数用哪一个值来代替,但它能以极大的概率保证总体参数落入这个范围,牺牲精确性获得可靠性,这类参数估计称为区间估计。
第一节 点估计、区间估计与标准误一、点估计的定义指在进行参数估计时,直接以一个特定值(一般常用样本统计量的值)作为总体参数的估计值。
二、良好估计量的标准用样本统计量作为总体参数的估计值,总是有一定的偏差,一个好的估计量应具备经下的一些特性:1.无偏性指一切可能样本的统计量的值与总体参数的偏差的平均值为0,称无偏估计量,否则,称有偏估计量。
无偏性更精确的表述为:若样本的某个统计量的均值等于该被估计的总体参数,则该样本统计量是无偏的。
其直观意义是无系统偏差。
如X 、Md 、Mo 都是μ的无偏估计量。
如2S 就不是2σ的无偏估计量,21-n S 才是2σ的无偏估计量。
2.有效性指当总体参数的无偏估计量不只一个时,无偏估计变异小者的有效性高。
直观意义是取值比较稳定、可靠。
如A 、B 都是总体参数的无偏估计量,则哪一个的方差较小,就较有效。
如平均数、中数、众数都是无偏估计量,但只有平均数最有效,其方差为n 2σ,而样本中的任一个数据作为估计值,其方差为2σ3.一致性指当样本容量无限增大时,估计值越来越接近它所估计的参数。
μ-=i i X d 则∑∑-=-=μμN X N X d i i )( 即ndX i∑=-μ所以当∞→n 时0→∑ndi即μ→X 此外有∞→n 时,221σ→-n S4.充分性指一个容量为n 的样本统计量,是否充分地反映了全部n 个数据所反映总体的信息。
三、区间估计与标准误点估计方便、简单,但总是存在误差,其误差大小及可靠程度无法得知,区间估计可克服此缺点。
区间估计是根据样本信息给出总体参数的可能范围。
(一)区间估计的定义是根据样本统计量,利用抽样分布的原理,在一定的可靠程度上,估计出总体参数所在的范围,即以数轴上的一段距离表示未知参数可能落入的范围。
(二)置信区间与显著性水平设有一随机变量X 服从正态分布,则随机抽取的样本的平均数),(~2nN x σμ,若要求用样本平均数估计总体平均数达到95%的可靠度。
根据正态分布理论和抽样分布理论可知,任一样本的平均数落在总体均值左右1.96个标准差的范围内的概率为95%,反之,任一样本平均数左右1.96个标准差范围内可能包含总体均值的可能性为95%。
即95.096.1=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-n X P σμ这里所用的标准差是样本平均数的标准差,它等于总体标准差的n 分之一。
所以{}05.0195.096.196.1-==+<<-n X n X P σμσ这里以估计总体均值为例来说明了区间估计的原理。
在这里的概率95%称为置信度,即有多大可能包含总体参数,反映了推断总体参数落在某一区间的可靠程度;那么1-95%=5%即是构造出来的置信区间没有能把总体的参数包含在内的概率,它是构造置信区间犯错误的可能性大小,一般称为显著性水平,用α表示,显然显著性水平要求是一很小的概率,而置信度应该是一个较大的概率。
样本平均数左右1.96个标准差的范围]96.1,96.1[n X n X σσ+-称为总体均值的置信度为0.95的置信区间,即可能包含总体参数的区域,也就是区间估计要找的范围;区间左右端点分别称为下置信限和上置信限。
例:通过对某校一年级学生的期末成绩的抽样调查,以0.95的概率估计μ在78.5~85.7分之间,这就是区间估计。
可以说是以0.95的置信度(或在0.05的显著性水平上)估计该校一年级学生的期末成绩的置信区间为[78.5, 82.7],这一估计的正确率为95%,可能犯错误的概率是5%。
↓↓⇒置信度区间 一般α取0.05或0.01 ↑↓⇒↓⇒精度区间X SE ↓↑⇒X SE n故可通过增大n ,来缩小置信区间,但又加大工作量。
(二)区间估计的原理与标准误区间估计是根据样本分布理论,用样本分布的标准误(SE)计算区间长度,解释总体参数落入某置信区间可能的概率。
某种统计量在抽样分布上的标准差,称为标准误。
标准误用来衡量抽样误差。
标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。
因此,标准误是统计推断可靠性的指标。
进行区间估计的关键是找出一个合适的统计量,以及这个统计量抽样分布的状态、标准误。
区间估计包括两个问题,一是成功估计的概率,二是估计范围的大小,即精度大小。
第二节 总体平均数的估计下面分几种具体情况讨论:1.总体平均数的区间估计以取自该总体的样本平均数为基础,根据样本平均数的分布理论对总体平均数进行的估计,最后用概率所界定的区间范围来说明它的不确定性。
(1)总体方差已知时A . 总体分布为正态,无论n 的大小,),(~2nN x σμB . 总体分布为非正态,但n >30时,抽样分布可近似看作正态,),(~2nN x σμ以上两种情况可以正态分布来对总体平均数进行估计,否则不能进行估计。
),(~2nN x σμ )1,0(~N n X Z σμ-=∴ ααα-=⎭⎬⎫⎩⎨⎧≤≤-122Z Z Z P ασμσαα-=⎭⎬⎫⎩⎨⎧+≤≤-122n Z X n Z X P即总体平均数的置信度为α-1的置信区间为⎥⎦⎤⎢⎣⎡+-n Z X n Z X σσαα22, 例1.已知某市6岁正常男童体重的总体方差为6.55公斤,从该市随机抽取15名6岁男童测体重,平均数为20.4公斤,求总体平均数的95%和99%的置信区间。
解:一般认为儿童的身高、体重、智力等的发展符合正态分布66.01555.6===nSE X σ96.1205.0=Z 58.2201.0=Z所以μ的95%的置信区间为nZ X nZ X σμσ205.0205.0+≤≤- 即69.2111.19≤≤μμ的99%的置信区间为nZ X nZ X σμσ201.0201.0+≤≤- 即1.227.18≤≤μ例2:某校历史考试成绩σ=5,从中随机抽取49名学生,平均分为85,试推论μ。
解: σ=5,成绩分布未知,但n>30,故符合条件,可进行推论71.0495===nSE X σ定置信水平为0.95,则μ的95%的置信区间为nZ X nZ X σμσ205.0205.0+≤≤- 即4.866.83≤≤μ(2)总体方差未知时总体方差未知时,用21-n S 作2σ的估计值,实现对μ的估计 A .当),(~2σμN x 时,无论n 大小,均有)1(~1---n t n S x μ成立。
B .总体为非正态,只有当n>30时,才有)1(~1---n t n S x μ成立,也可视为近似服从N (0,1) 除此之外,不能进行估计总体μ的置信度为1-α的置信区间为⎥⎦⎤⎢⎣⎡-+----1,1)1(2)1(2n St X n S t X n n αα例1:从某市制取20名7岁女童测量其身高,经测量,这20名7岁女童的平均身高为116cm ,S=5cm ,试求该市7岁女童的平均身高为μ的95%和99%的置信区间。
解:总体方差未知,但女童身高可以确定为服从正态分布 故)1(~1---n t n S x μ 查表知:当α=0.05时,)19(205.0t =2.293当α=0.01时,)19(201.0t =2.861所以μ的置信度为95%的置信区间为[113.59, 118.41] μ的置信度为99%的置信区间为[112.71, 119.29]例2:某校进行一次数学考试,从中抽取40名学生,平均分为82, 标准差为7分,求μ的95%和99%的置信区间。
解:总体方差未知,总体分布也难于保证正态,但n>30 故仍有)1(~1---n t n S x μ df=n-1=39,表中没有,可近似取40,查表知:当α=0.05时,)40(205.0t =2.021 当α=0.01时,)40(201.0t =2.704所以μ的置信度为95%的置信区间为[79.74, 84.26] μ的置信度为99%的置信区间为[78.97, 85.03]总结:计算步骤为①计算平均数、标准差,②计算平均数标准误,③确定显著性水平,④根据样本平均数的抽样分布,确定查何种统计表,⑤计算置信区间,⑥解释总体平均数的置信区间。
第三节 标准差与方差的区间估计一、标准差的区间估计估计总体标准差的步骤与估计总体平均数的步骤大致相同。
但有两点需要说明:1.从抽样分布的讨论已知,样本标准差的抽样分布在n>30时为渐近正态分布,总体标准差可依正态分布来估计。
当n<30时,总体标准差则无法估计。
2.置信区间为:⎥⎦⎤⎢⎣⎡+-----n S Z S n S Z S n n n n 2,2121121αα例: 某区一次英语统考中,随机抽取40名考生,计算其英语成绩的标准差为15.6,试求该区英语统考成绩总标准差的95%和99%的置信区间。
解:由题意知,由样本标准差估计总体标准差,且n>30,可依正态分布估计。
77.194.88.158039406.152121==⨯=-⨯==-n n n S n S SE n S 95%的置信区间:05.1915.12:,77.196.16.1577.196.16.15≤≤⨯+≤≤⨯-σσ即 99%的置信区间。
17.2003.11:,7.158.26.1577.158.26.15≤≤⨯+≤≤⨯-σσ即 二、方差的区间估计方差的区间估计与平均数相同,首先要确定它们的抽样分布,然后才能据此确定置信区间)1(~222-n nS χσ (要求总体服从正态分布)αχσχαα-=⎪⎪⎭⎫ ⎝⎛≤≤---12)1(2222)1(21n n nS P 2)1(21222)1(22---≤≤n n nS nS ααχσχ 即2σ的置信度为1-α的置信区间为⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡---2)1(2122)1(22,n n nS nS ααχχ 例:在某市进行的一次智力测验中,随机n=20名12岁学生,方差为72.25,求总体方差的95%和99%的置信区间。