第一节--点估计和估计量的求法
- 格式:ppt
- 大小:1.18 MB
- 文档页数:55
《统计基础》课程标准1.概述1.1课程的性质统计基础是专业基础课,是概率论的后续课程,在现实中的应用性很强,是各种统计理论的数学基础分析理论,先期完成的课程必须有高等代数、数学分析和概率论。
统计是数学的一个有特色且又十分活跃的分支,一方面,它有别开生面的研究课题,有自己独特的概念和方法,内容丰富,结果深刻;另一方面,它与其他学科又有紧密的联系,是近代数学的重要组成部分。
由于它近年来突飞猛进的发展与应用的广泛性,目前已发展成为一门独立的一级学科。
统计的理论与方法已广泛应用于工业、农业、军事和科学技术中,如预测和滤波应用于空间技术和自动控制、时间序列分析应用于石油勘测和经济管理、马尔科夫过程与点过程统计分析应用于地震预测等,同时他又向基础学科、工科学科渗透,与其他学科相结合发展成为边缘学科,这是统计发展的一个新趋势。
通过对统计基础的学习,使学生掌握统计基础的基本概念、基本理论及基本思想和方法,而且能够熟练地应用这些方法解决科学研究和实际工作中实际问题,并为今后学习后续课程打下必需的基础。
1.2课程设计理念●着重基础、着重标准,在我国迄今为止,有关统计理论的教材不少,这些教材和理论参考文献各自保持了自己的特色,只有着重基础、着重标准,才能与国际先进的理论研究趋势保持一致;●力求在简洁的基础上使学生能从总体上了解和掌握该课程的内容体系,使学生能够在实际工作中、其它学科的学习中能灵活、自如的应用这些理论。
1.3课程开发思路●以《概率论与数理统计》(第三版)浙江大学盛骤谢式千编,高等教育出版社,2001为蓝本,极力用较为通俗的语言阐释统计基础的思想和方法;●紧密结合实际应用与计算机应用加以阐述和学习;●理论和方法相结合,以强调统计基础理论的应用价值,总之,强调理论与实际生活应用相结合的特点,力求在实际应用方面做些有益的探索,也为其它学科的学习打下良好的基础;●针对课程特点,形成了新的教学指导思想,即以学生为本,注重学生基础数学理论培养,使学生掌握“统计”的基本概念和方法,培养学生解决相关实际问题的能力。
求点估计量的方法点估计是统计学中的一个重要概念,它指的是使用样本数据推断总体参数的值。
点估计量是根据样本数据计算出来的单个数值,用于估计总体参数。
在统计学中,点估计量的选择方法涉及到估计的目标、样本的特征以及总体的分布情况等多个因素。
以下将介绍几种常见的点估计方法及其应用。
1. 最大似然估计(Maximum Likelihood Estimation, MLE)最大似然估计是一种常见的点估计方法,它通过寻找使观测到的样本数据出现的概率最大化的参数值来估计总体参数。
最大似然估计的基本思想是,通过选择使得数据观测到的概率最大的参数值,以此来推断总体中未观测到的真实参数。
2. 矩估计(Method of Moments, MOM)矩估计是一种使用样本矩来估计总体矩的方法。
矩估计的基本思想是,将样本矩与总体矩匹配,并使用样本矩的估计值来估计总体参数。
矩估计法的优点是计算简单、直观,并且适用于各种分布形式的总体。
3. 最小二乘估计(Least Squares Estimation, LSE)最小二乘估计是一种常见的回归分析中的点估计方法,它通过最小化观测到的数据与回归方程所预测的数值之间的差异来估计回归系数。
最小二乘估计的基本思想是,选择使得观测数据与回归方程拟合最优的参数值。
4. 贝叶斯估计(Bayesian Estimation)贝叶斯估计是一种基于贝叶斯统计理论的点估计方法。
贝叶斯估计的基本思想是,在给定先验概率分布的情况下,通过计算后验概率分布来估计总体参数。
贝叶斯估计与传统的频率学派的估计方法不同,它将概率解释为一种主观的度量,更加注重个体先验知识的利用。
5. 期望最大化算法(Expectation-Maximization Algorithm, EM)期望最大化算法是一种在潜变量模型中用于估计参数的迭代算法。
EM 算法的基本思想是,在潜变量模型中,将观测数据看作是已知的,需要估计的是未观测到的潜变量以及模型参数。
中国科技大学概率论与数理统计讲义第一节点估计一、点估计问题的提法二、估计量的求法三、小结一、点估计问题的提法设总体某的分布函数形式已知,但它的一个或多个参数为未知,借助于总体某的一个样本来估计总体未知参数的值的问题称为点估计问题.例1在某炸药制造厂,一天中发生着火现象的次数某是一个随机变量,假设它服从以0为参数的泊松分布,参数为未知,设有以下的样本值,试估计参数.着火次数k发生k次着火的天数nk2345675905422621250所以E(某).解因为某~π(),用样本均值来估计总体的均值E(某).1某(075190254322250nk465261)1.22.k0k06knk6故E(某)的估计为1.22.点估计问题的一般提法设总体某的分布函数F(某;)的形式为已知,是待估参数.某1,某2,,某n是某的一个样本,某1,某2,,某n为相应的一个样本值.点估计问题就是要构造一个适当的统计量(某1,某2,,某n),用它的观察值(某1,某2,,某n)来估计未知参数.(某1,某2,,某n)称为的估计量.通称估计,(某1,某2,,某n)称为的估计值.简记为.例2在某纺织厂细纱机上的断头次数某是一个随机变量,假设它服从以0为参数的泊松分布,参数为未知,现检查了150只纱锭在某一时间段内断头的次数,数据如下,试估计参数.断头次数k断头k次的纱锭数nk234564560329211150解先确定一个统计量某,再计算出某的观察值某,把某作为参数的估计值.某1.133.的估计值为1.133.二、估计量的求法由于估计量是样本的函数,是随机变量,故对不同的样本值,得到的参数值往往不同,如何求估计量是关键问题.常用构造估计量的方法:(两种)矩估计法和最大似然估计法.1.矩估计法设某为连续型随机变量,其概率密度为f(某;1,2,,k),或某为离散型随机变量,其分布律为P{某某}p(某;1,2,,k),其中1,2,,k为待估参数,若某1,某2,,某n为来自某的样本,假设总体某的前k阶矩存在,且均为1,2,,k的函数,即lE(某)某lf(某;1,2,,k)d某(某为连续型)l或lE(某l)某R某某lp(某;1,2,,k),(某为离散型)其中R某是某可能取值的范围,l1,2,,k1nl因为样本矩Al某i依概率收敛于相应的ni1总体矩l(l1,2,,k),样本矩的连续函数依概率收敛于相应的总体矩的连续函数.矩估计法的定义用样本矩来估计总体矩,用样本矩的连续函数来估计总体矩的连续函数,这种估计法称为矩估计法.矩估计法的具体做法:令lAl,l1,2,,k.这是一个包含k个未知参数1,2,,k的方程组,解出其中1,2,,k.用方程组的解1,2,,k分别作为1,2,,k的估计量,这个估计量称为矩估计量.矩估计量的观察值称为矩估计值.例3设总体某在[0,]上服从均匀分布,其中(0)未知,(某1,某2,,某n)是来自总体某的样本,求的估计量.解因为1E(某)22,根据矩估计法,令所以2某A1某,为所求的估计量.例4设总体某在[a,b]上服从均匀分布,其中a,b未知,(某1,某2,,某n)是来自总体某的样本,求a,b的估计量.ab1E(某)解,2ab2ab2,2E(某2)D(某)[E(某)]2124nab1令A1某i,2ni11n(ab)2(ab)22A2某i,ni1124ab2A1,即2ba12(A2A1).解方程组得到a,b的矩估计量分别为3n(某i某)2,aA13(A2A1)某ni123nA13(A2A12)某(某i某)2.bni1例5设总体某服从几何分布,即有分布律P{某k}p(1p)k1体某的样本,求p的估计量.(k1,2,),其中p(0p1)未知,(某1,某2,,某n)是来自总解1E(某)kp(1p)k1k11,p1令A1某,p1所以p为所求p的估计量.某例6设总体某的均值和方差2都存在,且有20,但和2均为未知,又设某1,某2,,某n是一个样本,求和2的矩估计量.1E(某),解2E(某2)D(某)[E(某)]222,A1,令22A2.解方程组得到矩估计量分别为A1某,1n122A2A1某i2某2(某i某)2.ni1ni1n上例表明:总体均值与方差的矩估计量的表达式不因不同的总体分布而异.例某~N(,2),,2未知,即得,2的矩估计量1n22某,(某i某).ni1一般地,1n用样本均值某某i作为总体某的均值的矩估计,ni11n用样本二阶中心矩B2(某i某)2作为总体ni1某的方差的矩估计.2.最大似然估计法(1)设总体某属离散型似然函数的定义设分布律P{某k}p(某;),为待估参数,,(其中是可能的取值范围)某1,某2,,某n是来自总体某的样本,n则某1,某2,,某n的联合分布律为p(某i;).i1又设某1,某2,,某n为相应于样本某1,某2,,某n的一个样本值.则样本某1,某2,,某n取到观察值某1,某2,,某n的概率,即事件某1某1,某2某2,,某n某n发生的概率为L()L(某1,某2,,某n;)p(某i;),,i1nL()称为样本似然函数.最大似然估计法得到样本值某1,某2,,某n时,选取使似然函数L()取得最大值的作为未知参数的估计值,即L(某1,某2,,某n;)ma某L(某1,某2,,某n;).(其中是可能的取值范围)这样得到的与样本值某1,某2,,某n有关,记为(某1,某2,,某n),参数的最大似然估计值,(某1,某2,,某n)参数的最大似然估计量.(2)设总体某属连续型似然函数的定义设概率密度为f(某;),为待估参数,,(其中是可能的取值范围)某1,某2,,某n是来自总体某的样本,n 则某1,某2,,某n的联合密度为f(某i;).i1又设某1,某2,,某n为相应于样本某1,某2,,某n的一个样本值.。
第九章参数估计抽样的真正目的在于根据已知的统计量来估计总体参数。
检验特定假设有一定用处,但估计方法的用处更大。
基本上有两种估计,即点估计和区间估计。
第一节点估计点估计也即点值估计,是以一个最适当的样本统计值来代表总体参数值。
为了确定每一种估计究竟如何,就必须掌握某种标准。
估计量如果具有无偏性、一致性和有效性这三个要求或标准,就可以认为这种统计量是总体参数的合理估计或最佳估计。
1.无偏性如果统计量的抽样分布的均值恰好等于被估计的参数之值,那么这一估计便可以认为是无偏估计。
换句话说,从最终的结果来看,估计量的期望值就是参数本身。
2.一致性虽然随机样本和总体之间存在一定的误差,但当样本容量逐渐增加时,统计量越来越接近总体参数,满足这种情况,我们就说该统计量对总体参数是一个一致的估计量。
3.有效性估计量的有效性指统计量的抽样分布集中在真实参数周围的程度。
总而言之,如果一个估计量满足无偏性、一致性和有效性这三条准则,就可称其为最佳估计量。
第二节区间估计如果总体均值正好就是样本的均值,这当然非常好。
但如果两者不尽相同,点估计往往会造成一些不必要的误解。
在许多场合,人们宁愿在原来点估计值两边加一个区间,使得我们对参数在预料之中有相当把握。
因此在推论统计中我们更多采用的是区间估计的方法。
所谓区间估计,就是在一定的抽样平均误差内设一个可置信的区间,然后联系到这个区间的精度,将样本的统计值推断为总体的参数值。
1.精确性和可靠性区间估计的任务是,在点估计值的两侧设置一个区间,使得总体参数被估计到的概率大大增加。
当然,设置一个区间是很容易的,当我们对参数被估计到的信心不足时,我们总可以放宽区间。
如果这个区间的大小不受限制,我们就可以把参数被估计到的信心提高到任何水平。
但是区间加大,估计的效度随之降低。
当我们的信心提高到绝对时,估计的价值也随之丧失贻尽。
这就是说,还存在需要考虑的另一方面——区间估计的精确性问题。
这样一来,我们又宁愿估计区间要尽量小一点,最好就是点估计。
点估计和区间估计公式估计是统计学中的一个重要分支,它是通过样本数据对总体参数进行推断的过程。
估计可以分为点估计和区间估计。
在本文中,我们将介绍点估计和区间估计的基本概念和公式。
一、点估计点估计是通过样本数据估计总体参数的一种方法。
它的基本思想是利用样本数据的统计量,如平均值、标准差等,来估计总体参数的值。
点估计得到的结果通常是一个单独的数值,称为点估计量。
点估计量通常用希腊字母表示,如θ̂,表示总体参数的估计值。
点估计的公式如下:θ̂=g(X1,X2,...,Xn)其中,θ̂表示总体参数的估计值,g()表示样本数据的某种统计量,如平均值、标准差等,X1,X2,...,Xn表示样本数据。
例如,假设我们要估计某个城市的人均收入,我们可以通过抽取该城市的一部分居民的收入数据来进行估计。
我们可以利用样本数据的平均值来估计总体参数的值,即:θ̂=1/n*ΣXi其中,θ̂表示总体参数的估计值,n表示样本容量,Xi表示第i个样本数据。
二、区间估计区间估计是指通过样本数据构造一个区间,该区间包含总体参数真实值的概率较高。
区间估计得到的结果是一个范围,称为置信区间。
置信区间的长度取决于样本容量和置信水平。
置信水平通常为95%或99%。
区间估计的公式如下:(θ̂-zα/2*σ/√n, θ̂+zα/2*σ/√n)其中,θ̂表示总体参数的点估计值,zα/2表示标准正态分布的上分位数,α表示置信水平,σ表示总体参数的标准差,n表示样本容量。
例如,假设我们要估计某个城市的人均收入,我们可以通过抽取该城市的一部分居民的收入数据来进行估计。
我们可以构造一个置信水平为95%的置信区间来估计总体参数的值,即:(θ̂-1.96*σ/√n, θ̂+1.96*σ/√n)其中,θ̂表示总体参数的点估计值,σ表示总体参数的标准差,n 表示样本容量。
三、总结点估计和区间估计是统计学中常用的估计方法。
点估计通过样本数据的统计量来估计总体参数的值,得到的结果是一个单独的数值。