概率论文 正态分布

  • 格式:docx
  • 大小:155.28 KB
  • 文档页数:7

下载文档原格式

  / 7
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

正态分布

------概率论论文在高中的一堂数学课上,老师向同学们简单的介绍了一下概率论,这是我第一次接触到正态分布。但却使我深深的被它吸引从此便对它有了浓厚的兴趣.不过在高中的学习对于这方面的知识学习只是浅尝辄止。令我兴奋的是,在这学期文海玉老师的概率论与数理统计课上又重新接触到了正态分布这方面的知识,这无疑重新燃起了我的兴趣.下面是我对正态分布的一些浅显的认识。

让我们先从正态分布的发展史说起, 正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。这要到20世纪正态小样本理论充分发展起来以后。拉普拉斯很快得知高斯的工作,并马上将其与他发现的中心极限定理联系起来,为此,他在即将发表的一篇文章(发表于1810年)上加上了一点补充,指出如若误差可看成许多量的叠加,根据他的中心极限定理,误差理应有高斯分布。这是历史上第一次提到所谓“元误差学说”——误差是由大量的、由种种原因产生的元误差叠加而成。后来到1837年,海根(G.Hagen)在一篇论文中正式提出了这个学说.按狄莫佛的中心极限定理,立即就得出误差(近似地)服从正态分布。拉普拉斯所指出的这一点有重大的意义,在于他给误差的正态理论一个更自然合理、更令人信服的解释。因为,高斯的说法有一点循环论证的气味:由于算术平均是优良的,推出误差必须服从正态分布;反过来,由后一结论又推出算术平均及最小二乘估计的优良性,故必须认定这二者之一(算术平均的优良性,误差的正态性) 为出发点。但算术平均到底并没有自行成立的理由,以它作为理论中一个预设的出发点,终觉有其不足之处。拉普拉斯的理论把这断裂的一环连接起来,使之成为一个和谐的整体,实有着极重大的意。

了解完发展史,我们会有疑问,发展到现在的概率论中的正态分布的确切定义到底是什么?

正态分布的概率密度函数均值为μ方差为σ2 (或标准差σ)是高斯函数的一个实例:

如果一个随机变量X服从这个分布,我们写作X~ N(μ,σ2). 如果μ = 0并且σ = 1,这个分布被称为标准正态分布,这个分布能够简化为

下边是给出了不同参数的正态分布的函数图。

正态分布中一些值得注意的量:

∙密度函数关于平均值对称

∙平均值是它的众数(statistical mode)以及中位数(median)∙函数曲线下68.268949%的面积在平均值左右的一个标准差范围内∙95.449974%的面积在平均值左右两个标准差2σ的范围内

∙99.730020%的面积在平均值左右三个标准差3σ的范围内

∙99.993666%的面积在平均值左右四个标准差4σ的范围内

∙反曲点(inflection point)在离平均值的距离为标准差之处累积分布函数

上图所示的概率密度函数的累积分布函数

累积分布函数是指随机变量X小于或等于x的概率,用密度函数表示为

正态分布的累积分布函数能够由一个叫做误差函数的特殊函数表示:

标准正态分布的累积分布函数习惯上记为Φ,它仅仅是指μ = 0,σ = 1时的值,

将一般正态分布用误差函数表示的公式简化,可得:

它的反函数被称为反误差函数,为:

该分位数函数有时也被称为probit函数。probit函数已被证明没有初等原函数。

正态分布的分布函数Φ(x)没有解析表达式,它的值可以通过数值积分、泰勒级数或者渐进序列近似得到。

生成函数

动差生成函数

动差生成函数被定义为exp(tX)的期望值。

正态分布的矩生成函数如下:

可以通过在指数函数内配平方得到。

特征函数

特征函数被定义为exp(itX)的期望值,其中i是虚数单位. 对于一个正态分布来讲,特征函数是:

把矩生成函数中的t换成it就能得到特征函数。

正态分布具有以下的性质.

1.如果且a与b是实数,那么aX + b∼N(aμ + b,(aσ)2) .

2.如果与是统计独立的正态随机变量,那

么:

o它们的和也满足正态分布

(proof).

o它们的差也满足正态分布

.

o U与V两者是相互独立的。

3.如果和是独立正态随机变量,那么:

o它们的积XY服从概率密度函数为p的分布

其中K0是贝塞尔函数(modified Bessel function)

o它们的比符合柯西分布,满足X / Y∼Cauchy(0,σX / σY).

4.如果为独立标准正态随机变量,那么服从自由度

为n的卡方分布。

最后让我们通过实例分析,感受正态分布的神奇之处.你会发现其实正态分布离我们的生活很近很近!

医学参考值

某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。

医学参考值范围亦称医学正常值范围。它是指所谓“正常人”的解剖、生理、生化等指标的波动范围。制定正常值范围时,首先要确定一批样本含量足够大的“正常人”,所谓“正常人”不是指“健康人”,而是指排除了影响所研究指标的疾病和有关因素的同质人群;其次需根据研究目的和使用要求选定适当的百分界值,如80%,90%,95%和99%,常用95%;根据指标的实际用途确定单侧或双侧界值,如白细胞计数过高过低皆属不正常须确定双侧界值,又如肝功中转氨酶过高属不正常须确定单侧上界,肺活量过低属不正常须确定单侧下界。另外,还要根据资料的分布特点,选用恰当的计算方法。常用方法有:

(1)正态分布法:适用于正态或近似正态分布的资料。

双侧界值:X+-u(u)^S单侧上界:X+u(u)^S,或单侧下界:X-u(u)^S