2月12日(对数正态分布)-2
- 格式:docx
- 大小:104.67 KB
- 文档页数:2
正态分布概念及图表正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A·棣莫弗在求二项分布的渐近公式中得到。
C.F.高斯在研究测量误差时从另一个角度导出了它。
P·S·拉普拉斯和高斯研究了它的性质。
是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。
若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。
其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
当μ = 0,σ = 1时的正态分布是标准正态分布。
目录1历史发展2定理3定义▪一维正态分布▪标准正态分布4性质5分布曲线▪图形特征▪参数含义6研究过程7曲线应用▪综述▪频数分布▪综合素质研究▪医学参考值历史发展正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。
但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。
这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。
在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。
这要到20世纪正态小样本理论充分发展起来以后。
拉普拉斯很快得知高斯的工作,并马上将其与他发现的中心极限定理联系起来,为此,他在即将发表的一篇文章(发表于1810年)上加上了一点补充,指出如若误差可看成许多量的叠加,根据他的中心极限定理,误差理应有高斯分布。
对数正态分布(log-normaldistribution)对数正态分布对数正态分布机率密度函数µ=0累积分布函数µ=0参数值域概率密度函数累积分布函数期望值众数⽅差偏态峰态熵值动差⽣成函数(参见原始动差⽂本)特征函数isasymptotically divergent but sufficientfor numerical purposes在概率论与统计学中,对数正态分布是对数为正态分布的任意随机变量的概率分布。
如果X 是正态分布的随机变量,则exp(X)为对数分布;同样,如果Y是对数正态分布,则 ln(Y) 为正态分布。
如果⼀个变量可以看作是许多很⼩独⽴因⼦的乘积,则这个变量可以看作是对数正态分布。
⼀个典型的例⼦是股票投资的长期收益率,它可以看作是每天收益率的乘积。
对于x > 0,对数正态分布的概率分布函数为其中µ与σ分别是变量对数的平均值与标准差。
它的期望值是⽅差为给定期望值与标准差,也可以⽤这个关系求µ与σ⽬录[隐藏]1 与⼏何平均值和⼏何标准差的关系2 矩3 局部期望4 参数的最⼤似然估计6 进⼀步的阅读资料7 参考⽂献8 参见[编辑]与⼏何平均值和⼏何标准差的关系对数正态分布、⼏何平均数与⼏何标准差是相互关联的。
在这种情况下,⼏何平均值等于exp(µ),⼏何平均差等于 exp(σ)。
如果采样数据来⾃于对数正态分布,则⼏何平均值与⼏何标准差可以⽤于估计置信区间,就像⽤算术平均数与标准差估计正态分布的置信区间⼀样。
其中⼏何平均数µgeo = exp(µ),⼏何标准差σgeo = exp(σ)[编辑]矩原始矩为:或者更为⼀般的矩[编辑]局部期望随机变量X在阈值k上的局部期望定义为其中f(x) 是概率密度。
对于对数正态概率密度,这个定义可以表⽰为其中Φ是标准正态部分的累积分布函数。
对数正态分布的局部期望在保险业及经济领域都有应⽤。
对数正态分布参数
对数正态分布是一种常见的概率分布,其参数包括均值和方差。
均值和方差分别影响着分布的形状和分布范围。
对于对数正态分布,其均值和方差的计算公式如下:
均值:μ = exp(μ+σ^2/2)
方差:σ^2 = (exp(σ^2)-1)*exp(2μ+σ^2)
其中,μ表示对数正态分布的自然对数的均值,σ表示对数正态分布的自然对数的标准差。
对数正态分布的参数估计是一种重要的统计方法,可以利用极大似然估计或贝叶斯方法进行。
极大似然估计是常用的参数估计方法之一,通过最大化样本的似然函数来估计参数值。
贝叶斯方法则是一种更加灵活的方法,通过引入先验知识和后验概率来估计参数值。
在实际应用中,对数正态分布常用于描述随机变量的对数值分布,例如金融、生物学和环境科学等领域。
对数正态分布的参数估计对于这些领域的研究具有重要的意义。
- 1 -。
对数正态分布公式
正态分布函数公式如下:
其中μ为均数,σ为标准差。
μ决定了正态分布的位置,与μ越近,被取到的概率就越大,反之越小。
σ描述的是正态分布的离散程度。
σ越大,数据分布越分散曲线越扁平;σ越小,数据分布越集中曲线越陡峭。
在一个标准正态分布中,约有 68.2% 的点落在±1 个标准差的范围内。
约有 95.5% 的点落在±2 个标准差的范围内。
约有 99.7% 的点落在±3 个标准差的范围内。
正态分布概念是由法国数学家棣莫弗于1733年首次提出的,后由德国数学家高斯率先将其应用于天文学研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,所以有了“高斯分布”的美称。
在我们的自然界,大多数物种的高度和重量都满足正态分布,它们围绕着均值对称分布,而且不会包含特别大或特别小的事件.
例如:我们从来没有遇到过1米长的蚂蚁,也没有看到过1千克重的大象。
世界似乎被代表正态分布的“钟形”包围着,很多事物都是服从正态分布的:人的高度、胖瘦、寿命、雪花的尺寸、测量误差、灯泡的寿命、IQ分数、面包的分量、学生的考试分数,员工上班所需时间等等。
今日(2月12号)内容:
第二章:概率论基础知识
2.3 常用的连续分布
2.3.4对数正态分布
如果随机变量X只取正数值,而取自然对数后,lnX服从正态分布,则称X服从对数正态分布。
对数正态分布出现在很多领域,如某些电器的寿命、化学反应时间、混凝土的强度、针刺麻醉的镇痛效果、流行病的蔓延时间、绝缘材料的被击穿电压等。
在机床维修中,大量机床在短时间内都可修理好,但有少量机床需要长时间维修,个别机床可能需要更长的维修时间,因此机床维修时间常常是对数正态分布。
其分布密度的表达式为:
(2-34)这时,lnX~N(μ,σ2)。
我们称μ为位置参数,称σ为尺度参数。
其分布密度的图形显示为图2-38,从中可以看出,服从对数正
态分布的随机变量X的大量取值(“大头”)在左侧,长尾在右侧,虽然尾巴很细但拖得很长,随机变量X所取数值非常分散,这样的分布属于典型的“正偏分布”(见图2-38)。
图2-38对数正态分布密度图
对数正态分布的均值和方差为:
(2-35)
对数正态分布也可以有第3信阈值参数T,做为分布的起始点。
第二章未完待续······
200
150100
5000.0350.030
0.0250.0200.015
0.010
0.005
0.000
X 密度分布图对数正态, 位置=3, 尺度=1.2, 阈值=0。