正态分布
- 格式:ppt
- 大小:1.08 MB
- 文档页数:34
什么是正态分布正态分布,又称高斯分布,是在统计学和概率论中非常重要的一种连续概率分布。
它是由德国数学家卡尔·弗里德里希·高斯提出的,常用于描述自然界中的许多现象,如身高、智商、测量误差等。
正态分布具有对称的钟形曲线,其特性使得它在统计推断、假设检验等领域起着至关重要的作用。
正态分布的定义正态分布是一个由均值μ(mu)和标准差σ(sigma)两个参数所决定的概率密度函数。
其数学表达式为:在这个公式中,( f(x) ) 是随机变量 ( X ) 的概率密度函数( ) 是均值,代表分布的中心位置( ) 是标准差,用于描述数据的离散程度( e ) 是自然对数的底数,约等于2.71828通过上述公式可以看出,当 ( x = ) 时,( f(x) )达到最大值;而随着 ( x ) 离开均值,概率密度逐渐减小。
正态分布的特性正态分布有几个重要特性,使其在研究中无处不在。
1. 对称性正态分布是关于均值 ( ) 对称的。
这意味着如果你将正态分布函数沿其均值向两侧折叠,左侧和右侧的形状完全一致。
这一特性使得很多统计方法可以简化计算,并提高了分析的效率。
2. 68-95-99.7法则这一法则描述了数据集中不同标准差范围内的数据比例:约68%的数据点落在均值±1个标准差内约95%的数据点落在均值±2个标准差内约99.7%的数据点落在均值±3个标准差内这一规律为理解异常值、识别数据分布特点提供了直观的依据。
3. 中心极限定理中心极限定理表明,在一定条件下,不同的独立随机变量之和趋向于正态分布,无论这些变量本身的分布是什么。
这意味着当你对大量独立同分布的随机变量取样时,其总和或平均值会呈现出近似正态分布,这一特性是统计推断的重要基础。
4. 单峰性正态分布是单峰的,即它只有一个峰值,这个峰值就是均值( μ )。
在这个峰值附近,概率密度最大的地方,随着离均值越远,数据点稀疏程度迅速增加。
正态分布normal distribution正态分布一种概率分布。
正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。
服从正态分布的随机变量的概率规律为取与μ邻近的值的概率大,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。
正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。
它的形状是中间高两边低,图像是一条位于x轴上方的钟形曲线。
当μ=0,σ2 =1时,称为标准正态分布,记为N(0,1)。
μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。
多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。
正态分布最早由A.棣莫弗在求二项分布的渐近公式中得到。
C.F.高斯在研究测量误差时从另一个角度导出了它。
P.S.拉普拉斯和高斯研究了它的性质。
生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。
例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。
一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。
从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。
正态分布应用最广泛的连续概率分布,其特征是“钟”形曲线。
附:这种分布的概率密度函数为:(如右图)正态分布公式正态分布1.正态分布:若已知的密度函数(频率曲线)为正态函数(曲线)则称已知曲线服从正态分布,记号~。
正态分布(Normal distribution)随机变量的概率分布随机变量的类型(数理统计)连续型变量:变量在某一实区间内任意取值;离散型变量:变量只能取有限个数或可列个数。
应用统计分为:数值变量和分类变量,对应于定量资料和定性资料(含等级资料)。
描述随机变量的两个函数●概率密度函数用f(X)表示,对于离散型变量f(X)是变量取X值的概率,常用P(X)表示。
●分布函数变量取小于等于X值所占的比例,显然:有()0F X≥'()()F X f X=()()xF X f X dX-∞=⎰正态分布正态分布(normal distribution ),也称高斯分布(Gaussian dist.),是最常见、最重要的一种连续型分布。
若一个随机变量的概率密度函数为则称这种分布为正态分布。
式中,π为圆周率;e 为自然对数的底。
其中的参数µ是均数,σ是标准差,正态分布可记为X ~Ν(µ,σ)。
正态分布的分布函数为:de Moivre(德)首先提出正态分布的概率曲线具有下述特点(1)正态分布只有一个高峰,高峰的位置在X=μ处。
(2)分布以均数为中心,中间高,两头低,左右完全对称的钟型曲线。
(3)正态分布的两个参数(μ和σ)分别决定了分布的位置和形状。
其中μ是位置参数,σ是形状参数。
当σ恒定时,μ愈大,正态曲线向右移动;反之,μ愈小,正态曲线向左移动。
若μ恒定,σ愈大(数据愈离散),正态曲线显得愈“矮胖”;反之,σ愈小(数据愈集中),正态曲线显得愈“瘦高”。
(5)对任一正态变量X 进行如下线性变换则u 一定服从于均数为零,标准差为1的正态分布,记为u ~N (0,1),称为标准正态分布(standard normal distribution ),其密度函数u 被称为标准正态变量或标准正态离差(standard normal deviate )。
此性质在实际工作中极为重要,给应用工作者提供了极大的方便。