标准正态分布曲线N
- 格式:ppt
- 大小:1.44 MB
- 文档页数:78
在正态分布N(μ,σ^2)中,μ表示均值,就是钟形曲线的对称轴,σ^2为方差,σ为标准差μ决定正态曲线的中心位置,标准差σ决定正态曲线的陡峭或扁平程度。
σ越小,曲线越陡峭;σ越大,曲线越扁平。
正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由棣莫弗(Abraham de Moivre)在求二项分布的渐近公式中得到。
C.F.高斯在研究测量误差时从另一个角度导出了它。
P.S.拉普拉斯和高斯研究了它的性质。
是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。
若随机变量X服从一个数学期望为μ、方差为σ2的正态分布,记为N(μ,σ2)。
其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
当μ = 0,σ = 1时的正态分布是标准正态分布。
定理由于一般的正态总体其图像不一定关于y轴对称,对于任一正态总体,其取值小于x的概率。
只要会用它求正态总体在某个特定区间的概率即可。
为了便于描述和应用,常将正态变量作数据转换。
将一般正态分布转化成标准正态分布。
若服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。
故该变换被称为标准化变换。
(标准正态分布表:标准正态分布表中列出了标准正态曲线下从-∞到X(当前值)范围内的面积比例。
)一维正态分布若随机变量服从一个位置参数为、尺度参数为的概率分布,且其概率密度函数为则这个随机变量就称为正态随机变量,正态随机变量服从的分布就称为正态分布,记作,读作服从,或服从正态分布。
μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。
多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。
2.4正态分布复习引入:总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线.它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间a ,b 内取值的概率等于总体密度曲线,直线x =a ,x =b 及x 轴所围图形的面积.观察总体密度曲线的形状,它具有“两头低,中间高,左右对称”的特征,具有这种特征的总体密度曲线一般可用下面函数的图象来表示或近似表示: 式中的实数μ、)0(>σσ是参数,分别表示总体的平均数与标准差,,()x μσϕ的图象为正态分布密度曲线,简称正态曲线. 讲解新课:一般地,如果对于任何实数a b <,随机变量X 满足,()()baP a X B x dx μσϕ<≤=⎰,则称 X 的分布为正态分布normal distribution .正态分布完全由参数μ和σ确定,因此正态分布常记作),(2σμN .如果随机变量 X 服从正态分布,则记为X ~),(2σμN .经验表明,一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用结果之和,它就服从或近似服从正态分布.例如,高尔顿板试验中,小球在下落过程中要与众多小木块发生碰撞,每次碰撞的结果使得小球随机地向左或向右下落,因此小球第1次与高尔顿板底部接触时的坐标 X 是众多随机碰撞的结果,所以它近似服从正态分布.在现实生活中,很多随机变量都服从或近似地服从正态分布.例如长度测量误差;某一地区同年龄人群的身高、体重、肺活量等;一定条件下生长的小麦的株高、穗长、单位面积产量等;正常生产条件下各种产品的质量指标如零件的尺寸、纤维的纤度、电容器的电容量、电子管的使用寿命等;某地每年七月份的平均气温、平均湿度、降雨量等;一般都服从正态分布.因此,正态分布广泛存在于自然现象、生产和生活实际之中.正态分布在概率和统计中占有重要的地位.说明:1参数μ是反映随机变量取值的平均水平的特征数,可以用样本均值去佑计;σ是衡量随机变量总体波动大小的特征数,可以用样本标准差去估计.2.早在 1733 年,法国数学家棣莫弗就用n 的近似公式得到了正态分布.之后,德国数学家高斯在研究测量误差时从另一个角度导出了它,并研究了它的性质,因此,人们也称正态分布为高斯分布. 2.正态分布),(2σμN 是由均值μ和标准差σ唯一决定的分布通过固定其中一个值,讨论均值与标准差对于正态曲线的影响3.通过对三组正态曲线分析,得出正态曲线具有的基本特征是两头底、中间高、左右对称 正态曲线的作图,书中没有做要求,教师也不必补上 讲课时教师可以应用几何画板,形象、美观地画出三条正态曲线的图形,结合前面均值与标准差对图形的影响,引导学生观察总结正态曲线的性质4.正态曲线的性质:1曲线在x 轴的上方,与x 轴不相交2曲线关于直线x=μ对称3当x=μ时,曲线位于最高点4当x <μ时,曲线上升增函数;当x >μ时,曲线下降减函数 并且当曲线向左、右两边无限延伸时,以x 轴为渐近线,向它无限靠近5μ一定时,曲线的形状由σ确定σ越大,曲线越“矮胖”,总体分布越分散;σ越小.曲线越“瘦高”.总体分布越集中:五条性质中前三条学生较易掌握,后两条较难理解,因此在讲授时应运用数形结合的原则,采用对比教学5.标准正态曲线:当μ=0、σ=l 时,正态总体称为标准正态总体,其相应的函数表示式是2221)(x ex f -=π,-∞<x <+∞其相应的曲线称为标准正态曲线标准正态总体N0,1在正态总体的研究中占有重要的地位 任何正态分布的概率问题均可转化成标准正态分布的概率问题讲解范例:例1.给出下列三个正态总体的函数表达式,请找出其均值μ和标准差σ1),(,21)(22+∞-∞∈=-x ex f x π2),(,221)(8)1(2+∞-∞∈=--x ex f x π322(1)(),(,)x f x x -+=∈-∞+∞ 答案:10,1;21,2;3-1,例2求标准正态总体在-1,2内取值的概率. 解:利用等式)()(12x x p Φ-Φ=有=1)1()2(-Φ+Φ=+-1=.1.标准正态总体的概率问题:对于标准正态总体N0,1,)(0x Φ是总体取值小于0x 的概率, 即 )()(00x x P x <=Φ,其中00>x ,图中阴影部分的面积表示为概率0()P x x < 只要有标准正态分布表即可查表解决.从图中不难发现:当00<x 时,)(1)(00x x -Φ-=Φ;而当00=x 时,Φ0=2.标准正态分布表 标准正态总体)1,0(N 在正态总体的研究中有非常重要的地位,为此专门制作了“标准正态分布表”.在这个表中,对应于0x 的值)(0x Φ是指总体取值小于0x 的概率,即 )()(00x x P x <=Φ,)0(0≥x .若00<x ,则)(1)(00x x -Φ-=Φ.利用标准正态分布表,可以求出标准正态总体在任意区间),(21x x 内取值的概率,即直线1x x =,2x x =与正态曲线、x 轴所围成的曲边梯形的面积1221()()()P x x x x x <<=Φ-Φ.3.非标准正态总体在某区间内取值的概率:可以通过)()(σμ-Φ=x x F 转化成标准正态总体,然后查标准正态分布表即可 在这里重点掌握如何转化 首先要掌握正态总体的均值和标准差,然后进行相应的转化4.小概率事件的含义发生概率一般不超过5%的事件,即事件在一次试验中几乎不可能发生假设检验方法的基本思想:首先,假设总体应是或近似为正态总体,然后,依照小概率事件几乎不可能在一次试验中发生的原理对试验结果进行分析假设检验方法的操作程序,即“三步曲”一是提出统计假设,教科书中的统计假设总体是正态总体;二是确定一次试验中的a 值是否落入μ-3σ,μ+3σ; 三是作出判断讲解范例:例1. 若x ~N 0,1,求l P <x <;2Px >2. 解:1P <x <=- =-1-==.2Px >2=1-Px <2=1-2==.例2.利用标准正态分布表,求标准正态总体在下面区间取值的概率: 1在N1,4下,求)3(F 2在N μ,σ2下,求Fμ-σ,μ+σ; Fμ-σ,μ+σ;Fμ-2σ,μ+2σ; Fμ-3σ,μ+3σ解:1)3(F =)213(-Φ=Φ1= 2Fμ+σ=)(σμσμ-+Φ=Φ1=Fμ-σ=)(σμσμ--Φ=Φ-1=1-Φ1=1-=Fμ-σ,μ+σ=Fμ+σ-Fμ-σ=-= Fμ-σ,μ+σ=Fμ+σ-Fμ-σ= Fμ-2σ,μ+2σ=Fμ+2σ-Fμ-2σ= Fμ-3σ,μ+3σ=Fμ+3σ-Fμ-3σ= 对于正态总体),(2σμN 取值的概率:在区间μ-σ,μ+σ、μ-2σ,μ+2σ、μ-3σ,μ+3σ内取值的概率分别为%、%、% 因此我们时常只在区间μ-3σ,μ+3σ内研究正态总体分布情况,而忽略其中很小的一部分例3.某正态总体函数的概率密度函数是偶函数,而且该函数的最大值为π21,求总体落入区间-,之间的概率解:正态分布的概率密度函数是),(,21)(222)(+∞-∞∈=--x ex f x σμσπ,它是偶函数,说明μ=0,)(x f 的最大值为)(μf =σπ21,所以σ=1,这个正态分布就是标准正态分布教学反思:1.在实际遇到的许多随机现象都服从或近似服从正态分布 ,频率分布直方图就无限接近于一条总体密度曲线,总体密度曲线较科学地反映了总体分布但总体密度曲线的相关知识较为抽象,学生不易理解,因此在总体分布研究中我们选择正态分布作为研究的突破口 正态分布在统计学中是最基本、最重要的一种分布2.正态分布是可以用函数形式来表述的 其密度函数可写成:22()2(),(,)x f x x μσ--=∈-∞+∞, σ>0由此可见,正态分布是由它的平均数μ和标准差σ唯一决定的 常把它记为),(2σμN 3.从形态上看,正态分布是一条单峰、对称呈钟形的曲线,其对称轴为x=μ,并在x=μ时取最大值 从x=μ点开始,曲线向正负两个方向递减延伸,不断逼近x 轴,但永不与x 轴相交,因此说曲线在正负两个方向都是以x 轴为渐近线的4.通过三组正态分布的曲线,可知正态曲线具有两头低、中间高、左右对称的基本特征;由于正态分布是由其平均数μ和标准差σ唯一决定的,因此从某种意义上说,正态分布就有好多好多,这给我们深入研究带来一定的困难 发现,许多正态分布中,重点研究N0,1,其他的正态分布都可以通过)()(σμ-Φ=x x F 转化为N0,1,我们把N0,1称为标准正态分布,其密度函数为22121)(x ex F -=π,x ∈-∞,+∞,从而使正态分布的研究得以简化;结合正态曲线的图形特征,归纳正态曲线的性质 正态曲线的作图较难,教科书没做要求,授课时可以借助几何画板作图,学生只要了解大致的情形就行了,关键是能通过正态曲线,引导学生归纳其性质;8 3 9 4 5 7 0 1 9 3 3 9 2 2 2 2 4 1 3 2 1 827111685997534898681585429216862743663734973785872642428478149354895912512838678682439194554598482664234415421965863654387648772856368434736597265522431794923915791536777。
标准正态分布性质标准正态分布是统计学中非常重要的一个概念,它具有许多独特的性质,对于理解和应用正态分布至关重要。
本文将从均值、标准差、形状等方面来介绍标准正态分布的性质。
首先,标准正态分布的均值为0,这意味着在标准正态分布曲线中,对称轴即为均值所在的位置。
这也符合正态分布的性质,即分布曲线呈现对称的特点。
其次,标准正态分布的标准差为1,这意味着在标准正态分布中,数据点相对于均值的分散程度是固定的,这也是为什么标准正态分布曲线能够被标准化的原因。
除此之外,标准正态分布还具有一个非常重要的性质,即68-95-99.7法则。
这个法则指出,在标准正态分布中,大约68%的数据点落在均值加减一个标准差的范围内,大约95%的数据点落在均值加减两个标准差的范围内,而大约99.7%的数据点落在均值加减三个标准差的范围内。
这个法则在实际应用中非常有用,可以帮助我们快速了解数据的分布情况。
此外,标准正态分布的曲线呈现出典型的钟形,两头逐渐变陡,中间较为平缓的形状。
这种形状反映了数据集中在均值附近,而远离均值的数据点较少的特点。
这也是为什么正态分布在自然界和社会现象中广泛存在的原因之一。
总的来说,标准正态分布具有均值为0,标准差为1,对称性强,以及68-95-99.7法则等重要性质。
这些性质使得标准正态分布在统计学中有着重要的地位,也为我们理解和分析数据提供了重要的工具和方法。
在实际应用中,我们经常会遇到需要对数据进行正态化处理的情况,即将数据转化为符合标准正态分布的形式。
这样做的好处在于可以方便地进行统计分析和比较,同时也符合许多统计方法的要求。
总之,标准正态分布是统计学中非常重要的一个概念,它具有许多独特的性质,对于理解和应用正态分布至关重要。
通过本文的介绍,希望读者能够更加深入地理解标准正态分布的性质,为实际应用提供更多的帮助和指导。
标准正态分布曲线的计算公式为正态分布标准化的公式:Y=(X-μ)/σ~N(0,1)。
证明;因为X~N(μ,σ^2),所以P(x)=(2π)^(-1/2)*σ^(-1)*exp{[-(x-μ)^2]/(2σ^2)}。
注:F(y)为Y的分布函数,Fx(x)为X的分布函数。
而F(y)=P(Y≤y)=P((X-μ)/σ≤y)=P(X≤σy+μ)=Fx(σy+μ)。
所以p(y)=F'(y)=F'x(σy+μ)*σ=P(σy+μ)*σ=[(2π)^(-1/2)]*e^[-(x^2)/2]。
从而,N(0,1)。
正态分布标准化的意义是可以方便计算,是一种统计学概念。
原本的正态分布图形有高矮胖瘦不同的形态,实际上是积分变换的必然结果,就好比是:
1.y=kx+b直线,它不一定过原点的,但是通过变换就可以了:大Y=y-b;大
X=kx;===>大Y=大X。
2.y=a*b乘积,通过变换就可以变成加法运算:Ln(y)=Lna+Lnb。
3.y=ax²+bx+c通过变换就可以变成标准形式:y=a(x+b/(2a))²+(c-b²
/(4a))。
正态分布的标准化也只不过是“积分变换”而已,虽然高矮胖瘦不同的形态,但是变量的线性伸缩变换并不改变其量化特性,虽然标准化以后都变成期望是0,方差是1的标准分布了,但这种因变量自变量的依赖关系仍然存在,不用担心会“质变”。
标准正态分布x~n
标准正态分布(Standard Normal Distribution)又被称为Z分布或标准高斯分布,记作X~N(0,1)。
它是正态分布的一种特殊情况,其均值μ=0,方差σ²=1。
标准正态分布的概率密度函数为:
f(x) = (1/√(2π)) * e^((-x²)/2),其中e为自然对数的底数。
标准正态分布的特点包括:
1. 曲线呈钟形对称,以x=0为对称轴;
2. 平均值为0,即期望值E(X) = 0;
3. 标准差为1,即标准差σ(X) = 1;
4. 区间[-1,1] 中的概率值为0.6827(约等于68%);
5. 区间[-2,2] 中的概率值为0.9545(约等于95%);
6. 区间[-3,3] 中的概率值为0.9973(约等于99.7%)。
标准正态分布在统计学和概率论中广泛应用,可以通过标准正态分布表或计算机软件来获取其相应的概率值和统计量。
正态分布曲线的特点及曲线所表示的意义【知识点的知识】1.正态曲线及性质(1)正态曲线的定义函数φμ,σ(x)=,x∈(﹣∞,+∞),其中实数μ和σ(σ>0)为参数,我们称φμ,σ(x)的图象(如图)为正态分布密度曲线,简称正态曲线.(2)正态曲线的解析式①指数的自变量是x定义域是R,即x∈(﹣∞,+∞).②解析式中含有两个常数:π和e,这是两个无理数.③解析式中含有两个参数:μ和σ,其中μ可取任意实数,σ>0这是正态分布的两个特征数.④解析式前面有一个系数为,后面是一个以e为底数的指数函数的形式,幂指数为﹣.2.正态分布(1)正态分布的定义及表示如果对于任何实数a,b(a<b),随机变量X满足P(a<X≤b)=φμ,σ(x)dx,则称X的分布为正态分布,记作N(μ,σ2).(2)正态总体在三个特殊区间内取值的概率值①P(μ﹣σ<X≤μ+σ)=0.6826;②P(μ﹣2σ<X≤μ+2σ)=0.9544;③P(μ﹣3σ<X≤μ+3σ)=0.9974.3.正态曲线的性质正态曲线φμ,σ(x)=,x∈R有以下性质:(1)曲线位于x轴上方,与x轴不相交;(2)曲线是单峰的,它关于直线x=μ对称;(3)曲线在x=μ处达到峰值;(4)曲线与x轴围成的图形的面积为1;(5)当σ一定时,曲线随着μ的变化而沿x轴平移;(6)当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.4.三个邻域会用正态总体在三个特殊区间内取值的概率值结合正态曲线求随机变量的概率.落在三个邻域之外是小概率事件,这也是对产品进行质量检测的理论依据.【典型例题分析】题型一:概率密度曲线基础考察典例1:设有一正态总体,它的概率密度曲线是函数f(x)的图象,且f(x)=,则这个正态总体的平均数与标准差分别是()A.10与8 B.10与2 C.8与10 D.2与10解析:由=,可知σ=2,μ=10.答案:B.典例2:已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<2)等于()A.0.6 B.0.4 C.0.3 D.0.2解析:由P(ξ<4)=0.8知P(ξ>4)=P(ξ<0)=0.2,故P(0<ξ<2)=0.3.故选C.典例3:已知随机变量X服从正态分布N(3,1),且P(2≤X≤4)=0.682 6,则P(X>4)等于()A.0.158 8 B.0.158 7 C.0.158 6 D.0.158 5解析由正态曲线性质知,其图象关于直线x=3对称,∴P(X>4)=0.5﹣P(2≤X≤4)=0.5﹣×0.682 6=0.1587.故选B.题型二:正态曲线的性质典例1:若一个正态分布的概率密度函数是一个偶函数,且该函数的最大值为.(1)求该正态分布的概率密度函数的解析式;(2)求正态总体在(﹣4,4]的概率.分析:要确定一个正态分布的概率密度函数的解析式,关键是求解析式中的两个参数μ,σ的值,其中μ决定曲线的对称轴的位置,σ则与曲线的形状和最大值有关.解(1)由于该正态分布的概率密度函数是一个偶函数,所以其图象关于y轴对称,即μ=0.由=,得σ=4,故该正态分布的概率密度函数的解析式是φμ,σ(x)=,x∈(﹣∞,+∞).(2)P(﹣4<X≤4)=P(0﹣4<X≤0+4)=P(μ﹣σ<X≤μ+σ)=0.6826.点评:解决此类问题的关键是正确理解函数解析式与正态曲线的关系,掌握函数解析式中参数的取值变化对曲线的影响.典例2:设两个正态分布N(μ1,)(σ1>0)和N(μ2,)(σ2>0)的密度函数图象如图所示,则有()A.μ1<μ2,σ1<σ2B.μ1<μ2,σ1>σ2C.μ1>μ2,σ1<σ2D.μ1>μ2,σ1>σ2解析:根据正态分布N(μ,σ2)函数的性质:正态分布曲线是一条关于直线x=μ对称,在x=μ处取得最大值的连续钟形曲线;σ越大,曲线的最高点越低且较平缓;反过来,σ越小,曲线的最高点越高且较陡峭,故选A.答案:A.题型三:服从正态分布的概率计算典例1:设X~N(1,22),试求(1)P(﹣1<X≤3);(2)P(3<X≤5);(3)P(X≥5).分析:将所求概率转化到(μ﹣σ,μ+σ].(μ﹣2σ,μ+2σ]或[μ﹣3σ,μ+3σ]上的概率,并利用正态密度曲线的对称性求解.解析:∵X~N(1,22),∴μ=1,σ=2.(1)P(﹣1<X≤3)=P(1﹣2<X≤1+2)=P(μ﹣σ<X≤μ+σ)=0.682 6.(2)∵P(3<X≤5)=P(﹣3<X≤﹣1),∴P(3<X≤5)=[P(﹣3<X≤5)﹣P(﹣1<X≤3)]=[P(1﹣4<X≤1+4)﹣P(1﹣2<X≤1+2)]=[P(μ﹣2σ<X≤μ+2σ)﹣P(μ﹣σ<X≤μ+σ)]=×(0.954 4﹣0.682 6)=0.1359.(3)∵P(X≥5)=P(X≤﹣3),∴P(X≥5)=[1﹣P(﹣3<X≤5)]=[1﹣P(1﹣4<X≤1+4)]=[1﹣P(μ﹣2σ<X≤μ+2σ)]=×(1﹣0.954 4)=0.0228.求服从正态分布的随机变量在某个区间取值的概率,只需借助正态曲线的性质,把所求问题转化为已知概率的三个区间上.典例2:随机变量ξ服从正态分布N(1,σ2),已知P(ξ<0)=0.3,则P(ξ<2)=.解析:由题意可知,正态分布的图象关于直线x=1对称,所以P(ξ>2)=P(ξ<0)=0.3,P(ξ<2)=1﹣0.3=0.7.答案:0.7.题型4:正态分布的应用典例1:2011年中国汽车销售量达到1 700万辆,汽车耗油量对汽车的销售有着非常重要的影响,各个汽车制造企业积极采用新技术降低耗油量,某汽车制造公司为调查某种型号的汽车的耗油情况,共抽查了1 200名车主,据统计该种型号的汽车的平均耗油为百公里8.0升,并且汽车的耗油量ξ服从正态分布N(8,σ2),已知耗油量ξ∈[7,9]的概率为0.7,那么耗油量大于9升的汽车大约有辆.解析:由题意可知ξ~N(8,σ2),故正态分布曲线以μ=8为对称轴,又因为P(7≤ξ≤9)=0.7,故P(7≤ξ≤9)=2P(8≤ξ≤9)=0.7,所以P(8≤ξ≤9)=0.35,而P(ξ≥8)=0.5,所以P(ξ>9)=0.15,故耗油量大于9升的汽车大约有1 200×0.15=180辆.点评:服从正态分布的随机变量在一个区间上的概率就是这个区间上,正态密度曲线和x 轴之间的曲边梯形的面积,根据正态密度曲线的对称性,当P(ξ>x1)=P(ξ<x2)时必然有=μ,这是解决正态分布类试题的一个重要结论.典例2:工厂制造的某机械零件尺寸X服从正态分布N(4,),问在一次正常的试验中,取1 000个零件时,不属于区间(3,5]这个尺寸范围的零件大约有多少个?解∵X~N(4,),∴μ=4,σ=.∴不属于区间(3,5]的概率为P(X≤3)+P(X>5)=1﹣P(3<X≤5)=1﹣P(4﹣1<X≤4+1)=1﹣P(μ﹣3σ<X≤μ+3σ)=1﹣0.9974=0.0026≈0.003,∴1 000×0.003=3(个),即不属于区间(3,5]这个尺寸范围的零件大约有3个.【解题方法点拨】正态分布是高中阶段唯一连续型随机变量的分布,这个考点虽然不是高考的重点,但在近几年新课标高考中多次出现,其中数值计算是考查的一个热点,考生往往不注意对这些数值的记忆而导致解题无从下手或计算错误.对正态分布N(μ,σ2)中两个参数对应的数值及其意义应该理解透彻并记住,且注意第二个数值应该为σ2而不是σ,同时,记住正态密度曲线的六条性质.。