正态分布表资料
- 格式:doc
- 大小:362.50 KB
- 文档页数:11
正态分布概念及图表正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A·棣莫弗在求二项分布的渐近公式中得到。
C.F.高斯在研究测量误差时从另一个角度导出了它。
P·S·拉普拉斯和高斯研究了它的性质。
是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。
若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。
其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
当μ = 0,σ = 1时的正态分布是标准正态分布。
目录1历史发展2定理3定义▪一维正态分布▪标准正态分布4性质5分布曲线▪图形特征▪参数含义6研究过程7曲线应用▪综述▪频数分布▪综合素质研究▪医学参考值历史发展正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。
但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。
这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。
在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。
这要到20世纪正态小样本理论充分发展起来以后。
拉普拉斯很快得知高斯的工作,并马上将其与他发现的中心极限定理联系起来,为此,他在即将发表的一篇文章(发表于1810年)上加上了一点补充,指出如若误差可看成许多量的叠加,根据他的中心极限定理,误差理应有高斯分布。
正态分布及其应用刘关键四川大学华西临床医学院 循证医学与临床流行病学教研室正态分布(normal distribution) 又称高斯分布(Gaussian distribution) 是一种很重要的连续型分布,是统 计理论基础中最重要的分布之一, 应用甚广。
学习正态分布的数学特征,目的是 了解统计学中有关“分布”的概念。
正态分布的密度函数在统计上,某个分布的密度函数,即指 该分布的曲线方程。
正态分布的曲线方 程(密度函数)可由下式表达:f(X ) = 1 -(X -μ ) 2σ 2 e2σ2πf(X)μ- ∞ < X< ∞X正态分布曲线图正态分布的参数按此方程可绘出其图形。
式中μ为均数,σ为标准差;π为圆周率, 即3.14159;e为自然对数的底,即2.7183。
以上均为常量,仅X为变量。
当X确定后, 就可由此式求得其密度函数f(X),也就是相 应的纵坐标高度。
所以已知μ和σ ,就能按公式绘出正态曲线 的图形。
两个参数(parameter),即均数μ、标准差σ。
当标准差σ不变,均数μ越大,则曲线沿横轴 向右移动;反之,均数μ越小,则曲线沿横轴 向左移动,故均数μ是反映正态分布在横轴上 位置的参数。
当均数μ不变,标准差σ越大,表示数据越分 散,曲线越“胖”;标准差σ越小,表示数据越 集中,曲线越“瘦”,故标准差σ是反映正态分 布变异大小的参数。
可见有了μ和σ,就把正态分布确定下来了, 为了叙述方便,一般用N(μ,σ2)表示均数为 μ,方差为σ2的正态分布。
1正态分布曲线的特征正态分布是一簇单峰分布,当X =μ时,也 就是均数处,其曲线峰值,即函数f(X)的值 最大。
正态分布以均数μ为中心,左右对称。
因 为,式中(X – μ)的值无论正负,只要绝对 值相等,则函数的值(纵高)相等。
正态分布是以μ,σ2为参数的多个分布的总 称,即正态分布是多条曲线的总称。
正态分布的分布函数统计上,某个分布的分布函数,就是指该曲线 方程下的面积,它可由曲线方程的定积分所 得,故正态分布的分布函数可由下式表达:X F(X) = 1σ2π⌠ ⎮ ⎮ ⌡-(X-μ) 2 2 e 2σdX-∞正态分布曲线下的面积规律式中F(X)为正态变量X的累计分布 函数,反映正态曲线下,横轴尺度 自-∞到X的面积,即下侧累计面积 (概率)。
第四章 正 态 分 布如果将第二章中的(表2 — 1)中的数据绘制成直方图,把每个方条顶部中点联结起来,就得到一个图形,它称为频数多边形。
(图4 — 1)当分组数很多,组距很小时,频数多边形就趋于类似(图4 —2)所示的平滑的曲线。
这种曲线呈现出两侧近似对称的钟形。
随机变量的类似这种分布,在自然界是相当普遍的其中最有代表性的是正态分布。
下面就来介绍正态分布及其在体育中的几个应用。
12345678910x图4 — 1 频数多边形图第一节 正态分布曲线的形式如果随机变量X 的概率密度函数为y =πσ21e 222)(σμ--x (+∞<<∞-x ) (4 — 1)则称随机变量X 是服从正态分布的由上式绘出的图形叫做正态曲线。
(图4 — 2)X 的变动范围在 ∞- 至 +∞ 间。
YX0μ图4 — 2 正态分布曲线正态分布曲线中有两个参数:均值 μ 及方差 2σ。
为了应用方便,对式(4 — 1)中的随机变量经过一个称为标准化的变换,即令u 来代替原式中的 σμ-x , 寻这时的随机变量u 的概率密度函数成为:y = π21e 22u - (4 — 2) 按照(4 — 2)式绘出的图形,称作标准正态曲线。
(图4 — 3)Y00.40.30.20.1-1-2-3123μ图4 — 3 标准正态分布曲线第二节正态分布曲线的特征正态分布曲线有许多特点,它们对实际工作有很大的帮助。
它的主要特点有以下几个方面:一,正态分布的形式是对称的(但对称的分布不一定是正态分布)。
在正态分布中均值与中位数相重合。
二,从中央最高点逐渐向两侧降低,降低的速度是先慢后快,以后又再次减慢,最后接近横轴,但终究不能与横轴相交。
三,从中央向两侧逐渐下降,它的方向是先向内弯,达到离均值左右各一个标准差时又改向外弯,是以σμ1±的点为曲线从内弯转向外弯的转折点,即正态曲线中标准差与曲线有固定的关系。
四,因为正态曲线是对称的,在曲线下不仅平均数的两侧面积相等,各相当距离间的面积相等,而且各相当距离间的曲线高度也相等,正态曲线下(与横轴间)的总面积为1. 00。
正态分布normal distribution一种概率分布。
正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。
服从正态分布的随机变量的概率规律为取与μ邻近的值的概率大,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。
正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。
它的形状是中间高两边低,图像是一条位于x轴上方的钟形曲线。
当μ=0,σ2 =1时,称为标准正态分布,记为N(0,1)。
μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。
多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。
正态分布最早由A.棣莫弗在求二项分布的渐近公式中得到。
C.F.高斯在研究测量误差时从另一个角度导出了它。
P.S.拉普拉斯和高斯研究了它的性质。
生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。
例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。
一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。
从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。
正态分布应用最广泛的连续概率分布,其特征是“钟”形曲线。
from (一)正态分布1.正态分布若的密度函数(频率曲线)为正态函数(曲线)(3-1)则称服从正态分布,记号~。
第三章 正态分布一、教学大纲要求(一) 掌握内容1.正态分布的概念和特征 (1)正态分布的概念和两个参数; (2)正态曲线下面积分布规律。
2.标准正态分布标准正态分布的概念和标准化变换。
3.正态分布的应用 (1)估计频数分布; (2)制定参考值范围。
(二) 熟悉内容 标准正态分布表。
(三) 了解内容1.利用正态分布进行质量控制 2.正态分布是许多统计方法的基础二、教学内容精要(一)正态分布 1.正态分布若X 的密度函数(频率曲线)为正态函数(曲线)2.正态分布的特征服从正态分布的变量的频数分布由μ、σ完全决定。
(1)μ是正态分布的位置参数,描述正态分布的集中趋势位置。
正态分布以x μ=为对称轴,左右完全对称。
正态分布的均数、中位数、众数相同,均等于μ。
(2)σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。
σ也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。
(二)标准正态分布1.标准正态分布是一种特殊的正态分布,标准正态分布的0=μ,12=σ ,通常用u(或Z )表示服从标准正态分布的变量,记为u ~N (0,21)。
2.标准化变换:σμ-=X u ,此变换有特性:若X 服从正态分布),(2σμN ,则u 就服从标准正态分布,故该变换被称为标准化变换。
3. 标准正态分布表标准正态分布表中列出了标准正态曲线下从-∞到u 范围内的面积比例()u Φ。
(三)正态曲线下面积分布1.实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。
不同),(21X X 范围内正态曲线下的面积可用公式3-2计算。
)()(2112)22(2)(21u u dx eD X X X Φ-Φ==--⎰σμπσ (3-2)1212X X u u μμσσ--==其中, , 。
2.几个重要的面积比例X 轴与正态曲线之间的面积恒等于1。
正态分布的概念及表和查表方法本页仅作为文档封面,使用时可以删除This document is for reference only-rar21year.March正态分布概念及图表正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A·棣莫弗在求二项分布的渐近公式中得到。
.高斯在研究测量误差时从另一个角度导出了它。
P·S·拉普拉斯和高斯研究了它的性质。
是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。
若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。
其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
当μ = 0,σ = 1时的正态分布是标准正态分布。
目录1历史发展2定理3定义▪一维正态分布▪标准正态分布4性质5分布曲线▪图形特征▪参数含义6研究过程7曲线应用▪综述▪频数分布▪综合素质研究▪医学参考值历史发展正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。
但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。
这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。
在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。
这要到20世纪正态小样本理论充分发展起来以后。
拉普拉斯很快得知高斯的工作,并马上将其与他发现的中心极限定理联系起来,为此,他在即将发表的一篇文章(发表于1810年)上加上了一点补充,指出如若误差可看成许多量的叠加,根据他的中心极限定理,误差理应有高斯分布。
正态分布的应用1、用Z 的公式将原始分数转换成标准分数条件是原始分数的分布是正态的。
例如:已知某班期末考试中语文的平均分为76,标准差为10,数学的平均分为83,标准差为15。
某学生在这次期末考试的语文成绩为79,数学成绩为87,问该生这两科成绩哪一个更好一些?答:该考生的语文成绩更好一些。
2、确定录用分数线在选拔兴或竞赛性的考试中,录取或授奖的人数(或比赛)往往是事先确定的。
这就是用标准分数的作用发挥。
假定为正态分布,可将录取或授奖的人数比率作为正态分布中分线右侧,即上端的面积,由此找出相应标准分数Z 值,然后根据Z 公式计算出原始分数X.例如:在某年的高考中某省的平均分为420,标准差为100,分数呈正态分布,某考生得了456分。
设当年的该省的录取率为40%,问该生的成绩是否上线?解:根据Z 分数的计算公式,得当P=0.40时,0.5-0.40=0.10然后查附表,找到对应的Z=0.25 因为0.36>0.25,所以该考生上线了。
又如:某年某市参加数学竞赛的学生有850人,考试的平均分为68,标准差为9。
而这次计划只给最优秀的5%颁奖,问授奖分数线为多少?某个考生在这次考试中得了76分,问这位考生是否获奖?解:根据0.05的P 值计算差表,得Z=1.65 因为82.85>76, 所以该考生不可能获奖。
例.某区拟对参加数学竞赛的2000人中的前500人予以奖励,考试的平均分数为75分,标准差为9分,问授奖的分数线是多少?(授奖分数线为81.03分。
)例:某考试2500人参加,成绩服从正态分布,μ=80 σ2=25,求分数在88分以上的人数。
解:n =N·P =2500×0.0548=137(人)例:某招生考试,选拔20%,考生成绩服从正态分布,μ=70 σ=10,录取标准应划在哪里? 解Z =0.84 X =10×0.84+70=78.4 分数线为78.4例:某地13岁女孩118人的身高(cm)资料,估计该地13岁正常女孩身高在135厘米以下及155厘米以上者各占正常女孩总人数的百分比。
身高(X )~N (μ,σ2),但μ和σ未知,只知来自该总体的样本的身高均数x =144.29(cm)和标准差s =5.41(cm),由于样本含量n=118很大,所以可以用x 和s 估计μ和σ来计算u 值。
身高(X )小于135(cm)的概率为:()()11135u U P x X P <==<88801.65Z -==00()0.20(0)0.3p Z Z p Z Z >=⇒<<=72.141.529.14413511-=-=-=s x x u ()()()()04272.072.172.1135111=-Φ=-=<=<==<u U P u U P x X P身高(X )大于155(cm)的概率为:()()22155u U P x X P >==>98.141.529.14415522=-=-=s x x u ()()()()02385.097615.0198.1198.1155222=-=Φ-==>=>==>u U P u U P x X P 该地13岁正常女孩身高在135厘米以下者占正常女孩总人数的4.272%,身高在155厘米以上者占正常女孩总人数的2.385%。
3、确定等级评定的人数因为人的许多属性为正态分布,因此在教育生活中,许多情况下,用正态分布来计算各等级的人数。
例如:假定某年级有250人,我们要对这些人某种能力作一等级评定,假定这种能力为正态分布,且准备划分为五个等级:甲乙丙丁戊,问各个等级各有多少人?解:首先要把正态分布基线平均分一下。
因为这里要分为5个等级,因此各等级所包含区间为6除以5,等于1.2个标准差。
然后确定每一等级的取值范围。
通常我们从最高开始,最高等级为甲,应该从Z=3开始往下,则3减去1.2等于1.8,甲等就分布在这个区间1.8~3;往下顺延,得乙所在区间为0.6~1.8;丙再往下顺延1.2个标准差,得到丙的所在区间为-0.6~0.6;根据对称性,得丁的区间为-1.8~-0.6,戊的区间为-3~-1.8。
再次,要查正态表。
计算各个区间的面积,即人数比率。
要查两个定点之间的面积为多少。
(1)查Z=0到Z=1.8的面积,为0.46407,用0.5减去0.46407得到0.03593,即为甲的区间面积。
(2)查Z=0到Z=0.6的面积,为0.22575,这时用0.46407减去0.22575得0.22832,即为乙的区间面积。
(3)0.22575乘以2得0.45150,即为丙的区间面积。
(4)根据对称性得到丁的区间面积为0.22832,戊的区间面积为0.03593。
最后,将各个等级的比率乘以总人数,即得到各个等级的人数。
计算得甲等为9人,乙等为60人,丙等为112人,丁等为60人,戊等为9人。
答:甲乙丙丁戊五个等级依次有9、60、112、60、9人。
4、品质评定数量化一般在教育中可以综合各个老师对某一个学生的评定。
5、独立样本平均数差异的显著性检验 综合应用例1:某省在高考后,为了分析男、女考生对语文学习上的差异,随机抽取了各20名男、女考生的语文成绩,并且计算得到男生平均成绩=54.6,标准差=16.9,女生的平均成绩=59.7,标准差=10.4,试分析男、女考生语文高考成绩是否有显著差异?解:先进行方差齐性检验:1.提出假设2.计算检验的统计量3.统计决断查附表3,得F(19,19)0.05=2.16 F=2.64>F(19,19)0.05=2.16,p<0.05,即方差不齐性。
然后,进行平均数差异的显著性检验:1.提出假设2.计算检验的统计量3.确定检验形式 双侧检验4.统计决断 1.12<2.093,P>0.05所以,要保留零假设,即男、女考生语文高考成绩无显著差异。
例2:为了对某门课的教学方法进行改革,某大学对各方面情况相似的两个班进行教改实验,甲班32人,采用教师面授的教学方法,乙班25人,采用教师讲授要点,学生讨论的方法。
一学期后,用统一试卷对两个班学生进行测验,得到以下结果:甲班平均成绩=80.3,标准差=11.9,乙班平均成绩=86.7,标准差=10.2,试问两种教学方法的效果是否有显著性差异?解:先进行方差齐性检验:1.提出假设2.计算检验的统计量3.统计决断查附表3,得F(31,24)0.05=1.94 F=1.35<F(31,24)0.05=1.94,p>0.05,即方差齐性。
然后,进行平均数差异的显著性检验:1.提出假设2.计算检验的统计量3.确定检验形式 双侧检验 4.统计决断 当df=55时,t=2.105>2.009,P<0.05所以,要在0.05的显著性水平上零假设,即两种教学方法的效果有显著性差异。
例3为了研究一种新语文教学方法是否能提高学生语文学习成绩,采用了实验方法进行研究,选择了学习情况基本相同的两个班分别作为实验班与对照班,实验结果如下: 班别 人数 平均分 标准差 教学方法 实验班 42 80 10 新教学方法 对照班 44 75 11 传统教学方法试分析新语文教学方法是否比传统教学方法在提高学生学习成绩更有效?(双总体Z 体验) 原假设H0:μ1≤μ2,备择假设:μ1>μ2. n1=42,x1ˉ=80,ο1=10, n2=44,x2ˉ=75,ο2=11, 取显著性水平为0.05,得拒绝域为z≥z0.05=1.645, Z=(80-75)/√(10^2/42+11^2/44)=2.207>1.645, 拒绝原假设H0,即可以认为新方法显著有效。
例9.某市全体7岁男童体重平均数为21.61kg ,标准差为2.21kg ,某小学70个7岁男童体重的平均数为22.9kg 。
问该校7岁男童体重与全市是否一样?( |Z|=4.88**>2.58=Z0.01P <0.01,在0.01显著性水平上拒绝H0,接受H1,即该校7岁男童体重与全市有极其显著的差异。
一.总体平均数的显著性检验例1:某小学历届毕业生汉语拼音测验平均分数为66分,标准差为11.7。
现以同样的试题测验应届毕业生(假定应届与历届毕业生条件基本相同),并从中随机抽18份试卷,算得平均分为69分,问该校应届与历届毕业生汉语拼音测验成绩是否一样?♦ ⑴. 提出假设H0:μ=μ0, H1:μ≠μ0 或 H0:μ=66, H1:μ≠66♦ ⑵.选择检验统计量并计算统计量的值♦ 学生汉语拼音成绩可以假定是从正态总体中抽出的随机样本。
总体标准差已知,样本统计量的抽样分布服从正态,以Z 为检验统计量计算♦ ⑶.确定显著性水平和检验形式 显著性水平为α=0.05,双侧检验♦ ⑷.做出统计结论♦ 查表得Z α=1.96,而计算得到的Z=1.09 ♦ |Z|<Zα,则概率P >0.05♦ 差异不显著,应在0.05显著性水平接受零假设♦ 结论:该校应届毕业生与历届毕业生汉语拼音测验成绩一致,没有显著差异。
n X Z σμ0-=187.116669-=09.1=例.某次数学竞赛,甲校6名男同学的成绩为69,73,84,91,86和76;13个女同学的得分为90,62,58,74,69,85,87,92,60,76,81,84,77。
问男女同学数学竞赛成绩是否有显著性差异? (查表知:F(12,5)0.05=4.68>1.297=F ∴保留H0,拒绝H1,方差齐性.)例.某区某年高考化学平均分数为72.4,标准差为12.6,该区某校28名学生此次考试的平均分数为74.7。
问该校此次考试成绩是否高于全区平均水平?(Z|=0.97<1.65=Z0.05,P >0.05,保留H0,拒绝H1,即该校成绩并不高于全区平均水平。
例2:某市高中入学考试数学平均分数为68分,标准差为8.6。
其中某所中学参加此次考试的46名学生的平均分数为63。
过去的资料表明,该校数学成绩低于全市平均水平,问此次考试该校数学平均分数是否仍显著低于全市的平均分数?Z=-3.94例3:某区初三英语统一测验平均分数为65,该区某校20份试卷的平均分数为69.8,标准差为9.234。
问该校初三年级英语平均分数与全区是否一样? t =2.266例4:某校上一届初一学生自学能力平均分数为38,这一届初一24个学生自学能力平均分数为42,标准差为 5.7,假定这一届初一学生的学习条件与上一届相同,试问这一届初一学生的自学能力是否高于上一届?t =3.365例5:某年高考某市数学平均分数为60,现从参加此次考试的文科学生中,随机抽取94份试卷,算得平均分数为58,标准差为9.2,问文科学生的数学成绩与全市考生是否相同?Z=-2.11例5.6 单侧检验(右)某一小麦品种的平均产量为5200㎏/公顷。