正态分布(1)
- 格式:ppt
- 大小:433.50 KB
- 文档页数:14
标准的正态分布正态分布,又称高斯分布,是概率论和统计学中最重要的连续型概率分布之一。
它具有许多重要的性质,因此在自然和社会科学中经常出现。
正态分布的形状呈钟形曲线,两侧尾部逐渐减小,呈对称分布。
在正态分布中,均值、中位数和众数是相等的,且位于分布的中心。
正态分布的密度函数可以用以下公式表示:f(x) = (1/(σ√(2π))) exp(-((x-μ)²/(2σ²)))。
其中,μ是分布的均值,σ是标准差,π是圆周率,exp是自然对数的底数。
正态分布具有许多重要的特性,其中之一是68-95-99.7法则。
这一法则指出,大约68%的数据落在均值加减一个标准差的范围内,约95%的数据落在均值加减两个标准差的范围内,约99.7%的数据落在均值加减三个标准差的范围内。
这一特性使得正态分布在统计推断中有着重要的应用,可以帮助我们对数据的分布进行初步的判断。
正态分布在自然界和社会科学中有着广泛的应用。
例如,人的身高、智力分数、体重等都呈现出正态分布的特征。
在工程和经济学中,许多随机变量的分布也可以近似地用正态分布来描述。
因此,对正态分布的理解和运用对于我们理解和分析各种数据具有重要意义。
在实际应用中,我们经常会遇到需要对数据进行正态性检验的情况。
正态性检验是指通过统计方法来判断数据是否符合正态分布。
常见的正态性检验方法包括直方图分析、QQ图检验、Shapiro-Wilk检验等。
通过对数据进行正态性检验,我们可以更好地选择适当的统计方法,从而得到更加准确的分析结果。
除了在统计学和概率论中的应用外,正态分布还在金融工程、风险管理、医学诊断等领域发挥着重要作用。
例如,在金融领域,股票价格的日收益率往往呈现出正态分布的特征,这对于风险管理和投资决策具有重要意义。
总之,正态分布作为概率论和统计学中最重要的分布之一,具有广泛的应用价值。
通过对正态分布的深入理解和运用,我们可以更好地分析和解释各种数据现象,为科学研究和实际应用提供有力支持。
正态分布判定标准(一)正态分布判定标准引言正态分布是统计学中最重要的分布之一,广泛应用在各个领域的数据分析和建模中。
判断一个数据集是否服从正态分布是数据分析的基础,本文将介绍常用的正态分布判定标准。
直方图观察法使用直方图是最常见的判断一个数据集是否服从正态分布的方法之一。
1.绘制直方图:将数据按照一定的组距分组,并绘制柱状图。
横轴表示数据的取值范围,纵轴表示该范围内数据的频数或频率。
2.观察直方图形状:正态分布的直方图呈钟形曲线状,均值处的频数最高,两侧对称逐渐变小。
如果数据的直方图近似呈现钟形曲线状,则可以初步认定数据集服从正态分布。
正态概率图观察法正态概率图是一种常用的判定数据服从正态分布的方法。
1.绘制正态概率图:将数据按照从小到大排序,并绘制点图。
横轴表示数据的排序位置,纵轴表示数据的值。
2.观察图形形状:如果数据集服从正态分布,图形应该近似为一条直线。
如果图形出现明显的非线性趋势或者拐点,则说明数据不服从正态分布。
正态概率图更加直观地展现了数据是否服从正态分布。
Shapiro-Wilk检验法Shapiro-Wilk检验是一种常用的正态性检验方法,适用于样本量较小的情况。
1.提出假设:首先提出原假设和备择假设。
原假设(H0)是“样本数据符合正态分布”,备择假设(H1)是“样本数据不符合正态分布”。
2.计算检验统计量:根据样本数据计算出Shapiro-Wilk检验的统计量W。
3.判断拒绝域:根据设定的显著性水平,查表得到临界值。
如果W小于临界值,则拒绝原假设,说明数据不服从正态分布;反之,则无法拒绝原假设,说明数据服从正态分布。
Shapiro-Wilk检验是一种较为准确的正态性检验方法,但对于样本量较大的数据集效果并不理想。
正态性指标判定法除了上述方法外,还可以通过一些统计指标来判定数据的正态性。
1.偏度(Skewness):衡量数据分布的偏斜程度。
当偏度接近0时,数据分布较为对称,符合正态分布;当偏度大于0时,数据分布向右偏斜,当偏度小于0时,数据分布向左偏斜。
教案把这批产品的内径尺寸看作一个总体,那么这100件产品的实际尺寸就是一个容量为100的样本,由此可得到这组样本数据的频率分布直方图.当样本容量n越来越大,分组越来越细时,上图会有怎样的变化?当样本容量n越来越大,分组越来越细时,频率直方图上面的折线越接近于下图的曲线。
从随机变量的角度来看,如果把产品的尺寸看作随机变量X,则这条曲线通常称为X的概率密度曲线.这条曲线位于横轴的上方,它与横轴一起所围成的面积是1.而随机变量X落在指定的两个数a,b之间的概率,即由正态曲线,过点(a,0)和点(b,0)的两条x轴的垂线,及x轴所围成的平面图形的面积,就是X落在区间(a,b]的概率的近似值,如图.本题中,产品尺寸落在区间(a,b )内的概率,就是图中带斜线部分的面积.由于a,b 是在产品尺寸范围内任意取值的,所以这套概率曲线就能精确地反映X 取值的规律。
概率密度曲线反映变化规律所起的作用与离散型随机变量分布列的作用是相同的。
在生产、科研和日常生活中,经常会遇到这样一类随机现象,它们是由一些互相独立的偶然因素所引起的,而每一个这种偶然因素在总体的变化中都只是起着均匀、微小的作用。
例如:钢铁加工厂生产钢管时,加工零件的机器的磨损程度、使用的材料的差异、工人操作的习惯、周围的环境的温度等因素都可能会对钢管内径的尺寸起微小的影响,导致产品内径尺寸的波动。
(二)给出概念,研究性质与特点表示这类随机现象的随机变量的概率分布一般近似服从正态分布,服从正态分布的随机变量叫做正态随机变量,简称正态变量。
正态分布概率密度曲线的函数表达式为()22()21e ,(,).2πx f x x μσσ--=∈-∞+∞⋅ 其中,μ,σ是参数,且σ>0,−∞<μ<+∞. 正态分布概率密度曲线的函数表达式中参数μ,σ分别是正态变量的数学期望和标准差。
期望为μ 、标准差为σ的正态分布通常记作N (μ,σ2).正态变量的概率密度函数的图象叫做正态曲线.μ的意义:总体平均数反映总体随机变量的平均水平;σ的意义:总体随机变量的集中与分散的程度.(1)μ=−1,σ=0.5(2)μ=1,σ=2(3)μ=0,σ=1观察正态曲线,你能得到哪些特点?正态曲线的特点:(1)曲线在x轴的上方,与x轴不相交.(2)曲线是单峰的,它关于直线x=μ对称.(3)曲线在x = μ处达到峰值(最高点) (4)当 x < μ时,曲线上升;当x >μ时,曲线下降.并且当曲线向左、右两边无限延伸时,以x 轴为渐近线,向它无限靠近.(5)当μ一定时,曲线的形状由σ确定 . σ越大,曲线越“矮胖”,表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.对参数σ, μ的理解(1)正态分布由参数σ,μ唯一确定,因此正态分布常记作N (μ,σ2) .(2)参数μ是反映随机变量取值的平均水平的特征数,可以用样本的均值去估计;σ是衡量随机变量总体波动大小的特征数,可以用样本标准差去估计.正态曲线下的面积规律(1)X 轴与正态曲线所夹面积恒等于1; (2)对称区域面积相等。
教案并介绍高尔顿板模型,引入本节课,提出问题,并进行实验操作.活动1:高尔顿板试验猜想:让一个小球从高尔顿板上方的通道口落下,小球在下落的过程中与层层障碍物碰撞,最后掉入高尔顿板下方的哪一个球槽内?观察:演示多次,观察各次得到的小球的分布规律的共性.学生能够观察到小球从高尔顿板上方下落的过程中,小球经过每一层都要和其中的一个障碍物发生碰撞,碰撞有两种可能,从左落下或从右落下,最后落入底部的球槽,小球落入哪个球槽是随机的;随着试验次数的增加,掉入各个球槽内的小球的个数就会越来越多,球槽中小球堆积的高度也会越来越高;随着试验次数增加,小球堆积的形状具有中间高两边低的特点,呈现左右对称的特点.体会小球掉入高尔顿板下方的球槽内的随机性.感受对几次试验结果的观察角度.采用高尔顿板试验的方法引入,一方面可以激发学生学习探究的兴趣,另一方面使学生对正态曲线的来源有一个直观的印象.新课二、建立概念——钟形曲线——正态曲线——正态分布(一)钟形曲线感性认识要上升到理性认识,如何用数学的观点研究小球分布情况?我们从左到右给球槽编号,小球落入哪个球槽是不是有一定规律可遵循.问题1 如何用我们所学的知识研究落在各个球槽内的小球的分布情况?方案1 用X表示球槽编号,则X是一个随机变量,每投放一个小球就可以看做1个试验,重复投放n引导学生用数学的眼光看问题,利用所学知识分析问题,进而解决问题.个小球,相当于做了n次独立重复试验,某一槽中球的个数就是小球落在这个槽中的频数,可以在大量重复的试验下,用频率估计概率,列出球槽编号X 的分布列;方案2 以球槽的编号为横坐标,可以画出小球分布的频率分布直方图.哪种方案更好?对于离散型随机变量而言,其分布列完全刻画了它的概率分布规律,但此时只能通过频率来近似,现在无法知道所构造的随机变量的分布列.而频率分布直方图更加准确、直观、形象,所以经过学生讨论用频率分布直方图进一步探究小球的分布规律.活动2 画频率分布直方图由于课堂时间所限,这里展示在课前进行的试验,并记录落入各个球槽内小球的频数,利用图形计算器画频率分布画直方图.问题2 观察频率分布直方图有何共同特点?预设学生活动:学生可发现频率分布直方图具有中间高两边低(左右两边对称)的特点,并且频率分布直方图的外形与试验中小球的堆积形状是一样的. 借助频率分布直方图更加准确直观形象的研究小球的分布规律,为正态曲线的得出做铺垫.引导学生归纳频率分布直方图的共同特点,有利于学生观察发现、归纳概括能力的初步锻炼,从事物的具体背景中抽象出一般规律和结构,并用数学语言予以表征,发展学生的数学抽象素养.进一步加深正态曲线的印活动3 画频率分布折线图问题3 是不是只有小球的分布具有中间高两边低的特点?预设学生活动:教师展示在必修3统计的学习中,收集过的身高、体重、成绩等数据,借助图形计算器,可以画出这些数据的频率分布直方图,发现这些数据都具有中间高两边低的特点.既然这么多数据都具有中间高两边低的特点,我们有必要进一步研究它们的分布规律,教师引导学生画数据的频率分布折线图,并思考下面问题.问题4 画出身高、体重、成绩等数据的频率分布折线图,随着试验次数增加,组距不断缩小,观察频率分布折线图有何特点?预设学生活动:随着试验次数增加,组距不断缩小,频率分布折线图的形状也越来越光滑.活动4 教师用计算机演示教师借助几何画板演示,引导学生思考当试验次数增加,组距不断缩小时,频率分布折线图有什么变化特点?预设学生活动:频率分布折线图越来越光滑,越来越像一条曲线.问题5 生活中我们是否见过类似形状的东西?预设学生活动:象我们生活中的钟、铃铛等类似形状的东西,我们称之为钟形曲线.(二)正态曲线对于这条钟形曲线,早在十八世纪30年代,棣莫象.为引入新知搭桥铺路,为了让学生由特殊到一般归纳正态曲线的概念做铺垫,同时也说明了正态分布在概率统计理论和实际应用中都占有重要的地位.这个步骤实现了由离散型随机变量到连续型随机变量的过渡,突破学生由离散到连续认知上的障碍.通过几何画板让学生直观形象地感受正态曲线的形成过程.弗、斯特莱等数学家经过十几年的努力,用求导、对数、无穷级数、积分、变量代换等数学方法就推导出这条钟形曲线就是函数22()2,1()e 2πx x μσμσϕσ--=的图象,其中μ和σ(0>σ)为参数,我们称)(,x σμϕ的图象为正态分布密度曲线,简称正态曲线. 在对正态曲线认识的基础上进入理性分析,得到正态分布的概念.(三)正态分布知道了小球的分布规律是正态曲线,为了引导学生由正态曲线认识正态分布,设计了下面的问题.问题6 一个小球从高尔顿板口落下,会落在哪?为什么?预设学生活动:一个小球从高尔顿板口落下,落在哪都有可能,但是,落在中间的可能性大,概率大. 问题7 如何计算小球落在某个区间],(b a 内的概率?当试验用的小球很小时候如何刻画小球的具体位置?可以用坐标.如何建立适当的坐标系?以及如何计算小球落在某个区间],(b a 的概率?如果去掉高尔顿板最下边的球槽,沿高尔顿板底部建立一个水平坐标轴,刻度单位为球槽的宽度,若用X 表示落下的小球第1次与高尔顿板底部接触时的坐标. X 是一个随机变量,这样计算小球落在某个区间],(b a 的概率,就是求()<≤P a X b .而频率分布直引导学生,逐步经历概念的形成过程,初步体会正态曲线的特点.对高中学生来说,正态分布密度函数的推导是十分困难的,因此,从数学史的角度介绍正态分布密度曲线的解析式,既使学生易与接受又渗透了数学的文化价值.正态曲线的意义是本节课的重点也是本节课的难点,通过设疑,引起学生对问题的曲边梯形面积这样曲边梯形的面积就是小球落在某个区间的概率的近似值,即(P a<X≤)b≈⎰b aϕ此公式是不是只对特殊的a和b成立呢?其实是和b(a<b),随机变量,()x dxμσϕ.表示落下的小球第1次与高尔顿板底部接触时是一个随机变量,请同学们通过下面的问是什么样的量?它受到哪些因素的影响判断下面说法是否正确,说明理由是一个障碍物作用的结果;)如果小球与第1个障碍物相撞后向左落下,那么个障碍物相撞后也向左落下;主要受最后一次与小球碰撞的障碍物的影响预设学生活动:X是一个随机变量,受到了很多个障碍物的作用;每个障碍物是互不影响、互不相干;小球落在什么位置是很多次碰撞的结果,这些碰撞不是一个随机变量,受到了众多的、互不相干的、不分主次的偶然因素的影响由学生给出描述小球分布规律的正态分布的定义,教师给与补充,并进一步完善正态分布的概念特别有()0.6826,(22)0.9544,(33)0.9974.P X P X P X μσμσμσμσμσμσ-<≤+≈-<≤+≈-<≤+≈可以看到,正态总体几乎总取值于区间(3,3)μσμσ-+之内,而在此区间以外取值的概率只有0.0026,通常认为这种情况在一次试验中几乎不可能发生.在实际应用中,通常认为服从于正态分布2(,)N μσ的随机变量X 只取(3,3)μσμσ-+之间的值,并简称之为3σ原则.例 某地区数学考试的成绩X 服从正态分布,其密度曲线如图所示,成绩X 位于区间(]52,68的概率是多少? 解:第一步,利用待定系数法,求出正态分布密度曲线函数的解析式;可知,参数60μ=,max 1(60)82ϕϕπ==,故22(60)2,1()2πx x e σμσϕσ--=,且max 11(60)822πϕϕπσ===, 所以8σ=.得2(60)128,1()82πx x e μσϕ--=; 第二步,求概率;故(5268)(608608)0.6826P x P x <≤=-<≤+≈. 例 若(5,1)X N :,求(67)P X <<.解:由(5,1)X N :知,正态密度曲线函数的两个参数为5,1μσ==,故该正态密度曲线关于直线5x =对称.故1(57)(37)2P X P X <<=<< 11(5252)0.95440.477222P X =-<<+≈⨯=, 而1(56)(46)2P X P X <<=<< 1(5151)2P X =-<<+10.68260.34132≈⨯=, 得(67)(57)(56)0.1359P X P X P X <<=<<-<<≈.例 商场经营的某种包装的大米质量服从正态分56 7O y4 3(1)课本P75 A 组1;(2)画出课上使用过的身高、体重、成绩等数据的正态曲线,并估计参数μ的值;(3)请同学们查阅相关的资料,了解正态分布的发展史,以小组为单位对某个科学家的观点或在正态分布方面的贡献写一个简介.例 设若(,1)X N μ:,求(32)P X μμ-<≤-.解:由(,1)X N μ:知,正态分布密度函数的参数1σ=.因为该正态密度曲线关于直线x μ=对称,所以(32)(3)(2)P X P X P X μμμμμμ-<≤-=-<≤--<≤高斯高棣莫弗凯特11(33)(22)22P X P X μμμμ=-<≤+--<≤+ 110.99740.95440.021522≈⨯-⨯=.。