正态分布图的制作方法
- 格式:doc
- 大小:1.43 MB
- 文档页数:11
1.5正态分布在上一小节中,我们作出了100个产品尺寸的频率分布直方图,并指出了当样本容量无限增大时,这个频率分布直方图无限接近于如图1-3所示的一条总体密度曲线.产品尺寸是一类典型的总体,对于成批生产的产品,如果生产条件正常并稳定,即工艺、设备、技术、操作、原料、环境等条件都相对稳定,而且不存在产生系统误差的明显因素,那么,产品尺寸的总体密度曲线就是或近似地是以下函数的图象:f (x)=22()2x μσ--,x ∈(-∞, +∞) ① 式中的实数μ、σ(σ>0)是参数,分别表示总体的平均数与标准差,这个总体是有无限容量的抽象总体,其分布叫做正态分布.正态分布由参数μ,σ唯一确定.因此,正态分布常记作N (μ,σ2).①的图象被称为正态曲线.图1-4中画出了三条正态曲线:(1)μ=-1,σ=0.5;(2)μ=0,σ =1;(3)μ=1,σ =2.正态曲线具有两头低、中间高、左右对称的基本特征. 在实际中遇到的许多随机现象都服从或近似服从正态分布.例如:生产中,在正常生产条件下各种产品的质量指标(如电子管的使用寿命、电容器的电容量、零件的尺寸、铁水的含碳量、纤维的纤度、……)一般都服从正态分布.在测量中,测量结果一般可以表示为ξ=a +η. 其中a 表示被测量的量的真值(未知常数),η表示测量的随机误差,ξ和η一般都服从正态分布.在生物学中,同一群体的某种特征(如某一地区同年龄组儿童的发育特征,如身高、体重、肺活量),在一定条件下生长的小麦的株高、穗长、单位面积产量等,一般也服从正态分布.在气象中,某地每年七月份的平均气温、平均湿度以及降雨量等,水文中的水位,也都服从或近似服从正态分布.总之,正态分布广泛存在于自然现象、生产及科学技术的许多领域之中.正态分布在概率和统计中占有重要地位.在函数①中,当μ=0,σ =1时,正态总体称为标准正态总体,这时相应的函数表示式是 f (x)=22x-,x ∈(-∞, +∞) ② 相应的曲线称为标准正态曲线,如图1-4(2)所示.从图1-4看到,正态曲线具有以下性质:(1)曲线在x 轴的上方,与x 轴不相交;(2)曲线关于直线x=μ对称;(3)曲线在x=μ时位于最高点.(4)当x<μ时,曲线上升;当x>μ时,曲线下降.并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近.(5)当μ一定时,曲线的形状由σ确定.σ越大,曲线越“矮胖”,表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中(图1-5).由于标准正态总体N(0,1)在正态总体的研究中有非常重要的地位,已专门制作了“标准正态分布表”(见附表2).在这个表中,相应于x0的值中Ф(x0)是指总体取值小于x0的概率,即Ф(x0)=P (x<x0).如图1-6(1)中左边阴影部分所示.由于标准正态曲线关于y轴对称,表中仅给出了对应于非负值x0的值Ф(x0).如果x0<0,那么由图1-6(2)中两个阴影部分面积相等知Ф(x0)=1-Ф(-x0)利用这个表,可求出标准正态总体在任一区间(x1,x2)内取值的概率.例如它在(-1,2)内取值的概率是P=Ф(2)-Ф(-1)= Ф(2)-{1-Ф[-(-1)]}=Ф(2)+ Ф(1)-1=0.9772+0.8413-1=0.818 5.一般的正态总体N(μ,σ 2)均可以化成标准正态总体N(0,1)来进行研究.事实上,可以证明,对任一正态总体N(μ,σ 2)来说,取值小于x的概率F(x)= Ф(xμσ-).例如,对于正态总体N(1,4)来说,取值小于3的概率F(3)= Ф(312-)=Ф(1)=0.8413.例1.分别求正态总体N(μ,σ 2)在区间(μ-σ, μ+σ),(μ-2σ, μ+2σ),(μ-3σ, μ+3σ)内取值的概率.解:F(μ+σ)=Ф(()μσμσ+-)=Ф(1), F(μ-σ)=Ф(()μσμσ--)=Ф(-1),所以正态总体N(μ, σ2)在(μ-σ,μ +σ)内取值的概率是F(μ+σ)-F(μ-σ)=Ф(1)-Ф(-1)= Ф(1)-[1-Ф(1)]=2Ф(1)-1=2×0. 8413-1≈0.683;同理,正态总体N(μ,σ 2)在的(μ-2σ,μ +2σ)内取值的概率是F(μ+2σ)-F(μ-2σ)=Ф(2)-Ф(-2)≈0.954;正态总体N(μ,σ 2)在的(μ-3σ,μ +3σ)内取值的概率是F(μ+3σ)-F(μ-3σ)=Ф(3)-Ф(-3)≈0.997;下面以正态总体为例,说明统计中常用的假设检验方法的基本思想.我们从上表看到,正态总体在(μ-2σ, μ+2σ)以外取值的概率只有4.6%,在(μ-3σ, μ+3σ)以外取值的概率只有0.3%,由于这些概率值很小,通常称这些情况发生为小概率事件.也就是说,通常认为这些情况在一次试验中几乎是不可能发生的.我们来看一个例子.假设工人制造的零件尺寸在正常情况下服从某种分布.为便于说明,不妨假设它服从正态分布N(μ,σ 2),那么从上面知道,零件尺寸在(μ-3σ, μ+3σ)内取值的概率为99.7%,即零件尺寸落在(μ-3σ, μ+3σ)以外的概率只有0.3%.这是一个小概率事件.它表明在大量重复试验中,平均每抽取1000个零件,属于这个范围以外的零件尺寸只有3个.因此在一次试验中,零件尺寸在(μ-3σ, μ+3σ)以外是几乎不可能发生的,而如果这种事件一旦发生,即产品尺寸a满足|a-μ|≥3σ。
<简单易学> <图文并茂>Excel VBA 制作正态分布曲线简介正态分布与Excel测量数据的正态分布,对相关工作有很重要的判定意义;特别是直观的分布曲线,让人对数据质量一目了然。
/view/45379.htm?wtp=tt参看不少文档,没有见到Excel有直接绘制正态分布曲线的函数,故考虑使用VBA编程的方法,实现从测量数据自动生成正态分布曲线的功能。
约定和程序假设有Excel数据表,把测试数据放在第一张表的第一列中:在VBA编辑器中新建一个模块,名字默认,输入如下代码(代码已经包含注释,请自行参看):'*****************************************************Public Sub myDistrib()Dim Aver As Double '平均数Dim Std As Double '标准差Dim Max As Double '最大值Dim Min As Double '最小值Dim Limit As Double '极限值Aver = Application.WorksheetFunction.Average(Selection)Std = Application.WorksheetFunction.StDev(Selection)Max = Application.WorksheetFunction.Max(Selection)Min = Application.WorksheetFunction.Min(Selection)'取极值的三倍作为今后绘图的上下限Limit = Application.WorksheetFunction.Max(Max - Aver, Aver - Min) * 2'在上下限间创建100个单点值step = Limit * 2 / 100Selection.Copy'创建一个新的表生成需要的数据'这是绘制分布曲线需要的数据Worksheets.Add , Worksheets(Worksheets.Count), 1Worksheets(Worksheets.Count).Name = "【正态分布】" & Trim(Str(Sheets.Count)) Range("A1").SelectActiveSheet.Paste[C1] = "平均值"[D1] = Round(Aver, 2)[C2] = "标准差"[D2] = Round(Std, 2)[C3] = "绘图上限(X2)"[D3] = Round(Aver + Limit, 2)[C4] = "绘图下限(X2)"[D4] = Round(Aver - Limit, 2)For I = 1 To 100Cells(I, 6).Value = (I - 1) * step + (Aver - Limit)Cells(I, 7).Value = Application.WorksheetFunction.NormDist(Cells(I, 6).Value, Aver, Std, 0)Next I'这是绘制上下标识和平均值需要的数据[C6] = "最大值"[D6] = Max[E6] = Max[D7] = 0[E7] = [G51][C9] = "最小值"[D9] = Min[E9] = Min[C10] = "绘图上标值"[D10] = 0[E10] = [G51][C12] = "平均值"[D12] = Aver[E12] = Aver[C13] = "绘图上标值"[D13] = 0[E13] = [G51]Columns.AutoFit'绘制图形ActiveSheet.Shapes.AddChart.SelectActiveChart.ChartType = xlXYScatterSmoothNoMarkersActiveChart.SeriesCollection.NewSeriesActiveChart.SeriesCollection(1).XValues = "='【正态分布】4'!$F$1:$F$100" ActiveChart.SeriesCollection(1).Values = "='【正态分布】4'!$G$1:$G$100" ActiveChart.SeriesCollection(1).Name = "=""分布曲线"""ActiveChart.SeriesCollection(2).DeleteActiveChart.SeriesCollection.NewSeriesActiveChart.SeriesCollection(2).XValues = "='【正态分布】4'!$D$6:$E$6" ActiveChart.SeriesCollection(2).Values = "='【正态分布】4'!$D$7:$E$7"ActiveChart.SeriesCollection(2).Name = "=""最大值"""ActiveChart.SeriesCollection.NewSeriesActiveChart.SeriesCollection(3).XValues = "='【正态分布】4'!$D$9:$E$9"ActiveChart.SeriesCollection(3).Values = "='【正态分布】4'!$D$10:$E$10"ActiveChart.SeriesCollection(3).Name = "=""最小值"""ActiveChart.SeriesCollection.NewSeriesActiveChart.SeriesCollection(4).XValues = "='【正态分布】4'!$D$12:$E$12"ActiveChart.SeriesCollection(4).Values = "='【正态分布】4'!$D$13:$E$13"ActiveChart.SeriesCollection(4).Name = "=""平均值"""'调整图形的位置ActiveSheet.Shapes(1).IncrementLeft 185ActiveSheet.Shapes(1).IncrementTop -93.75End Sub'*****************************************************使用方法为:选择Sheet1上,第一列的原始数据;按Alt+F8。
2.4正态分布复习引入:总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线. 总体密度曲线b 单位O 频率/组距a它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a ,b )内取值的概率等于总体密度曲线,直线x =a ,x =b 及x 轴所围图形的面积.观察总体密度曲线的形状,它具有“两头低,中间高,左右对称”的特征,具有这种特征的总体密度曲线一般可用下面函数的图象来表示或近似表示:22()2,1(),(,)2x x e x μσμσϕπσ--=∈-∞+∞ 式中的实数μ、)0(>σσ是参数,分别表示总体的平均数与标准差,,()x μσϕ的图象为正态分布密度曲线,简称正态曲线.讲解新课:一般地,如果对于任何实数a b <,随机变量X 满足,()()b aP a X B x dx μσϕ<≤=⎰, 则称 X 的分布为正态分布(normal distribution ) .正态分布完全由参数μ和σ确定,因此正态分布常记作),(2σμN .如果随机变量 X 服从正态分布,则记为X ~),(2σμN .经验表明,一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用结果之和,它就服从或近似服从正态分布.例如,高尔顿板试验中,小球在下落过程中要与众多小木块发生碰撞,每次碰撞的结果使得小球随机地向左或向右下落,因此小球第1次与高尔顿板底部接触时的坐标 X 是众多随机碰撞的结果,所以它近似服从正态分布.在现实生活中,很多随机变量都服从或近似地服从正态分布.例如长度测量误差;某一地区同年龄人群的身高、体重、肺活量等;一定条件下生长的小麦的株高、穗长、单位面积产量等;正常生产条件下各种产品的质量指标(如零件的尺寸、纤维的纤度、电容器的电容量、电子管的使用寿命等);某地每年七月份的平均气温、平均湿度、降雨量等;一般都服从正态分布.因此,正态分布广泛存在于自然现象、生产和生活实际之中.正态分布在概率和统计中占有重要的地位.说明:1参数μ是反映随机变量取值的平均水平的特征数,可以用样本均值去佑计;σ是衡量随机变量总体波动大小的特征数,可以用样本标准差去估计.2.早在 1733 年,法国数学家棣莫弗就用n !的近似公式得到了正态分布.之后,德国数学家高斯在研究测量误差时从另一个角度导出了它,并研究了它的性质,因此,人们也称正态分布为高斯分布.2.正态分布),(2σμN )是由均值μ和标准差σ唯一决定的分布 通过固定其中一个值,讨论均值与标准差对于正态曲线的影响3.通过对三组正态曲线分析,得出正态曲线具有的基本特征是两头底、中间高、左右对称 正态曲线的作图,书中没有做要求,教师也不必补上 讲课时教师可以应用几何画板,形象、美观地画出三条正态曲线的图形,结合前面均值与标准差对图形的影响,引导学生观察总结正态曲线的性质4.正态曲线的性质:(1)曲线在x 轴的上方,与x 轴不相交(2)曲线关于直线x=μ对称(3)当x=μ时,曲线位于最高点(4)当x <μ时,曲线上升(增函数);当x >μ时,曲线下降(减函数) 并且当曲线向左、右两边无限延伸时,以x 轴为渐近线,向它无限靠近(5)μ一定时,曲线的形状由σ确定σ越大,曲线越“矮胖”,总体分布越分散;σ越小.曲线越“瘦高”.总体分布越集中:五条性质中前三条学生较易掌握,后两条较难理解,因此在讲授时应运用数形结合的原则,采用对比教学5.标准正态曲线:当μ=0、σ=l 时,正态总体称为标准正态总体,其相应的函数表示式是2221)(x e x f -=π,(-∞<x <+∞)其相应的曲线称为标准正态曲线标准正态总体N (0,1)在正态总体的研究中占有重要的地位 任何正态分布的概率问题均可转化成标准正态分布的概率问题讲解范例:例1.给出下列三个正态总体的函数表达式,请找出其均值μ和标准差σ (1)),(,21)(22+∞-∞∈=-x e x f x π(2)),(,221)(8)1(2+∞-∞∈=--x e x f x π (3)22(1)2(),(,)2x f x e x π-+=∈-∞+∞ 答案:(1)0,1;(2)1,2;(3)-1,0.5例2求标准正态总体在(-1,2)内取值的概率.解:利用等式)()(12x x p Φ-Φ=有)([]}{11)2()1()2(--Φ--Φ=-Φ-Φ=p=1)1()2(-Φ+Φ=0.9772+0.8413-1=0.8151.1.标准正态总体的概率问题: xy对于标准正态总体N (0,1),)(0x Φ是总体取值小于0x 的概率,即 )()(00x x P x <=Φ, 其中00>x ,图中阴影部分的面积表示为概率0()P x x < 只要有标准正态分布表即可查表解决.从图中不难发现:当00<x 时,)(1)(00x x -Φ-=Φ;而当00=x 时,Φ(0)=0.5 2.标准正态分布表标准正态总体)1,0(N 在正态总体的研究中有非常重要的地位,为此专门制作了“标准正态分布表”.在这个表中,对应于0x 的值)(0x Φ是指总体取值小于0x 的概率,即)()(00x x P x <=Φ,)0(0≥x .若00<x ,则)(1)(00x x -Φ-=Φ.利用标准正态分布表,可以求出标准正态总体在任意区间),(21x x 内取值的概率,即直线1x x =,2x x =与正态曲线、x 轴所围成的曲边梯形的面积1221()()()P x x x x x <<=Φ-Φ. 3.非标准正态总体在某区间内取值的概率:可以通过)()(σμ-Φ=x x F 转化成标准正态总体,然后查标准正态分布表即可 在这里重点掌握如何转化 首先要掌握正态总体的均值和标准差,然后进行相应的转化4.小概率事件的含义发生概率一般不超过5%的事件,即事件在一次试验中几乎不可能发生假设检验方法的基本思想:首先,假设总体应是或近似为正态总体,然后,依照小概率事件几乎不可能在一次试验中发生的原理对试验结果进行分析假设检验方法的操作程序,即“三步曲”一是提出统计假设,教科书中的统计假设总体是正态总体;二是确定一次试验中的a 值是否落入(μ-3σ,μ+3σ);三是作出判断讲解范例:例1. 若x ~N (0,1),求(l)P (-2.32<x <1.2);(2)P (x >2).解:(1)P (-2.32<x <1.2)=Φ(1.2)-Φ(-2.32)=Φ(1.2)-[1-Φ(2.32)]=0.8849-(1-0.9898)=0.8747.(2)P (x >2)=1-P (x <2)=1-Φ(2)=l-0.9772=0.0228.例2.利用标准正态分布表,求标准正态总体在下面区间取值的概率:(1)在N(1,4)下,求)3(F(2)在N (μ,σ2)下,求F(μ-σ,μ+σ);F(μ-1.84σ,μ+1.84σ);F(μ-2σ,μ+2σ);F(μ-3σ,μ+3σ) 解:(1))3(F =)213(-Φ=Φ(1)=0.8413 (2)F(μ+σ)=)(σμσμ-+Φ=Φ(1)=0.8413 F(μ-σ)=)(σμσμ--Φ=Φ(-1)=1-Φ(1)=1-0.8413=0.1587 F(μ-σ,μ+σ)=F(μ+σ)-F(μ-σ)=0.8413-0.1587=0.6826F(μ-1.84σ,μ+1.84σ)=F(μ+1.84σ)-F(μ-1.84σ)=0.9342F(μ-2σ,μ+2σ)=F(μ+2σ)-F(μ-2σ)=0.954F(μ-3σ,μ+3σ)=F(μ+3σ)-F(μ-3σ)=0.997对于正态总体),(2σμN 取值的概率:68.3%2σx 95.4%4σx 99.7%6σx在区间(μ-σ,μ+σ)、(μ-2σ,μ+2σ)、(μ-3σ,μ+3σ)内取值的概率分别为68.3%、95.4%、99.7% 因此我们时常只在区间(μ-3σ,μ+3σ)内研究正态总体分布情况,而忽略其中很小的一部分 例3.某正态总体函数的概率密度函数是偶函数,而且该函数的最大值为π21,求总体落入区间(-1.2,0.2)之间的概率解:正态分布的概率密度函数是),(,21)(222)(+∞-∞∈=--x e x f x σμσπ,它是偶函数,说明μ=0,)(x f 的最大值为)(μf =σπ21,所以σ=1,这个正态分布就是标准正态分布( 1.20.2)(0.2)( 1.2)(0.2)[1(1.2)](0.2)(1.2)1P x -<<=Φ-Φ-=Φ--Φ=Φ+Φ- 教学反思:1.在实际遇到的许多随机现象都服从或近似服从正态分布 在上一节课我们研究了当样本容量无限增大时,频率分布直方图就无限接近于一条总体密度曲线,总体密度曲线较科学地反映了总体分布 但总体密度曲线的相关知识较为抽象,学生不易理解,因此在总体分布研究中我们选择正态分布作为研究的突破口 正态分布在统计学中是最基本、最重要的一种分布 2.正态分布是可以用函数形式来表述的 其密度函数可写成:22()21(),(,)2x f x e x μσπσ--=∈-∞+∞, (σ>0)由此可见,正态分布是由它的平均数μ和标准差σ唯一决定的 常把它记为),(2σμN 3.从形态上看,正态分布是一条单峰、对称呈钟形的曲线,其对称轴为x=μ,并在x=μ时取最大值 从x=μ点开始,曲线向正负两个方向递减延伸,不断逼近x 轴,但永不与x 轴相交,因此说曲线在正负两个方向都是以x 轴为渐近线的4.通过三组正态分布的曲线,可知正态曲线具有两头低、中间高、左右对称的基本特征。
excel标准正态分布表一、概述在数据分析中,标准正态分布是一个非常重要的分布,它在许多领域都有着广泛的应用。
为了方便用户在Excel中进行标准正态分布的计算和查询,本文将介绍如何使用Excel制作标准正态分布表。
二、制作方法1.打开Excel,创建一个新的工作表。
2.在A1单元格中输入“标准正态分布表”,并设置适当的字体和颜色。
3.在B1单元格输入“μ”,在C1单元格输入“σ”。
其中μ是正态分布的均值,σ是正态分布的标准差。
4.从B2到Bn单元格依次输入-3、-2、-1、0、1、2、3等值的μ。
5.从C2到Cn单元格分别输入相应的σ值,例如0.05、0.025、0.01等。
6.将鼠标放在B10单元格上,点击“公式”菜单,选择“定义名称”。
在弹出的对话框中输入名称,如“norm_table”,并选择A2:C10区域。
7.在D1单元格输入“z”,并在D2单元格输入“=norm_table(μ,σ)”。
通过拖动填充柄,将D2单元格的公式应用到D列的其他单元格。
8.在E列和F列分别输入变量x和对应的概率值p。
可以使用D列的函数来计算每个x对应的p值。
9.调整列宽和行高,使表格更加美观。
三、使用方法1.在Excel中打开标准正态分布表,可以在B1:F1区域看到整个表格。
2.在需要使用标准正态分布的地方输入变量x的值,然后在对应的位置查找p值。
例如,在B3单元格输入x值“0.4”,然后在F3单元格即可找到对应的p 值。
3.如果需要计算某个概率下的x值,可以使用D列的函数来查找对应的μ和σ值,再使用B列的函数来查找对应的x值。
4.如果需要制作更复杂的数据表格,可以根据需要调整表格的格式和内容。
总之,Excel标准正态分布表是一个非常实用的工具,可以帮助用户在数据分析中快速查找标准正态分布的概率和对应的x值。
通过掌握制作和使用方法,可以更好地利用Excel进行数据分析和管理。
直方图和正态分布图
直方图(Historgram)是将某期间所收集的计量值数据经分组整理成次数统计表,并使用柱形予以图形化,以掌握这些数据的分布状况。
直方图的应用
制造---加工尺寸的分布
经济---收入支出的分布
教育---考试成绩的分布……
●直方图是反映分组数据频数的柱形图
●正态分布图是一条单峰、对称成钟形的曲线。
Frequency函数
●以一个垂直数组返回某个区域中数据的频率分布
●由于函数frequency返回返回一个数组,所以必须以数组公式的形式输入
Frequency(data_array,bins_array):
data_array为一数组或对一组数值的引用,用来计算频率。
Bins_array 为间隔的数组或对间隔的引用,该间隔用于对data_array中的数值进行分组
Normdist函数
返回指定平均值和标准偏差的正态分布函数
Normdist (x,mean,standard_dev,cumulative)
其中x为需要计算其分布的数值
Mean 分布的算术平均数
Standard_dev 分布的标准偏差
Cumulative 如果为false,则返回概率密度函数
正态分布图的差异:中心偏移,分布不同
分析工具库-安装加载宏:制作直方图
VBA:全称Visual Basic for Application, 它是Visual Basic 的应用程序版本,是面向对象的编程语言。
VBA也可应用于AutoCAD
VBA的应用
●自动执行重复的操作
●进行“智能化”处理
●Office二次开发的平台。
Excel表格中怎么制作正态分布图和正态曲线模板?5、确保柱形图处于选中状态,点击 [图表⼯具]-[布局]。
点击左上⾓ [图表区] 下拉列表,选择“系列“正态曲线””,然后点击 [设置所选内容格式],打开 [设置数据系列格式] 对话框。
选择 [次坐标轴]。
6、 [图表⼯具] 选项组切换到 [设计] 选项卡。
点击 [更改图表类型],打开 [更改图表类型] 对话框。
如图选择拆线图7、柱形图中选中正态曲线,然后在 [图表⼯具] 选项组切换到 [布局] 选项卡。
点击 [设置所选内容格式],打开 [设置数据系列格式] 对话框。
切换到 [线型] ,选择 [平滑线]。
8、⾄此,图形已经画完。
如果只需要柱形分布图,不需要正态曲线,在柱形图中选中正态曲线,按键盘上的Delete键删除就⾏了。
有的专业作图软件中,柱形分布图中柱⼦是紧挨在⼀起的。
要这样设置的话请在柱形图中选中柱⼦,然后 [图表⼯具] 选项组切换到 [布局] 选项卡。
点击 [设置所选内容格式],打开 [设置数据系列格式] 对话框。
分类间距设为0%。
切换到 [边框颜⾊] ,然后选择 [实线] ,颜⾊随便选⼀个,只要和柱⼦不是⼀个颜⾊就可以了。
这⾥选择了⿊⾊。
9、最后,试着修改下“组”和上下限与中⼼值距离的值,图表会⾃动更新。
在第3步中,我们计算了100组的值,所以,只要此处的组不超过100,均可得到正确的图表。
⼀般分组到100的情况极少,所以,第3步预留了100组的数据,以便在更改组时,总能等到正确的图表。
当然,如果你原意,计算1000组也⽆所谓了。
反正你已经学会⽅法了。
以后如果样本数据变更了,直接将A列数据换成新的样本数据,设置下需要的分组和上下限与中⼼值距离的值,正态分布图分分钟钟就出来啦。
⾄于美化嘛,只要更改相关设置就可以了,⽐如开篇那张,当然,你可以把图表美化的更加漂亮,尽情发挥想象⼒吧。
上⼀页12 3下⼀页阅读全⽂。
正态分布函数的语法是NORMDIST(x,mean,standard_dev,cumulative)cumulative为一逻辑值,如果为0则是密度函数,如果为1则是累积分布函数。
如果画正态分布图,则为0。
例如均值10%,标准值为20%的正态分布,先在A1中敲入一个变量,假定-50,选中A列,点编辑-填充-序列,选择列,等差序列,步长值10,终止值70。
然后在B1中敲入NORMDIST (A1,10,20,0),返回值为0.000222,选中B1,当鼠标在右下角变成黑十字时,下拉至B13,选中A1B13区域,点击工具栏上的图表向导-散点图,选中第一排第二个图,点下一步,默认设置,下一步,标题自己写,网格线中的勾去掉,图例中的勾去掉,点下一步,完成。
图就初步完成了。
下面是微调把鼠标在图的坐标轴上点右键,选坐标轴格式,在刻度中填入你想要的最小值,最大值,主要刻度单位(x轴上的数值间隔),y轴交叉于(y 为0时,x多少)等等。
确定后,正态分布图就大功告成了。
PS:标准正态分布的语法为NORMSDIST(z),正态分布(一)NORMDIST函数的数学基础利用Excel计算正态分布,可以使用函数。
格式如下:变量,均值,标准差,累积,其中:变量:为分布要计算的值;均值:分布的均值;标准差:分布的标准差;累积:若1,则为分布函数;若0,则为概率密度函数。
当均值为0,标准差为1时,正态分布函数即为标准正态分布函数。
例3已知考试成绩服从正态分布,,,求考试成绩低于500分的概率。
解在Excel中单击任意单元格,输入公式:“ 500,600,100,1 ”,得到的结果为0.158655,即,表示成绩低于500分者占总人数的15.8655%。
例4假设参加某次考试的考生共有2000人,考试科目为5门,现已知考生总分的算术平均值为360,标准差为40分,试估计总分在400分以上的学生人数。
假设5门成绩总分近似服从正态分布。
制作直方图
1、数据录入
新建Excel文档,录入待分析数据(本例中将数据录入A列,则在后面引用中所有的数据记为A:A);2
2、计算最大值、最小值、极差、分组数、分组组距
其中:极差=最大值-最小值,分组数=数据的平方根向上取整,分组组距=极差/分组数
3、分组
分组就是确定直方图的横轴坐标起止范围和每个小组的起止位置。
选一个比最小值小的一个恰当的值作为第一个组的起始坐标,然后依次加上“分组组距”,直到最后一个数据值比“最大值”大为止。
这时的实际分组数量可能与计算的“分组数”有一点正常的差别。
4、统计频率
5、制作直方图
选中统计好的直方图每个小组的分布个数的数据源(就是“频率”),用“柱形图”来完成直方图:选中频率列下所有数据(G1:G21),插入→柱形
选中正态分布柱形图→右键→更改系列图表类型,选中“拆线图”,确定。
选中正态分布曲线→右键→设置数据列格式→线型→勾选“平滑线”→关闭。
参考資料:QC 数学の話(大村 平著) 日科技連出版 翻訳完成日期:2009年6月6日 品质管理的基石统计初步(翻訳:李琰) 目录·从互换性到品质管理·QC 是迈向文明社会的技术突破 ·从互换性到品质管理 ·SQC 的成熟与TQC ·数据整理的基本 ·代表值的选出 ·平均值的计算 ·标准偏差的计算 ·正态分布概念引入 ·正态分布的加法与减法 ·正态分布应用举例第1章从统计学的互换性到品质管理20世纪人类历史上发生了3大震撼世界技术的突破。
1,原子能的利用;2,高分子化合物的合成;3,信息技术的飞跃发展。
关于原子能的利用,主要在民生和军事方面得到了广泛的发展。
在人类历史上原子能的出现翻开了历史新的一页,震撼了世界这是众所周知的。
二次世界大战期间在広島,長崎投下的原子弹的爆炸,造成了人类的大量伤亡。
在民生应用方面,随着碳素系列能源的枯竭和CO 2排出的控制, 原子能发电已经得到广泛应用。
另外在高分子化合物合成技术方面,给人类生活带来了极大的影响。
用塑料做成的各种各样建材类,器具类遍布了我们的生活周围。
如果把我们生活中存在的塑料制品全部拿走的话,我们生活就象没有了文字一样,土蹦瓦解。
化肥使粮食增产。
人工纤维的合成,给我们提供了丰富多样的衣着。
合成橡胶,洗剂,粘结剂,调味品等不胜枚举。
还有,信息技术的飞跃发展。
首先让我们只看一下和我们切身利益相关的民生用品,各种各样的业务预约,存款储蓄,通信网和铁道网的管理,天气预报,犯罪搜查等虽然眼睛直接看不到,却支撑着我们的近代生活。
而且各种技术计算,生命科学,人工智能等先端事物已变成了我们生活中的神圣组织。
如果说没有高分子化合物我们的生活会瓦解的话,那么没有信息我们的生活会瘫痪。
基于以上,我们可以说,原子能是能源方面的突破,高分子合成是硬件方面的突破,信息技术是软件方面的突破,3个方面对我们的生活带来了震撼性的影响。
那么为什么以上3个方面可以在20世纪能够获得极大的技术突破呢? 我认为是以下两个方面的原因:1, 抗身抗生物质的发现。
2, 品质管理的普及。
为什么这么说呢?下面阐述理由。
最初的科学文明,把人类从严酷的劳动和疾病中解放出来。
人类为了确保衣食住的安定,做出了很大的QC 数学的話题努力,也取得了很大的进步。
其中被迫做出的最大的苦战是与疾病的搏斗。
但是20世纪链酶素和盘尼西林的出现飞跃性的改善了人们抗疾病的能力。
不治之病和恐慌人们的结核病,痢疾,伤寒,霍乱,鼠疫等多种传染病得到了控制。
一百年前和现在的寿命曲线对比看一下,就会一目了然。
因此抗生物质的发现是20世纪震撼世界的较大的技术突破。
接下来我们讲述品质管理的推荐理由。
生活在现代生活中的我们,被大量的工业品包围。
正是因为工业品的存在,我们才可以享受丰富的现代生活。
而且这些工业制品对我们基本没造成伤害。
电子微波炉过热造成的着火,热水壶把儿的着火,鞋底的脱落,皮带扣的断裂后造成裤子的突然脱落,瓶塞的破裂等以上的品质问题还不至于造成很大的担心。
还有灯泡坏了换一个即可,电池和胶卷等也很容易买到手。
几乎没有我们买不到的东西。
我们可以放心大胆地使用围绕在我们周围的工业制品,但是做到放心使用是一件非常难的事情。
要实现放心使用,我们首先必须做那些事情呢?第一,这些工业制品必须大量生产。
如果没有大量生产,销售价格不可能便宜,当然也不可能遍布全国。
第二,这些大量生产的工业制品必须100%的确保质量。
如果品质不能保证,普及越广就会引起到处出问题。
这是社会所不允许的。
基于以上,也就是说既要大量生产又要100%保证质量。
当然不仅工业制品,农产物,水产物,畜产物等也是一样既要大量生产又要100%保证质量。
那么,怎么做才能使做出的所有的产品都符合品质要求呢?还有,流到市场上的产品都能保证质量吗?然后就出现了一系列的品质管理手法(Quality Control,简称QC)。
QC萌芽于1920年,成熟于20世纪后半期。
均一品质产品的大量的供给生产,是科学文明发展史上的飞跃。
这个飞跃被评价为20世纪文明的技术突破。
这个评价一点也不夸张。
首先,互换性的解说。
黑猩猩用石头敲开果实的皮;有一种啄木的鸟用嘴吸仙人掌球,用嘴趋赶枯木缝中的虫子。
动物使用工具的例子,通过观察可以举很多例子。
但是,不管怎么动物都是在自然现有的物品中选别使用工具。
动物自己不能创造工具,也不能使用部品组装成新的工具。
人类最初和动物一样,可是后来,通过锻打石头制作石器。
把铁棒的头部磨尖制作枪。
还有把尖的石器帮在铁棒的头部制作出了新的工具。
这可以认为是使用两个以上的部品通过组装制作新工具的开始。
然后,人类学会把弓和箭合起来使用。
把两个部品组合后使用确实是人类史上的一大进步。
就是在那时,人类利用智慧,制作出了很多箭可以使用同一个弓,这样的箭相互之间可以相互替换具有融通性。
这种部品之间可以相互替换使用的特性称为互换性。
在概念没有成熟之前,互换性已经被提前使用了。
话虽如此,互换性的概念成熟,基于互换性的基础上,大量生产成为可能在历史上是最近的事情。
17~18世纪伴随着工业革命的发展,大量生产大量消费的时代到来。
没有互换性大量生产是几乎不可能的事情。
在各个场所互换性的利用变成了理所当然的事情。
也就是在那个时候的1763年,法国的将军,为了实现带火炮,弹药的炮兵器材的互换性,发表了他制订的标准化计划。
进入20世纪后,正式的大量生产的时代到来了。
那时谈的最多的话题是美国T型形式的车,从1908年开始近20年间生产了1500万台T型形式的车,该车也被称为“世纪车”。
在日本也引进了海外车型经过日本本国的改进,有一种叫“圆太郎”的车在东京风靡一时,现在的前辈们非常怀念以前的古典的车厢。
在当时T型形式的车因性能好,外观优美曾经很畅销。
不管怎么样T型车当时仍然是有钱人的奢侈品。
到普通大众可以买的起为止,必须进行大副降价。
对于价格下降做出巨大贡献的是,传送带在流水线上的使用。
传送带系统,几乎被所有的制造业导入使用,为20世纪工业发展做出了巨大贡献。
那么,流水线能够成立的第一条件是部品同伴之间具有互换性。
流水线左边传送上过来的部品和流水线上右边流过来的部品可以自由组装。
流水线左边传送上过来的部品和流水线上右边流过来的部品永远可以自由组装,如果不是这样,流水线生产不可能实现。
也就是说,左边部品的同伴之间必须具有互换性,右边部品的同伴之间必须具有互换性。
比如说,部品之间没有互换性,那将是一件非常麻烦的事情。
配对部品在流水线上按一定的节拍流过来,如果某一个部品不能使用,将被返回原处。
当然对该不良品需要进行必要的处理。
也就是说带传送带的流水线生产方式是不可能的。
基于以上原因,用带传送带的流水线生产方式进行大量生产的前提条件是部品的同伴之间具有互换性。
那么通过什么样的手段才能保证部品之间的互换性呢?下面进行举例说明。
让我们想象一下,有一个直径10㎜的轴与一个直径为10㎜的轴套进行配合,并且进行大量生产。
站在生产轴的角度上,总是希望做出来的轴的外直径与10㎜相比不大也不小。
站在做轴套的角度上,总是希望做出来的轴套的孔径与10㎜相比不大也不小。
因为不是神仙,做出来的产品与要求的尺寸一点误差也没有是不可能的事情。
那么按这样的条件做出来的轴和轴套进行配合。
用一个轴与所有的轴套进行配合试一下发现、轴的外径比轴套的孔径大时,轴无法进入到轴套中。
轴的外径比轴套的孔径大的概率50%发生的可能性也是有的。
不得已,只有通过不同的轴与不同的轴套逐个试一遍,也许会提高轴和轴套配合的良品率,那么会需要很多人手,在大量生产的情况下只有边生产边哭了。
如果轴的同伴之间,轴套的同伴之间没有互换性的话,生产会非常狼狈。
因此在加工时要指定尺寸公差(尺寸单位使用mm.)轴的直径10+0.0-0.1 (1.1)轴套的直径10+0.1-0.0 (1.2)总之,轴的外径在9.0~10.0之间波动,轴套的直径在10.0~10.1之间波动。
按以上规格进行加工的话,尺寸最大的轴与尺寸最小的轴套进行配合的话,之间的缝隙用下列公式进行计算:(10-0.0)-(10+0.0)=0 (1.3)轴与轴套之间虽然一点缝隙也没有,努努力还是可以把轴塞到轴套中。
下面我们用外径最小的轴与内径最大的轴套配合,之间的缝隙用下列公式进行计算:(10+0.1)-(10-0.1)=0.2 (1.4)轴与轴套之间会产生0.2的缝隙,但是这点缝隙对使用上不造成影响。
这样的话所有的轴可以配合所有的轴套。
可以说在本例的轴的同伴之间,轴套的同伴之间互换性得到了实现。
另外,(1.1)中的+0.0-0.1部分被成为公差值(tolerance)。
为了实现部品同伴之间的互换性而制订的尺寸变化幅度。
接下来的话题可能会扯的远一些。
现在我们尽量做出来的轴和轴套满足(1.1)和(1.2) 的要求。
做出的大量的制品如果经过测量不满足尺寸规格,对不良品需要剔除,要花相当多的时间和劳力,也就是说要花大量的经费。
这时需要对所做的产品进行检查,比如说我们要加工一个轴要用图1.1样式的检查器具进行检查。
虽然看起来有些古老,但是是最廉价的检查方法。
我们假定我们用无变形,无擦伤,无缺损的原材料制作内径为9.9和10.0的孔,制作出来的轴进入10.0的孔,不能进入到9.9孔内,我们判定该轴为良品。
相反如果生产出来的轴不能进入10.0的孔或进入到9.9孔内我们判定该轴为不良品。
作为10+0.1-0.0孔的检查器具,用10.1的圆棒,10.0的圆棒进行测试,10.1的圆棒进入到孔中或10.0的圆棒不能进入到孔中都判定为不良品。
以上讲述的例子中,为了使轴和轴套具有互换性,对轴和轴套的尺寸进行了管理。
尺寸是产品的重要品质项目之一,用专用的品质管理方法进行管理也言之不过。
前面提到过的话题讲述一下,前面(1.1)的要求进行加工轴时,轴的外径以9.95为目标进行加工。
还有(1.2)的要求进行加工孔时,孔的内径以10.05为目标进行加工。
也就是说,在部品加工时,我们一般按指定的公差中心值进行生产。
在加工时如果有正确的品质管理方法,制作出来的轴和轴套之间的配合偏紧,偏松的几率接近零的话是最理想的。
基于以上,我们可以说大量生产与互换性是表里如一的,互换性与品质管理也是表里如一的。
SQC的成熟与TQC时代在不断的进步,敲响人类最不幸大门的是第二次世界大战的爆发(1939~1945)。
对于二次世界大战的看法多种多样,但是简单一句话概括的话,扩大了殖民地,世界被一分为二。
一个是以美·英为首的战胜国,以日本为主的战败国。
沾满血迹的一场场战争是历史上的悲惨事件。
随着近代工业的崛起,也伴随着战争的发生。