直方图的形状分析和判断
- 格式:doc
- 大小:39.00 KB
- 文档页数:1
2016监理工程师《三控》考点18-4考点:工程质量统计分析方法(一)调查表法统计调查表法又称统计调查分析法,它是利用专门设计的统计表对质量数据进行收集、整理和粗略分析质量状态的一种方法。
在质量控制活动中,利用统计调查表收集数据,简便灵活,便于整理,实用有效。
它没有固定格式,可根据需要和具体情况,设计出不同统计调查表。
应当指出,统计调查表往往同分层法结合起来应用,可以更好、更快地找出问题的原因,以便采取改进的措施。
(二)分层法分层法又叫分类法,是将调查收集的原始数据,根据不同的目的和要求,按某一性质进行分组、整理的分析方法。
分层法是质量控制统计分析方法中最基本的一种方法。
其他统计方法一般都要与分层法配合使用。
(三)排列图法1.排列图法的概念(I)用途:排列图法是利用排列图寻找影响质量主次因素的一种有效方法。
(2)排列图又叫帕累托图或主次因素分析图,它是由两个纵坐标、一个横坐标、几个连起来的直方形和一条曲线所组成。
2.排列图的观察与分析(I)观察直方形,大致可看出各项目的影响程度。
排列图中的每个直方形都表示一个质量问题或影响因素。
影响程度与各直方形的高度成正比。
(2)利用ABC分类法,确定主次因素。
将累计频率曲线按0~80%、80%~90%、90%~l00%分为三部分,各曲线下面所对应的影响因素分别为A、B、C三类因素。
3.排列图的应用排列图可以形象、直观地反映主次因素。
其主要应用有:(1)分析造成质量问题的薄弱环节。
(按不合格点的内容分类)(2)找出生产不合格品最多的关键过程。
(按生产作业分类)(3)分析比较各单位技术水平和质量管理水平。
(按生产班组或单位分类)(4)分析措施是否有效。
(将采取提高质量措施前后的排列图对比)(5)还可以用于成本费用分析、安全问题分析等。
(四)因果分析图法1.因果分析图法的概念(1)用途。
因果分析图法分析某个质量问题(结果)与其产生原因之间关系。
(2)因果分析图也称特性要因图,又因其形状常被称为树枝图或鱼刺图。
正态分布判定标准(一)正态分布判定标准引言正态分布是统计学中最重要的分布之一,广泛应用在各个领域的数据分析和建模中。
判断一个数据集是否服从正态分布是数据分析的基础,本文将介绍常用的正态分布判定标准。
直方图观察法使用直方图是最常见的判断一个数据集是否服从正态分布的方法之一。
1.绘制直方图:将数据按照一定的组距分组,并绘制柱状图。
横轴表示数据的取值范围,纵轴表示该范围内数据的频数或频率。
2.观察直方图形状:正态分布的直方图呈钟形曲线状,均值处的频数最高,两侧对称逐渐变小。
如果数据的直方图近似呈现钟形曲线状,则可以初步认定数据集服从正态分布。
正态概率图观察法正态概率图是一种常用的判定数据服从正态分布的方法。
1.绘制正态概率图:将数据按照从小到大排序,并绘制点图。
横轴表示数据的排序位置,纵轴表示数据的值。
2.观察图形形状:如果数据集服从正态分布,图形应该近似为一条直线。
如果图形出现明显的非线性趋势或者拐点,则说明数据不服从正态分布。
正态概率图更加直观地展现了数据是否服从正态分布。
Shapiro-Wilk检验法Shapiro-Wilk检验是一种常用的正态性检验方法,适用于样本量较小的情况。
1.提出假设:首先提出原假设和备择假设。
原假设(H0)是“样本数据符合正态分布”,备择假设(H1)是“样本数据不符合正态分布”。
2.计算检验统计量:根据样本数据计算出Shapiro-Wilk检验的统计量W。
3.判断拒绝域:根据设定的显著性水平,查表得到临界值。
如果W小于临界值,则拒绝原假设,说明数据不服从正态分布;反之,则无法拒绝原假设,说明数据服从正态分布。
Shapiro-Wilk检验是一种较为准确的正态性检验方法,但对于样本量较大的数据集效果并不理想。
正态性指标判定法除了上述方法外,还可以通过一些统计指标来判定数据的正态性。
1.偏度(Skewness):衡量数据分布的偏斜程度。
当偏度接近0时,数据分布较为对称,符合正态分布;当偏度大于0时,数据分布向右偏斜,当偏度小于0时,数据分布向左偏斜。
如何看懂直方图!了解图片质量好坏自入单反后请教了不少老师,同时也在网上找了一些知识来学习,觉得直方图对拍摄很有参考价值,故用积分换来了这篇文章,学习后觉得很受启发,所以转发了上来,供朋友们分享,废话少说,转文如下:准确曝光的好帮手教你如何看懂直方图随着数码相机(以下简称DC)图像处理技术的不断发展,越来越多的相机内置了直方图的功能。
虽然直方图对初学者来说,还很陌生。
但它却早已存在于我们的生活、工作中。
如在著名的图像处理软件Photoshop里面,对应直方图的命令就是Histogram(中文版为“直方图”)。
直方图的含义在一张图片的直方图中,横轴代表的是图像中的亮度,由左向右,从全黑逐渐过渡到全白;纵轴代表的则是图像中处于这个亮度范围的像素的相对数量。
在这样一张二维的坐标系上,我们便可以对一张图片的明暗程度有一个准确的了解。
在Photoshop中,依次单击“图像→调整→色阶(快捷键:Ctrl+L)”即可打开色阶调整框,对图像的直方图进行调整,以此控制图像的明暗变化。
图-1直方图图例直方图的特性DC中的直方图功能与Photoshop中的是一样的。
当直方图中的黑色色块偏向于左边时,说明这张照片的整体色调偏暗,也可以理解为照片欠曝。
而当黑色色块集中在右边时,说明这张照片整体色调偏亮,除非是特殊构图需要,否则我们可以理解为照片过曝。
下面,我们就用几张照片来直观地理解直方图所反映的图像特性。
图-2曝光准确图-2是一张正常曝光的建筑物照片及其对应的直方图。
我们可以看到,在直方图中比较靠左的位置,波峰比较高而且比较密集,这是因为建筑物的背影有较多的暗部区域,而直方图中左侧的位置正是反映暗部区域的分布情况的。
在直方图中央偏右的位置,我们又可以看到一个较高的波峰,这是因为图像中大片的黄色区域所对应的亮度正在这里。
在直方图的最右端,我们可以看到一个较小且突出的波峰,对应在图像中,代表的就是建筑物上圆柱体的强烈反光,由于亮度太大,超出了直方图所能表示的范围,所以便体现在最右端形成了一个波峰。
利用直方图进行样本质量评估的方法与步骤随着数据应用场景的不断增多,数据质量的重要性也越来越受到人们的关注。
数据质量不仅关乎业务决策的准确性,也直接影响到数据分析的结果和模型的准确性。
因此,对于数据的质量进行评估是至关重要的。
利用直方图进行样本质量评估是一种简单而有效的方法,本篇文章将介绍直方图的基本概念、样本质量评估的基本概念以及基于直方图的样本质量评估方法,并结合案例进行说明。
直方图的基本概念直方图是一种统计图表,用来表示数据集中各数据的频数分布情况,通常用于了解数据的分布密度和分散程度。
直方图由多个柱形图组成,每个柱形图表示一个数据区间的频数或频率。
直方图的横轴通常表示数据的范围或类别,纵轴表示频数或频率。
基本概念包括直方图的定义、组成部分和构建方法。
1. 直方图的定义直方图是表示数据集分布情况的图形统计工具,通常使用柱状图表示数据集中各数据之间的频数分布情况。
2. 直方图的组成部分直方图主要由以下三个部分组成:(1)数据区间:将数据集按照一定的范围划分为若干个数据区间。
(2)频数或频率:用柱形的高度表示每个数据区间内包含数据的频数或频率。
(3)坐标轴:通常使用横轴表示数据区间,纵轴表示频数或频率。
3. 直方图的构建方法构建直方图通常需要以下步骤:(1)选择数据区间,并确定每个数据区间的宽度。
(2)计算每个数据区间的频数或频率,通常使用频数或频率分布表汇总数据。
(3)绘制直方图,一般使用柱状图来表示数据区间的频数或频率。
样本质量评估的基本概念对于数据样本的质量评估,通常需要了解样本质量评估的定义、指标和方法。
1. 样本质量评估的定义样本质量评估是指对样本数据的质量进行评定的过程,通过一系列评估指标和评估方法对数据的质量进行分析和评估。
2. 样本质量评估的指标样本质量评估的指标通常包括以下几个方面:(1)准确度:样本数据与真实数据之间的误差。
(2)完整度:样本数据是否完整,是否存在缺失值等。
(3)一致性:样本数据之间是否存在差异,是否符合预期。
直方图小结
直方图是一种用于可视化数据分布的图形表示方法,是统计学中常用的数据分析工具。
通过直方图,我们可以直观地了解数据的分布情况、集中程度以及偏向程度等。
首先,直方图是通过将数据分成相等的区间,然后计算每个区间中数据出现的频数或频率来构造的。
区间通常用水平或垂直的矩形来表示,而矩形的高度表示了该区间内的数据频数或频率。
因此,直方图能够直观地展示数据在不同区间内的分布情况。
其次,通过观察直方图的形状,我们可以了解数据的集中趋势和偏向程度。
例如,如果直方图是对称的,那么数据的集中趋势可能是均值或中位数;如果直方图偏向某一侧,那么数据可能存在正偏(右偏)或负偏(左偏)。
通过直方图,我们可以直观地判断数据的偏向程度,进而进行相应的分析和决策。
此外,直方图还能帮助我们分析数据的分布情况。
通过观察直方图的峰值和波动情况,我们可以得到关于数据分布的一些信息,如数据的集中程度、离散程度以及是否存在异常值等。
例如,直方图中的峰值越高,表示数据在该区间内的频率越高,数据的分布越集中;而直方图中的波动程度越大,表示数据的分布越离散。
最后,直方图还可以用于比较不同数据集之间的分布情况。
通过将多个直方图放在同一坐标系中进行比较,我们可以直观地看出不同数据集的分布差异以及相似之处。
这种比较可以帮助
我们找出数据集之间的关联性和差异性,进而进行更深入的分析和研究。
总之,直方图是一种简单而直观的数据分析工具,能够帮助我们了解数据的分布情况、集中趋势和偏向程度等,进而进行相应的分析和决策。
通过直方图,我们可以更有效地理解和利用数据,提高数据分析的准确性和效率。
直方图的绘制及其解读直方图是一种常用的统计图表,用于展示数据的分布情况。
它通过将数据分成若干个区间,并统计每个区间内数据的频数或频率,然后将这些统计结果以柱状图的形式呈现出来。
直方图的绘制和解读对于数据分析和决策具有重要意义。
本文将介绍直方图的绘制方法,并解读直方图的几个重要特征。
一、直方图的绘制方法绘制直方图的步骤如下:1. 确定数据的范围和区间:首先需要确定数据的范围,即最小值和最大值,然后根据数据的范围确定合适的区间数目。
通常情况下,区间数目的选择应该使得每个区间内的数据数量大致相等,以便更好地展示数据的分布情况。
2. 划分区间并统计频数或频率:根据确定的区间数目,将数据划分到各个区间中,并统计每个区间内数据的频数或频率。
频数是指落在某个区间内的数据的个数,频率是指落在某个区间内的数据的个数与总数据个数的比值。
3. 绘制柱状图:在纵轴上表示频数或频率,在横轴上表示区间,绘制柱状图。
每个柱子的高度表示该区间内数据的频数或频率。
二、直方图的解读直方图可以通过观察柱状图的形状、峰度、偏度等特征来解读数据的分布情况。
以下是几个常见的直方图特征及其解读:1. 对称分布:如果直方图呈现出对称的形状,即左右两侧的柱子大致相等,那么数据呈现出对称分布。
对称分布通常表示数据的均值和中位数相等,且数据的分布相对均匀。
2. 正偏分布:如果直方图呈现出右偏的形状,即右侧的柱子较高,左侧的柱子较低,那么数据呈现出正偏分布。
正偏分布通常表示数据的均值大于中位数,且数据的分布相对集中在较小的数值上。
3. 负偏分布:如果直方图呈现出左偏的形状,即左侧的柱子较高,右侧的柱子较低,那么数据呈现出负偏分布。
负偏分布通常表示数据的均值小于中位数,且数据的分布相对集中在较大的数值上。
4. 峰度:峰度是指直方图的峰值的高度和陡峭程度。
如果直方图的峰度较高,表示数据的分布相对集中,峰值较尖锐;如果直方图的峰度较低,表示数据的分布相对分散,峰值较平缓。
直方图是一种用于表示数字图像中像素灰度分布的统计图表。
它将图像的灰度范围划分为若干个等级,并统计每个等级中像素的数量,从而形成一个柱状图。
直方图的横坐标表示灰度等级,通常从最暗的黑色(0)到最亮的白色(255)进行划分。
纵坐标表示对应灰度等级的像素数量。
通过观察直方图,可以了解图像中不同灰度级别的像素分布情况。
直方图可以提供以下信息:
1. 图像的整体对比度:直方图的形状可以反映图像的整体对比度。
如果直方图的分布集中在较窄的灰度范围内,说明图像的对比度较低;如果直方图的分布较为分散,说明图像的对比度较高。
2. 像素分布情况:直方图可以显示图像中不同灰度级别的像素数量,从而了解图像的亮度分布。
如果某个灰度级别的像素数量较多,说明该灰度在图像中占据较大的比例。
3. 图像的曝光情况:通过观察直方图的左右端点,可以判断图像的曝光情况。
如果直方图的左侧截断,说明图像可能存在欠曝光;如果右侧截断,说明图像可能存在过曝光。
4. 色彩平衡:对于彩色图像,可以分别查看每个颜色通道的直方图,以评估图像的色彩平衡情况。
在图像处理中,直方图可以用于图像增强、对比度调整、色彩平衡等操作的参考。
它是一种简单而直观的工具,帮助我们了解数字图像的统计特征。
QC (旧)七大手法之五——直方图(histogram )第一小节 直方图的观察分析一.定义众所周知在相同的条件下制造出来的产品,其质量特性也不完全相同,但也不会相差太大,总是在一定范围内波动,而且这种波动有一定的规律性,直方图就是直观而形象地把质量分布规律用图形表示出来的统计工具。
直方图(histogram )是频数直方图的简称,又叫质量分布图、矩形图、柱形图、柱状图、频数图。
是指通过对生产过程中产品质量的分布状态的描绘与分析,来判断生产过程质量的一种常用方法,它是工序质量控制统计方法中的主要工具之一(另一工序质量控制工具就是控制图)。
直方图是一种几何图表,它是根据从生产过程中收集到的质量数据(通常不能少于50个,最少不能少于30个数据)分布情况,画成以组距为底边、以频数为高度的一系列连接起来的直方形矩形图。
十六世纪末十七世纪初英格兰人普莱菲和德国地理学者科洛玛是使用直方图的先驱者。
直方图的分类:直方图根据使用的各组数据是频数还是频率分为频数直方图与频率直方图;在表示分布时又分为一般直方图和累计直方图两种。
直方图的基本形式(格式):说明:横坐标表示产品的质量特性值(如尺寸、重量等计量值),在横坐标上划分了若干个间距相等的区间(即矩形的宽度表示数据范围的间隔)。
纵坐标表示在n 个数据中,落在各个区间里的频数(即反复出现在该区间的次数)(即高度表示在给定的间隔内数据出现的频数即数目)。
一个个直方形,其宽度取决于区间的宽度,其高度取决于该区间的频数(频数常用f 表示),n 表示样本大小(即样本量),X 表示样本中全体数据的平均值(表示分布中心),S 表示样本的标准偏差(S 表示质量特性离散程度,有的也称标准差)。
直方图适用于对于大量计量值数据进行整理加工,找出其统计规律,也就是分析数据的形态,以便对其整体的分布特征进行推断(即通过变化的高度形态表示数据的分布情况)。
直方图是从总体中随机抽取样本,对从样本中获得的数据进行整理后,用一系列等宽的矩形来表示数据。
第八章 直 方 图 法 一 什么是直方图方的加工整理 直图是通过对数据从而分析和掌握质量数据的分布状况和估算工序不合格频率的一种方法将全部数据分成若干组以组距为底边以该组距相应的频数为高按比例而构成若干矩形即位直方图其基本形势见图10-1图为什么要使用直方呢以前我描述质量情况虽说已有平均尺们经寸或平均含量等统计数据但是只有这些统计数据还不完善不能充分说明问题例如下面两组数据是5次抽测两个班组控制冷却温度的数据甲班55677乙班246810如果计算两组数据的平均值用x 来表示则x甲=6, x 乙=6两班的x 是一样的可是很明显两班的控制水平是不一样的甲班控制得较定稳集中在5~7之间最大与最小相差2即极差R甲=7-5=2而大乙班的温度波动较R 乙=10-28=可以说两班数据的分散程度不一样 再看另外两组数据甲班3345 5乙班77899这两个班温度制都定的控比较稳R丙=5-3=2 R 丁=9-7=2但两班的平均温度不一样X丙=4X 丁=8可见在分析质量情况时只看平均值或只看分散程度都是片面的要综合来布起看分直方图法就是用以帮助我们分析产品质量的分布状况它的用途十分广泛常用于定期报告质量状况分析质量分散原因测量工序能力估计工序不合格品率等 一 直 方 图 的 作 法举一个实际例子来说明某工厂生产的产品重量标准要求在1000~1050克之间1000为了况分析产品的重量分布状搜集一段时间内生产的产品100个测定重量得到100个数据作一张直方图作直方图有三大步骤:作频数分布表画直方图进行有关计算下面逐步讨论一 作频敏分布表频数就是出现的次数将数据按大小顺序分组排列反映各组频数的统计表称为频数分布表频数分布表可以把大量的原始数据综合起来比较直观形象的形式表示分布的状况并为作图提供依据具体作法按下述步骤1.搜集数据 将搜集到的数据填入数 据表作直方图的数据要大于50个否则反映分布的误差太大本例搜集了100个为了简化计算数据表中每个测量值x 只列出波动范围的数值x 值如表10-1所示表10-1中的数字均缩去1000克例如3代表的测量值是1043克4304代表的测量值是134克......依此类推2计算极差R 表10-1中最大值X max =48最小值X miu =1R= X max -X miu =48-1=47 3适当分组k 组数的确定要适当组数太少会掩盖各组内的变化情况引起较大的算计误差组数太多则会造成各组的高度参差不齐影响数据分布规律的明显性反而难以看清分布的状况而且计算工作量大组数k 的确定可以参考组数选用表见表10-2 本例取k =104确定组距h 组距用字母h 表示h=极差R / 组数k一般取测量单位的整数倍以便于分组本例h=R/k=47/10=4.7 5 5确定各组界限 为了避免出现数据值与组的边界值重合而造成频数计算困难的问题 组的边界值单位应取最小测量单位的1/2也就是把数据的位数向后移动一位并取数值为5例如个位数为0.5小数一位数(0.1)为0.05小数二位数(0.01)为0.005(本例表10-1中所有据数的最小位数为个位数因此1/2最小测量单位是1/2 X 1=O.5)分组的范围应能把数据表中最大值和最小值包括在内第一组的下限为2最小测量单位最小值=本例第一组下限为X min -1/2=1-1/2=0.5第一组上界限值为下界限值加上组距0.5+5=5.5第二组的下界限值就是第一组的上界限值第一组的上界限值加上组距就是第二组的上界限值照此类推定出各组的组界6编制频数分布表 频数分布袤的表头设计见表10-31填入组顺序号及上述已计算好的组界 2计算各组中值并填入表中组各组的组中值为=ΦX 下届界限上届界限+实际上组的组2例如第二组组中值为 5.5+10.5/2=8 组中值加上组距就是下一组的中值 3统计各组频数统计时可在频数栏里划记号这一步骤很容易出差错所以要注意力集中统计后立即算出总数f 看是否与数据总个数N 相等频数分布表暂时先做到其他栏目以后再填这里(二) 画 直 方图 1先画纵坐标再画横坐标纵坐标表示频数定纵坐标刻度时考虑的原则是把频数中最大值定在适当的高度本例频数最大为27我们就取适当高度定为30原点为0均匀标出中间各值中2横坐标表示质量特性定横坐标刻度时要同时考虑最大最小值及规格范围(公差)都应含坐在标值内本例中X =48=1规格下限T 为0上限T 为5因而坐标值范围应包括从0至50(克)在横坐标上画出规线X min U 0max L格规格下限与频数坐标轴间稍留一些距离以方便看图 3以组距为底频数为高画出各组的直方形与s是直方图上的重要数据一定要标出见图10-2二直方图的观察分析图形的形状进行观察对照规格标准公差进行比较一 对图形形状的观察分析计较常见的直方图典型形状图10-3有以下几种2孤岛型在远离主分布的地方出现小的直方形犹如孤岛见图10-3b孤岛的存在向我们揭示短时间内有异常因素在起作用使加工条件起了变化例如原料混杂操作疏忽短时间内有不熟练的工人替班或测量工具有误差等3偏向型直方形的顶峰偏向一侧所以也叫偏坡形见图10-3c计量值只控制一侧界限时常出现此现状有时也因加工习惯造成这样的分布例如孔加工往往偏小而轴加工往往偏大等4双峰型这往往是由于把来自两个总体的数据混在一起作图所致见图10-3d 例如把两个工人加工的产品或两台设备加工的产品混为一批等这种情况应分别作图后再进行分析5平顶型直方呈平顶形见图13-3e往往是由于生产过程中有缓慢变化的因素在起作用所致例如刀具的磨损操作者疲劳等应采取措施控制该因素稳定地处于良好的水平上6锯齿型这种类型的直方图大量出现参差不齐但整个图形的整体看起来还是中间高两边低左右基本对称见图13-3f造成这种情况不是生产上的问题主要是分组过多或测量仪器精度不够读数有误等原因所致(二) 对照规格标准进行分析比较当工序处于稳定状态时直方图为正常型还需要进一步将直方图与规格标准进行比较以判定工序满足标准要求的程度常见的典型直为图图10-4也有以下几种:图中B是实际尺寸分布范围T是规格标准范围规格限有一定余量约为T/8见图13-4a的可能说明控制有倾向性见图13-4b例如机械工人主观上认为外径大了可以返工小了就要报废于是就往大控制应调整分布中心使之合理3无富余型 分布虽然落在规格范围之内但完全没有余量一不小心就会超差见图14-4c 必须采取措施缩小分布的范围4能力富余型 如见图14-4d 所示这种图形说明规格范围过分大于实际尺寸分布范围质量过分满足标准的要求虽然不出不合格品但是太不经济可以考虑改变工艺放松加工精度或缩小规格范围或减少检验频次以便有利于降低成本5能力不足型 实际分布尺寸的范围太大造成超差见图14-4e 这是由于质量波动太大工序能力不足出现了一定量不合格品应多方面采取措施缩小分布范围6陡璧型 如图14-4f 所示这是工序控制不好实际尺寸分布过分地偏离规格中心造成了超差或废品但在作图时数据中己剔除了不合格品所以没有超出规格线外的直方部分可能是初检时的误差或差错所致三 直方图的定量描述如果画出的直方图比较典型我们对照以上各种典型图那么便可以作出判断但是实践活动中画出来的图形多少有些参差不齐或者不那么典型而且由于日常的生产条件变化不太大因此画出的图形较相似往往从外形上难以观察分析得出结论例如图10-5是用连续两个月生产数据画出的直方图从外形上观察很难分清哪个图表示的生产状 况更好些如果能用数据对直方图进行定量的描述那么分析直方图就会更有把握些描述直方图的关键参数有两个一个是平均值另一个是标准偏差一平均值x 的计算平均值x 的计算有两种方法1算术法把所有的数都加起来除以总数用公式表示为N xn x x x x ++++= (321)用表10-1的数字为例代入得8.2610040...2728143=++++=x2加权法 利用频数表再用加权法计算平均值可以有三种方法 1可用公式=N i i x f 14中∑计算 x 式中f i 为各组的频数X 中i 为各组的组中值用表10-3的数据为例代入得x =f1X 中1+ f 2 X 中2+ f 3 X 中3+…+ f 4 X 中4/100 因为这里应用了各组的组中值为代表值进行计算所以这是一种近似的简算方法在工业生产中其计算精度一般能满足要求2变换数法这是加权法的简易算法可以利用频数分布表进行令频数最大的组的变换数u 为0以表10-3为例第六组频数最大令其变换数u 6=0然后向上为负值依次递减1即填入-1-2-3.......向下为正值依次递增1即填入12 3......计算频数与变换数的乘积f i u i 及累加值f i u i 填入表中 本例f1u 1 =1 (-5)= -5f2u 2 =3-4= -12 其余类推fi u i =-5+-12+-18+-28+-19+ 0 + 14 + 20 + 9 + 12 = -27 平均值x 的计算公式是0i if f x uh x i +=∑∑,式中h 是组距本例为5x 0是令其变换数为0的那一组的组中值即频数最大的组的组中值本例为x0=x 中6=28f i 是各组频数的累加值本例为100f i u i 是各组f i u i 的累加值本例为-27用表10-3的数据代入6.2628100275f f 0i i =+−×=+=∑∑x u h x i二 标准偏差s 的计算虽然极差R 也能反映分散程度但是它只考虑数据最大值和最小值的影响没有考虑其余中间数据分布的影响因此极差反映实际情况的能力较差 因此在实际工作中就有必要运用另一个较为准确反映分散程度的统计特征值即标准偏差1标准偏差的计算公式1)(......)()(22221−−++−+−=N x x x x x x s n 2利用频数分布表计算 先计算fi u i 2在频数分布表中把每组的u If i u I 即得f i u i 2值填入表格并计算各组的f i u i 2累加值f i u i 2 本例f 1u 12=(-5)(-5)=25f 2u 22=(-4)(-12)=48……f i u i 2=25+48+54+……+48=331 标准偏差的计算公式为22)(N u f N u f h s i i i i ∑∑−= 式中N 为数据总数用本例的数据代入得50.9)10027(10033152=−−×=s 三直方图的定量表示定量表示直方图的主要统计特征值参数是平均值x 和标准偏差S直方图中平均值x 表示数据的分布中心位置它与规格中心M 越靠近越好直方图中标准偏差s 表示数据的分散程度标准偏差s 决定了直方图图形的胖瘦s 越大图形越胖说明数据的分散程度越大说明这批产品的加工精度越差据此再观团0-5察1我们就可以容易地注意到7月份和8月份这两个月的产生状况是有差异的x 8比x 7更靠近规格中心10.25表明控制得更合理S 8比S 7小说明控制更严格质量波动小因此8月份生产的产品质量要更好些 四 直方图与分布曲线从总体中随机抽取部分样本通测得样本的统计特征过值来推断总体的质量状况对计量值数据来说当生产处于控制状态时通过从总体中随机抽取样本测得的质量特性数据可以计算出样本的平均值x 标准偏差S 和画出直方图可以设想随着抽取的样本数量不断增加直方图的分组数也不断增多组距不断减小直方图形也就越来越密继而得到连续的分布曲线这就是说当生产处于稳定状态下总体存在着一定的分布且其统计特征值的参数是平均值为标准偏差为然而从理论上说和是无法精确计算的数理统计学的原理告诉我们当态分总体服从正布规律时由随机抽取得到的样本质量数据也服从正态分布规律而且具有样本的平均值x近似于总体的平均值样本的标准偏差S:近似于总体的标准偏差因此在质量管理中对于样本而言常以x S来表示其统计特征值用来估计推断总体的和见图10一6五直方图法在应用中常见的错误和注意事项1抽取的样本数量过小将会产生较大误差可信度低也就失去统计的意义样本数应不少于50个2分组数k选用不当组数k选得偏大或偏小都会造成对分布状态的判断有误3直方图一般适用于计量值数据但在某些情况下也适用于计数值数据这要依绘制直方图的目的而定图形不完整标注不齐全直方图上应标注公差范围线平均值x的位置用点划线表示x不能与公差中心位置M相混淆图的右上角标出N x S Cp或Cpb的数值。