6sigma图表分析(box plot)
- 格式:ppt
- 大小:1.47 MB
- 文档页数:62
箱形图箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。
因型状如箱子而得名。
在各种领域也经常被使用,常见于品质管理。
1.定义"盒式图"或叫"盒须图""箱形图"boxplot须图又称为箱形图,其绘制须使用常用的统计量,最适宜提供有关数据的位置和分散的参考,尤其在不同的母体数据时更可表现其差异。
如右图所示,标示了图中每条线表示的含义,其中应用到了分位值(数)的概念。
主要包含六个数据节点,将一组数据从大到小排列,分别计算出他的上边缘,上四分位数,中位数,下四分位数,下边缘,还有一个异常值。
2.箱形图的绘制箱形图提供了一种只用5个点对数据集做简单的总结的方式。
这5个点包括中点、Q1、Q3、分部状态的高位和低位。
箱形图很形象的分为中心、延伸以及分部状态的全部范围箱形图中最重要的是对相关统计点的计算,相关统计点都可以通过百分位计算方法进行实现。
箱形图的绘制步骤:1、画数轴,度量单位大小和数据批的单位一致,起点比最小值稍小,长度比该数据批的全距稍长。
2、画一个矩形盒,两端边的位置分别对应数据批的上下四分位数(Q1和Q3)。
在矩形盒内部中位数(Xm)位置画一条线段为中位线。
3、在Q3+1.5IQR(四分位间距)和Q1-1.5IQR处画两条与中位线一样的线段,这两条线段为异常值截断点,称其为内限;在Q3+3IQR和Q1-3IQR处画两条线段,称其为外限。
处于内限以外位置的点表示的数据都是异常值,其中在内限与外限之间的异常值为温和的异常值(mild outliers),在外限以外的为极端的异常值(extreme outliers)。
四分位间距=Q3-Q1。
.4、从矩形盒两端边向外各画一条线段直到不是异常值的最远点,表示该批数据正常值的分布区间。
5、用“〇”标出温和的异常值,用“*”标出极端的异常值。
相同值的数据点并列标出在同一数据线位置上,不同值的数据点标在不同数据线位置上。
六西格玛(Six Sigma)是在九十年代中期开始从一种全面质量管理方法演变成为一个高度有效的企业流程设计、改善和优化技术,并提供了一系列同等地适用于设计、生产和服务的新产品开发工具。
继而与全球化、产品服务、电子商务等战略齐头并进,成为全世界上追求管理卓越性的企业最为重要的战略举措。
西格玛逐步发展成为以顾客为主体来确定企业战略目标和产品开发设计的标尺,追求持续进步的一种质量管理哲学。
什么是6西格玛管理关于6西格玛管理,目前没有统一的定义。
下面是一些管理专家关于6西格玛的定义:管理专家Ronald Snee先生将6西格玛管理定义为:“寻求同时增加顾客满意和企业经济增长的经营战略途径。
”6西格玛管理专家Tom Pyzdek:“6西格玛管理是一种全新的管理企业的方式。
6西格玛主要不是技术项目,而是管理项目。
”下面是韦尔奇先生在接受美国著名作家珍妮特·洛尔采访时谈到的6西格玛管理:“品质的含意从字面上来看,乃是要提供一个超越顶级的事物,而不仅是比大多数的事物更好而已。
”80年代初,当通用电器面临竞争者的威胁时,韦尔奇曾说道:摩托罗拉、惠普科技、德州仪器和施乐公司并没有足够的资本与我们抗衡,而他们的竞争力来自于他们的产品品质。
90年代中后期韦尔奇成为6西格玛品质热衷的追求者。
1996年,在佛吉尼亚夏洛特城举行的通用电器公司的年会上,韦尔奇说:“在通用电器的进展过程中,我们有一项重大科技含量的品管任务,这项品管任务会在4年内将我们的生产方式引至一个卓越的层次,使我们无论是在产品制造还是在服务方面的缺陷或疵暇都低于百万分之四。
这是我们通用电器前所未有的大挑战,同时也是最具潜力和最有益处的一次出击。
”“我们推翻了老旧的品管组织,因为他们已经过时了。
现代的品管属于领导者,属于经理人员,也属于员工—每一位公司成员的工作。
”“我们要改变我们的竞争能力,所依恃的是将自己的品质提升至一个全新的境界。
我们要使自己的品质使消费者觉得极为特殊而有价值,并且对他们来说是相当重要的成功因素。
Excel-箱线图(数据分布)分析标签: excel数据分析六西格玛箱线图数据分布2014-01-18 11:13 25396人阅读评论(0) 收藏举报分类:Excel(14)网站分析(9)版权声明:本文为博主原创文章,未经博主允许不得转载。
目录(?)[+]本文摘自作者《网站数据分析:数据驱动的网站管理、优化与运营》:箱线图(Boxplot)也称箱须图(Box-whisker Plot),它就是用一组数据中的最小值、第一四分位数、中位数、第三四分位数与最大值来反映数据分布的中心位置与散布范围,可以粗略地瞧出数据就是否具有对称性。
通过将多组数据的箱线图画在同一坐标上,则可以清晰地显示各组数据的分布差异,为发现问题、改进流程提供线索。
1.什么就是四分位数箱线图需要用到统计学的四分位数(Quartile)的概念,所谓四分位数,就就是把组中所有数据由小到大排列并分成四等份,处于三个分割点位置的数字就就是四分位数。
•第一四分位数(Q1),又称“较小四分位数”或“下四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。
•第二四分位数(Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。
•第三四分位数(Q3),又称“较大四分位数”或“上四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。
•第三四分位数与第一四分位数的差距又称四分位间距(InterQuartile Range,IQR)。
计算四分位数首先要确定Q1、Q2、Q3的位置(n表示数字的总个数):•Q1的位置=(n+1)/4•Q2的位置=(n+1)/2•Q3的位置=3(n+1)/4对于数字个数为奇数的,其四分位数比较容易确定。
例如,数字“5、47、48、15、42、41、7、39、45、40、35”共有11项,由小到大排列的结果为“5、7、15、35、39、40、41、42、45、47、48”,计算结果如下:•Q1的位置=(11+1)/4=3,该位置的数字就是15。