六西格玛中图形分析的Minitab实现解读演示教学
- 格式:doc
- 大小:147.50 KB
- 文档页数:10
六西格玛管理图形分析工具Minitab实操步骤在数据分析流程中需要了解六西格玛管理图形分析的工具Minitab图形软件,以便为六西格玛管理分析奠定基础。
一、Minitab简介Minitab是一个统计软件包:提供许多分析数据的统计工具,以容易理解的方式呈现结果,能够以多种不同的图形来表达数据。
Minitab可以将成列的数据绘成图形,可以揭示集中趋向、分散性、趋势、流程变化、X与Y的关系。
当启动Minitab时,程序将为打开一个新的空项目。
将看到三个窗口:数据窗口、会话窗口和任务窗口(启动时被最小化)。
1、控制窗口可以打开和最小化Minitab的各个窗口,如同操作系统中的其他窗口一样。
也可以使用窗口菜单上的命令来控制Minitab窗口。
2、Minitab环境全部工作内容都包含在一个Minitab项目文件中。
该项目文件包含:①数据所在的工作表。
一个项目中可以有多个工作表。
②显示所有打开工作表文件的一个或多个数据窗口。
数据将按列显示。
项目中的每个工作表对应一个数据窗口,可以直接在数据窗口中输入和编辑数据。
③显示结果的会话窗口。
3、用Minitab的图形命令创建的图形一个任务窗口包含:①用于管理会话窗口输出的会话文件夹。
②列出已在会话中使用的命令的历史记录文件夹。
通过从“历史记录”文件夹中复制命令并粘贴到命令行编辑器中,可以重新执行这些命令。
③用于管理、排列和命名图形的图形文件夹。
④用于创建、排列和编辑工作报告的ReportPad文件夹。
⑤用于快速访问项目相关的非Minitab文件以便参考的相关文档文件夹。
⑥包含所有打开工作表的单个文件夹的工作表文件夹。
每个工作表文件夹显示了工作表中使用的列、存储常量、矩阵和设计的摘要。
⑦用于发出命令的多个工具栏和一个状态栏。
二、时间序列图时间序列图用于评估数据随时间变化的模式。
Minitab可以为时间尺度生成日历值、时钟值或索引值,也可以使用自己的标记值列。
时间序列图可以看出流程变化的趋势。
8六西格玛管理中DMAIC模型的第三个阶段是分析(A),在量测阶段识别了发生什么(Y)之后,接下来的工作就是通过分析寻找发生问题的原因。
即最终确定出一组按重要程度排列的影响Y的因素x1、x2、…、xn.分析阶段所用的方法在很大程度上取决于所解决的问题和面对的业务流程,通常采取数据分析和流程分析相结合的方法。
数据分析主要是利用已经收集的数据或为分析而需要收集的数据来分辨问题模式、问题发展趋势或其他一些有关因素;流程分析主要是从整个流程运行的角度,辨别不一致的、不相关的或可能引起问题发生或导致问题发生的某些领域.将各种方法发现的结论放在一起,获得对影响因素的全面认识。
从六西格玛管理的角度看,分析阶段实现的目标具体说有三个:找出影响项目Y的所有因素;辨别出关键少数的因素;评估预测改进效益.分析阶段的工具根据工具的类型分为三大类,由头脑风暴法等组成的定性分析方法、由统计技术支撑的定量分析方法以及由统计技术和管理技术支撑的图形工具。
图形分析工具主要包括:比较两组数据差异的箱线图、描述因素变量间相关关系的散点图、显示影响因素的直方图、描述影响因素之间关系的多变量图、从客户要求、技术、产品要求的角度进行综合分析的质量功能展开、通过二维图表分析三个变量间关系的等高线图、通过流程寻找原因的流程图等.下面结合Minitab软件重点介绍箱线图、散点图、边际图、矩阵图、等高线图、多变量图等.一、箱线图(BoxPlots)箱形图是通过一个或几个箱形来描述数据分布特征的绘图工具。
在六西格玛质量管理中,它的主要作用表现在以下两个方面:比较不同样本间数据的分散程度与集中程度,找出差异为下一步的判断和决策提供依据。
对于每个独立的箱形图,判断数据是否有异常点(outlier)的存在,对异常点应重点分析,总结原因。
要建立与分析箱形图,必须先了解Q值。
Q是quartile的缩写,代表数据的1/4,每一个样本共有4个Q值,当将样本数据按由小到大排序后,把这些数据均分为4部分,则每一部分的最大值即为六西格玛中图形分析的Minitab实现文/王作成方何样本相应的4个Q值,这4个Q值依次为:Q1、Q2、Q3、Q4,位于中间位置的数据或两个数据的算术平均数称为中位数.从Graph下拉菜单打开Boxplot主对话框,通过变量的选择输入,可以画一个箱形图,也可以根据类别变量将每一个类别值的箱形图画在同一个视窗中。
8六西格玛管理中DMAIC模型的第三个阶段是分析(A),在量测阶段识别了发生什么(Y)之后,接下来的工作就是通过分析寻找发生问题的原因。
即最终确定出一组按重要程度排列的影响Y的因素x1、x2、…、xn。
分析阶段所用的方法在很大程度上取决于所解决的问题和面对的业务流程,通常采取数据分析和流程分析相结合的方法。
数据分析主要是利用已经收集的数据或为分析而需要收集的数据来分辨问题模式、问题发展趋势或其他一些有关因素;流程分析主要是从整个流程运行的角度,辨别不一致的、不相关的或可能引起问题发生或导致问题发生的某些领域。
将各种方法发现的结论放在一起,获得对影响因素的全面认识。
从六西格玛管理的角度看,分析阶段实现的目标具体说有三个:找出影响项目Y的所有因素;辨别出关键少数的因素;评估预测改进效益。
分析阶段的工具根据工具的类型分为三大类,由头脑风暴法等组成的定性分析方法、由统计技术支撑的定量分析方法以及由统计技术和管理技术支撑的图形工具。
图形分析工具主要包括:比较两组数据差异的箱线图、描述因素变量间相关关系的散点图、显示影响因素的直方图、描述影响因素之间关系的多变量图、从客户要求、技术、产品要求的角度进行综合分析的质量功能展开、通过二维图表分析三个变量间关系的等高线图、通过流程寻找原因的流程图等。
下面结合Minitab软件重点介绍箱线图、散点图、边际图、矩阵图、等高线图、多变量图等。
一、箱线图(BoxPlots)箱形图是通过一个或几个箱形来描述数据分布特征的绘图工具。
在六西格玛质量管理中,它的主要作用表现在以下两个方面:比较不同样本间数据的分散程度与集中程度,找出差异为下一步的判断和决策提供依据。
对于每个独立的箱形图,判断数据是否有异常点(outlier)的存在,对异常点应重点分析,总结原因。
要建立与分析箱形图,必须先了解Q值。
Q是quartile的缩写,代表数据的1/4,每一个样本共有4个Q值,当将样本数据按由小到大排序后,把这些数据均分为4部分,则每一部分的最大值即为六西格玛中图形分析的Minitab实现文/王作成方何样本相应的4个Q值,这4个Q值依次为:Q1、Q2、Q3、Q4,位于中间位置的数据或两个数据的算术平均数称为中位数。
从Graph下拉菜单打开Boxplot主对话框,通过变量的选择输入,可以画一个箱形图,也可以根据类别变量将每一个类别值的箱形图画在同一个视窗中。
Datadisplay选项可选择箱体的类型:InterquartileRange箱形图(IQRangeBox)、中位数置信区间箱形图(CIBox)、样本全距的箱形图(RangeBox)。
EditAttibutes子对话框,可改变箱体的属性值,如填充颜色、边线类型、颜色、尺寸、宽度、触须的显示与否以及将箱体的宽度设为与样本大小成比例。
Annotation选项还可设定异常点、中位数、均值等的标记属性。
箱形图的结构如上图所示,这是使用Minitab软件自带数据,即Data目录下的Pulse.mtw数据集得出的。
箱形图的判读与分析方法如下:长方形箱体代表从第一四分位数Q1到第三四分位数Q3的样本数据,箱体内标出中位数的位置,这样,箱体包括了一半的样本数据。
本例选择IQRangeBox。
上部触须与下部触须的比较可看出数据对称与否。
当下部触须大于上部触须说明数据成左偏分布,相反,当上部触须大于下部触须说明数据成右偏分布,只有上、下触须相等时,数据分布才可能具有对称性。
与正态数据的箱形图相比较,还可看出样本数据是否服从正态分布。
显然,本例中左边的样本数据成左偏分布,右39中国统计边的则成右偏分布。
异常点的判读。
若观察值位于长方形箱体上下边的3倍四分位距之外则成为异常点,在箱形图中以星号*标注,这些值对质量特性的分析影响重大,应特别注意。
本例中无异常点出现。
二、散点图为了考察两个变量x和y的关系,把关于(x,y)的n对观测数据值:(x1,y1),(x2,y2),…,(xn,yn),描绘在二维直角坐标系中,便形成了散点图。
在Minitab的Graph下拉菜单下的散点图Plot对话框中,Y与X栏下分别输入要分析的因变量与自变量,若两变量间存在因果关系,则设原因变量为x,结果变量为y。
若要分析多对变量间关系,则在栏下分别按行输入即可。
Datadisplay选项中可指定分组变量对数据分组,可为每对数据或每一组数据或每个图表选择显示内容(如符号、面积等)。
要设定显示内容的属性值,在EditAttributes中选择实现。
Annotation用来指定绘图的标题、注解、数据标记、异常值标记、中位数和均值标记、直线、多角形与书签标记等属性值。
Frame可用来指定坐标轴、多图表显示、坐标轴的取值范围等属性值。
Regions选项可设定数据、图表与图例的区域属性值。
从散点图可以观察变量x和y的关系:正相关:y值随x值的增加而增加;负相关:y值随x值的增加而减少;不相关:y值与x值的变化无任何规律可循。
另外,由散点图还可以知道两变量间的相关程度;检验是否有异常点的情形出现等。
散点图中点的分布形状很多,对六西格玛质量管理人员来讲,最感兴趣的往往是这些点是否散布在某条直线附近,因为如果这一趋势出现,就可以通过一个变量的取值去预测或控制另一变量的取值。
三、边际图边际图实际上也是散点图的一种,通过在与y轴和x轴平行的方向上附带关于变量y和变量x的直方图、箱形图或点图的边际图,可以对两变量的分布情况进行个别分析。
产生一个边际图,在Graph菜单下的MarginalPlot对话框中选择即可。
在对话框中,分别输入作为y轴和x轴的变量y和x,选择边际图的种类,可在直方图、箱形图或点图中择一,同时可选择要做边际图的变量,可以只做变量y或变量x的边际图,也可给两变量都做边际图,另外还可选择y轴和x轴的标记以及图表的标题,来取代默认值。
在Symbol选项中,可为数据点显示设定属性值,如显示的符号、颜色等。
Options对话框中,可用来设定坐标轴的刻度取值,标记属性值等。
如取两个坐标轴的最大刻度值与最小刻度值相同时,在一定情形下,可使具有相同计量单位的两个变量更具可比性。
边际图包括二维的散点图和每个变量的分布图,其中二维的散点图可用来分析两变量间的相关性以及两变量间的联合分布,而每个变量的分布图可用来分析各个变量的分布情况。
这里的例子使用Minitab软件自带数据Pulse.mtw,分析的是变量Weight与Pulse1的关系,以及反映两变量各自的分布情况的箱形图。
由二维散点图可以看出,变量weight与pulse1间不存在相关关系,即人体脉搏不会因体重的差异而有区别,这也符合现实中人体的生理特征。
由变量weight的箱形图可见有一点为异常点(outliers),处于上限以外,说明有一人的体重较大,通过图表的编辑功能Brush选项,可查看关于该点的具体信息,对该个体应予重点关注。
在变量pulse1的箱线图中,无异常点出现,说明观察对象的脉搏均无不良现象发生。
在六西格玛质量管理分析中,尤其是有关的统计分析,一定要结合实际情况,以防判断错误,例如从数据看,有些变量间存在相关性,并且相关性较强,但现实中两变量并不相干,这种相关也成为伪相关。
四、矩阵图矩阵图也是散点图的一种,可在一张二维图中,显现多个变量间的分布关系图,这样可在一张图表中观察多个变量间的相关性,方便了多个数据间的数据分析,可以节省很多时间。
一个矩阵图最多可以分析20个变量。
Graph菜单下的MatrixPlot是用来做矩阵图的。
打开对话框后,Graphvariables选项用来指定要分析的变量,其中至少要选择两个变量,但最多不能超过20个。
使用Minitab软件自带数据Pulse.mtw,在该选项中由左侧的变量列表选入Pulse1、Pulse2、Height、Weight,可分析这四个变量间两两的相关关系。
Options子对话框中的可选项有:列出矩阵全部(默认值)或左下角或右上角的内容;将变量名放在矩阵的对角线位置(默认值)或是在边界上;为分辨重叠的数据点,加入“Jitter”作数据点的offset,系统默认为不加任何显示信息。
40中国统计矩阵图中每个散点图所反映相关关系的变量为该散点图横向和纵向分别对应的变量。
如本例的矩阵图中右上角的散点图横向对应变量Pulse1,纵向对应变量Weight,所以该散点图反映了变量Pulse1和Weight间的相关关系。
从该矩阵图可见,变量Pulse1与变量Weight和Height间均不相关,变量Pulse2与变量Weight和Height间也均不相关,说明脉搏与体重和身高即人的体形均无关系,符合现实中的实际情况。
在变量Weight和Height的散点图中,一变量值随另一变量值的增加而增加,两者呈现出明显的正相关关系,反映了实际情况,一般体重会随身高的增加而增加。
散点图、边际图、矩阵图都是用来描述两变量间的相关关系,当只是分析两个变量间的关系时,选用一般的散点图即可;当同时要描述各个变量的分布情况时,选用边际图;若要在一张图表中同时分析多个变量间的关系,选用矩阵图。
各个图表关于相关关系的分析是一致的。
五、等高线图等高线图是将三个变量描绘在二维图表中,若横坐标和纵坐标分别代表变量x和y,则第三个变量z可看作是绘图平面内/外的延伸,图中阴影部分代表变量z的值。
Graph菜单下的ContourPlot是用来做等高线图的,在其主对话框中,分别输入变量x和y、z,其中的变量x和y分别设为等高线图的横坐标和纵坐标,变量z则作为第三变量。
DataDisplay选项可指定数据的显示形式:区域(Area)或连接线(Connect),同时可指定区域的填充颜色与大小以及连接线的种类、颜色与大小。
使用Minitab软件的自带数据Exh_grph.mtw,在ContourPlot主对话框中Z栏下选择输入Alt,Y栏下输入Lat,X栏下输入Long。
选择Area方块,并且单击Attributes,进入对话框,Filltype中输入1(1=solid),Fillcolor中输入415253,分别代表蓝色、灰色、红色、青色和绿色。
在等高线图中,阴影是XY平面上由等于z值的线条或线条所围成的区域所组成。
对等高线图的分析,也主要从这个角度进行。
本例分析的是经度、纬度与海拔高度间的关系。
六、多变量图六西格玛质量管理中,当研究多个指标时,可应用多变量图形象地描绘变量间的关系。
多变量图是以图示的方法来呈现连续性数值方差分析的数据,这些图也可以用于在做方差分析之前,先对数据有一些初步的形象了解。
这个图的实现不是在Graph菜单了,而是在Stat菜单下的QualityTools下的Multi-VariChart。