当前位置:文档之家› DOE--6sigma

DOE--6sigma

DOE--6sigma
DOE--6sigma

实验设计(Design of Experiment ,DOE)

1. 前言

研究统计分析而不谈实验设计就如只谈品管方法而不谈品质问题,这是本末倒置的。譬如工业上的品质问题受到人员、设备、材料、方法及及环境等许多因素的影响,而存在许多不可预知的的变异。如何依据实验的设计来观测实验的结果,以统计分析来验证归纳那些因素对品质问题有显著的影响,进而寻找更好的设计方法,更好的材料,更好的生产技术来解决品质问题。这是近代许多科学家、工程师、技术员及管理阶层一直在努力寻找的技术,至今已经有许多卓越的方法在各领域中应用而得到许多辉煌的成效。

实验设计早在1920年代 R.A.Fisher 在农业上小麦品种的遗传研究,已经使用多因素配置法对不同因素的每一水准组合进行实验,再用变异数分析来评价因素对实验问题的影响。但是当因素与水准的数目增加时,导致实验次数也增加,因此对实验执行的效果大打折扣。1940年代 D.J.Finney 提出多因素实验的部份实施法以期降低实验次数而又能保有实验的效果,更奠定了现代实验设计的基础。1950年代G.Taguchi 依既有的实验设计方法,以规格化的直交表来进行直交实验设计,使得工业界使用实验设计的可行性增高,再加上其以工程观念的产品研发过程;系统设计,参数设计及公差设计等所谓的『三次设计』,进行有系统的实验设计。1980年代这些技术经由英文出版而以『品质工程』为名推广至美国进而通行全世界的先进工业领域,纵使学术界对其技术的理论依据提出甚多疑点,但是站在工程实验设计的观点其技术仍是较为实用的方法。

以下对实验设计的专门术语及其基本理念作一解释,首先说明因果关系,此处因果即是因素与结果的关系,且因素与结果都能定性或定量,例如以产品品质特性受到人员、设备、材料、方法及及环境变动的影响,如(图1-1)所示。若以数学关系式(1-1)表示,Y 为结果,一般称之应变量,是我们实验的观测值或品质特性。k X X X ,,.........,21为影响结果的 k 个因素,一般称之自变量,是我们实验设计时考虑配置的因素。f为我们想找出的关系,在确定性的科学已经演绎出许多关系,在实验设计中我们并不贪求找出这种关系,只希望透过实验的观测知道那些因素对Y 有显著的影响,那些不显著,进而根据这些有影响的因素来寻找对Y 有利的条件。

ε+=).,,.........,(21k X X X f Y

(1-1)

关㏑

縤瞯

罽Μ瞯

Μ 瞯

筿溃

筿

筿瑈

ぃ▆瞯

翴计

ㄑ莱坝

硉丁

【图1-1】产品特性与因素

1. 反应值(Response Value)

实验观测的结果,如品质问题中工程人员关心的产品品质特性如【图1-1】,数学关系式的应变量Y;ε

+

=)

.,

,.........

,

(

2

1k

X

X

X

f

Y。一个实验反应值的选择非常重要,反应值是否能反应实验目的,决定实验的成败。

2. 因素(Factor)

对实验结果的反应值有影响的一系列原因中,在实验设计中特别提出考量而进行比较的称为因素,如品质问题中影响产品品质特性的原因如【图1-1】,数学关系式的自变量X1,X2,…,X k;ε

+

=)

.,

,.........

,

(

2

1k

X

X

X

f

Y。因素可以是定性或定量,例如定量以℃来表示温度,rpm表示转速,定性以A、B、C表示不同供货商,以早、中、晚班表示不同班别的人员。一个实验中可以只考虑一个因素或同时考虑多个因素。

3. 水准(Level)

实验中所考量的某个因素所处的定量或定性的状态或条件,例如温度的因素考虑在三个水准80℃、90℃、100℃下分别进行实验,或以早、中、晚班三个水准观察不同班别的人员。

4. 处置(Treatment)

实验中因素之间水准组合为一个可单独进行实验的观测条件称之一个处理,例如一个化学反应条件,产品设计的一个配方,制程的生产条件。若因素A有二

三个因素进行观测共有2×3×4=24个处理。 5. 主效应(Main Effect)

实验中某个因素的主效应为其各水准在其所在的处理反应值平均数之间的差值,例如一个因素只有二个水准,则其主效应为第一水准在其各处理反应值平均数与第二水准在其各处理反应值平均数之差。当一个因素有三个水准以上时,则其主效应为各不同水准平均数之间的之间的差值。如【表1-1】及【表1-2】的说明。

的主效应 21A A -=90-80=10 的主效应 21B B -=95-75=20

【表1-1】二水准的主效应

的主效应 21A A -

=83.3-73.3=10 的主效应 21B B -=95-75=20 的主效应 32B B -=75-65=10 的主效应 31B B -=95-65=30

【表1-2】三水准的主效应

6. 交互影响(Interaction)

实验中一个因素的效应在另一因素的不同水准下是不同的,则称两因素有交互影响。例如【表1-1】A 的效应在B 1之下为100-90=10,而在B 2之下为80-70=10,两者相同,故因素A 与B 没交互影响,如【图1-3】所示。若以【表1-3】A 的效应在B 1之下为100-70=30,而在B 2之下为80-100= -20,两者不相同,故因素A 与B 有交互影响。如【图1-4】所示。

1

2

【图1-3】因素A 与B 没交互影响

【表1-4】因素A 与B 有交互影响

1

2

100908070

【图1-4】因素A 与B 有交互影响

实验设计就是对提高产品品质、解决品质问题、研发新产品及其它为寻找事实真象所进行实验的规划、执行、分析及寻优验证。包括确立实验目标,选择对反应值有影响的因素及水准,设计实验进行的方法,分析实验处理的观测结果,估计合于实验目标的因素水准及进行确认实验。如何选择实验的因素及其水准,这是实验设计重要的问题。其基本原则如下:

1. 对于量测技术不完备而测不出数值的因素,譬如员工情绪的好坏;有些因素虽能测出数值但技术上无法控制在一定的水准或需很高的代价,譬如工业用水水质,大气温度;有些以专业技术就能断定影响很显著的因素,譬如铸模的沙与其含水率对通气度的影响,实验设计时尽可能不考虑这类因素。

2. 对能定量控制水准的因素而情况不明,技术人员意见纷岐的因素,则为实验设计时考量的因素。

3. 实验因素水准的确定包括水准数及水准量。水准数决定实验的规模;水准量的选取应以专业技术估计因素取值的范围,再确定水准量。水准数取二个n=2,只能以直线关系比较其大小或高低,水准数取三个以上n ≧3则能查验其非线性关系。

4. 因素增加实验的处理数急剧增加,假如5个因素之各水准数n=2,则处理数为

25=128,若10个因素就有210=1024个处理数。假如各因素之水准数为n=3,则处理数为五个因素的35=243,十个因素的310=59049。如此庞大的实验是很不可能进行的,因此要研究各种又快、又准、又省的实验设计。近代的实验设计的方法要应付七八个因素以致十几个因素已经不是难事了。

以下对实验设计的基本原理重复性、随机化、区集化及直交性作一解释。

1.重复性(REPLICATION)

重复是指在一实验的同一处理重复实验或重复测试,其目的是为了提高实验的精密度,因为平均值X的标准差为 n,其误差随重复次数增加而减小。此外,重复还对那些无法控制因素的影响提供平衡抵销的机会,从而有助于随机化,可作为减少偏差的手段。

【例1-1】:四种品牌的轮胎A、B、C、D 进行磨耗率的比较实验,品牌是实验的考虑因素。兹以四部汽车,每部汽车装一种品牌的轮胎四个进行测试,所以每种品牌的轮胎都有四次重复,其结果如【表1-4】:

【表1-4】设计1之轮胎实验

但是以上的实验有一个很明显因素干扰到轮胎品牌的比较,就是汽车的因素,不同部汽车其对轮胎的磨耗应有其差异,如何将此干扰因素消除,其方法很多。首先介绍以随机化的方式将其消除。

2. 随机化(RANDOMIZATION)

随机化就是在实验中不同处理的实验次序将其随机化,如将四部汽车的四个轮胎位置从1号编到16号,也将四个品牌的16个轮胎编号,再随机地将其配置于16个轮胎位置,如【表1-5】。随机化在实验时常造成管理上的麻烦,若该实验很难随机化或成本很高我们可以考虑其它的实验设计方法。

【表1-5】设计2之轮胎实验及其结果

设计2的变异数分析结果

假如四部汽车对轮胎磨耗的影响为ββββ1234,,,其结果:

4)2(44214

1βββ+++=∑=i i A A 4)2(443141βββ+++=∑=i i B B 4)(4432141ββββ++++=∑=i i C C

4)2(44314

1

βββ+++=∑=i i D D

完全随机化也有缺点,因随机配置的关系无法完全将汽车的干扰消除,有些汽车配置到同一品牌的轮胎两个以上或没配置到某一品牌的轮胎。所以我们对影响实验效果的因素将其各水准区分使得实验主因素的各水准都能公平的配置于其间。如轮胎品牌的比较实验,我们事先知道不同部汽车其对轮胎的磨耗应有差异,若将每部汽车的四个轮胎位置都配置上不同的四种牌,如此每种品牌的轮胎在四部汽车都出现过而真正消除汽车对轮胎品牌的比较实验的干扰,我们称此种方法为区集化。

3. 区集化(BLOCKING)

区集化就是将已知或未知影响实验效果的因素将其各水准区分,使得实验主因素的各水准都能公平的配置于其间,以消除其对实验效果的干扰。譬如不同部汽车其对轮胎的磨耗应有差异,若将每部汽车都配置上不同的四种品牌,如此每种品牌的轮胎都分摊了汽车之间的差异。通常影响实验效果的因素有时不祇一个,以轮胎品牌的比较实验为例,除了汽车对轮胎的磨耗有差异外,汽车的轮胎位置也有影响。下例为考虑一个区集因素及考虑两个区集因素的实验设计。

四种品牌的轮胎A 、B 、C 、D 进行磨耗率的比较实验,品牌是实验的考虑因素。兹以四部汽车,每部汽车装上四种品牌的轮胎进行测试,所以每种品牌的轮在每部汽车都会出现。也就是将四种品牌的轮胎个取一个为一组,共分四组,再将每一组随机地配置于每部汽车的每一个轮胎位置。这种实验设计称为随机区集

化设计,其结果如【表1-6】:

设计3的变异数分析结果

44)(4

14

1∑∑==+=+=i i i i i A A A ββ 44)(4

141∑∑==+=+=i i i i i B B B ββ

44)(4

14

1∑∑==+=+=i i i i i C C C ββ

44)(4

1

41

∑∑==+=+=i i i i i D D D ββ

4. 直交性( ORTHOGONALITY)

一实验设计之各因素各水准间的配置,如何能单独对一个因素的效应估计而不受其它因素变动的影响,如拉丁方格的设计就是符合直交性的配置。假如四种品牌的轮胎磨耗率的比较实验,四部汽车对磨耗率的差异分别是ββββ1234、、、及汽车轮胎位置对磨耗率的差异为γγγγ1234、、、,则因为拉丁方格的配置使得四种品牌的轮胎磨耗率经测试的结果大家都掺有汽车的影响βi ∑及轮胎位置的影响γi ∑。假如四种品牌的轮胎其磨耗率分别为A 、B 、C 、D ,经拉丁方格的配置每种品牌轮胎重复四次的磨耗率平均数如下式:

A A A i i i i i =++=++∑∑∑()βγβγ444

444

B B B i i i i i i i i =++=++===∑∑∑()βγβγ1

41

41

4

444

C C C i i i i i i i i =++=++===∑∑∑()βγβγ141414

444

D D D i i i i i i i i =++=++===∑∑∑()βγβγ1

4

1

4

1

4

444

以四种品牌的轮胎A 、B 、C 、D 每种四个轮胎共16次实验,每次实验的处理组合如【表1-7】,四种品牌的轮胎在每部汽车都会出现,同时也考虑汽车的每个轮胎位置都配置有不同品牌的轮胎。也就是将四种品牌的轮胎各取一个为一组,共分四组,同时将每一组轮胎配置于一部汽车上,而四部汽车的每一个轮胎位置

【表1-7】设计4之轮胎实验拉丁方格设计

2. 拉丁方格(Latin Squares)

将前面四种品牌的轮胎A、B、C、D想象成四种品种的实验水稻,将它们试种在四块实验田中,如何配置才不致受到土质地力的不同而影响观察稻米品种的产量,假如将四块田的每一块等分为四份,而将A、B、C、D四种品种的实验水稻平均种在四块田的一份中,如【图2-1】。此类配置的方法称为拉丁方格法,所谓拉丁方格就是A、B、C、D四个拉丁字母配置在4×4的方格行列位置上,各字母在每行每列各只出现一次,称为4×4的拉丁方格,如【图2-2】不同大小的拉丁方格。

【图2-1】拉丁方格法配置实验

2×2 3×3 4×4

【图2-2】拉丁方格

拉丁方格法配置实验的优点是可以消除会干扰主因素的不可控制因素的影响,使这两因素的影响不会混在起而影响到观察主因素的主效应。直交表就是以拉丁方格的基本原理设计的多因素实验配置法,其目的使各因素配置时计算主效应时可以独立的估计,而且可以事先将因素间的交互影响配置在可估计的因素上,除了可以估计其交互影响外;还可以知道交互影响与那个因素混在一起。

一般传统的实验为所谓的一次变更一个因素的实验,也就是每次实验只改变一个因素的水准而其它因素保持原来的水准,直到满意的效果出现。这种实验缺少全面性的计划;不知要多少实验次数及预算;更不知找出的实验处置是否受到其它因素的交互影响;同样的实验次数与直交实验提供的信息少的多。如【表2-1】。

【表2-1】一次变更一个因素之实验

另一种实验为完全的实验,即将各因素各水准的所有可能组合为实验的处置,一一去作实验,再比较那个处置较有效果。当然此种实验可以找出最好的实验处置,即生产条件,但实验成本太大。尤其考虑因素很多时,实验规模太大而不可能完成。一般假如有k个因素,每个因素有t i个水准(i=1,2,…,k),则完全的实验就需要t1×t2×…×t k次实验。以【表2-1】共有7个因素各有2个水准,共需要

2×2×2×2×2×2×2=27=128次实验,如【表2-2】。以工业实验是不可能执行的,工业实验要求时效及成本,利用直交表作实验,除了实验的统计效益外,可以减少实验次数,缩短实验周期,节省人力、物力。尤其当考虑因素多时,其经济效益更为显著。

3. 直交表(Orthogonal Array)

直交表是以拉丁方格的基本原理设计的多因素实验配置法,目前已经出版许多适用于各种不同需求的制式直交表。以下说明直交表的结构,一个直交表以下面符号表示

L n(t k)

L:拉丁方格(Latin Squares)的字头。

n:直交表的列数,也就是实验的处置数或是实验的条件数。

k:直交表的行数,也就是实验可考虑的因素个数。

t:直交表的行可考虑的水准数,也就是配置因素的水准数。

以下面两个典型的直交表L8(27)及L9(34)来说明直交表的结构,如【表2-3】及【表2-4】。

7

】L8(2)直交表

(1)每列代表一个实验处置,共有8种实验处置,即8种实验条件。

(2)每行配置一个实验因素,每行的1代表配置因素的第一水准;2代表配置因素

的第二水准,最多可配置7个因素,每个因素2个水准。

(3)每行各有4个1及4个2。

(4)每两行之间(1:1)、(1:2)、(2:1)、(2:2)各有2个,在统计上的义意为配置

这两行的因素为直交,其主效应的估计为相互独立的。

(5)交互作用配行表的义意为每两行之间配置的因素其交互作用出现的行数,如第

1、2行的交互影响出现在第3行,第

2、4行的交互影响出现在第6行。将各

行的1=+1,2=-1,则每两行的直积1?2=3,2?4=6。

【表2-4】L9(34)直交表

(1)每列代表一个实验处置,共有9种实验处置,即9种实验条件。

(2)每行配置一个实验因素,每行的1代表配置因素的第一水准;2代表配置因素

的第二水准;3代表配置因素的第三水准,最多可配置4个因素,每个因素3个水准。

(3)每行各有3个1、3个2及3个3。

(4)每两行之间(1:1)、(1:2)、(1:3)、(2:1)、(2:2)、(2:3)、(3:1)、(3:2)、

(3:3)各有1个,在统计上的义意为配置这两行的因素为直交,其主效应的估计为相互独立的。

(5)任两行的交互作用出现在其它两行,1?2=3?4、1?3=2?4、1?4=2?3。

下面为已经出版的许多适用于各种不同需求的制式直交表,提供读者参考应用。

3

7

4

11

注:任何两行的交互作用均与其它剩下的9行发

生部份交络现象,假如一定要估计交互作用的话,请勿用这张表。

15

5

素,应保持空行。

17

到其它各行。若要计算交互作用时可以利用第1行与第2行列出辅助表。第1行与第2行可以合并成为一个具有6水准的行,任何一对的交列作用都与其它各行部份交络。

6

素。

13

相关主题
文本预览
相关文档 最新文档