正交法方差分析详解
- 格式:doc
- 大小:98.00 KB
- 文档页数:4
第十一章正交设计试验资料的方差分析在实际工作中,常常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。
正交设计是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。
第一节、正交设计原理和方法(一)正交设计的基本概念正交设计是利用正交表来安排多因素试验、分析试验结果的一种设计方法。
它从多因素试验的全部水平组合中挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优水平组合。
例如,研究氮、磷、钾肥施用量对某小麦品种产量的影响:A因素是氮肥施用量,设A1、A2、A33个水平;B因素是磷肥施用量,设B1、B2、B33个水平;C因素是钾肥施用量,设C1、C2、C33个水平。
这是一个3因素每个因素3水平的试验,各因素的水平之间全部可能的组合有27种。
如果进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。
但全面试验包含的水平组合数较多,工作量大,由于受试验场地、经费等限制而难于实施。
如果试验的主要目的是寻求最优水平组合,则可利用正交设计来安排试验。
正交设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。
正交试验是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。
4)安排,试如对于上述3因素每个因素3水平试验,若不考虑交互作用,可利用正交表L9(3 验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。
一、正交设计的基本原理表11-133试验的全面试验方案正交设计就是从全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)4)从27个试验点中挑选出来的来进行试验。
图1中标有‘9’个试验点,就是利用正交表L9(3 9个试验点。
即:(1)A1B1C1(2)A1B2C2(3)A1B3C3(4)A2B1C2(5)A2B2C3(6)A2B3C1(7)A3B1C3(8)A3B2C1(9)A3B3C2上述选择,保证了A因素的每个水平与B因素、C因素的各个水平在试验中各搭配一次。
先列出一个表格 三因素,三水平 正交表为4列,9行正交表的作用:对于同一个因素的任一个水平,当实验组合中含有这个水平时,其他的参数取值是均匀的,没有重复.如B 因素取90这个水平时有三个组合,这三个组合为可以看出,在B 因素取90时,A 和C 因素分别取了没有重复的三个变量,即均匀的。
这有什么好处,下面引出方差分析中一些假设1. 实验的结果有一个期望值E 0值,这个E 0 值是所用参数可能取值得到的计算结果的期望值,而且假设计算结果是满足正态分布的。
即),(~20σE N X i 。
注意:E 0 不是这9个计算结果的平均值,这9个计算结果只是所有可能结果的9个样本而已,我们就是在用着9个样本来分析总体2. 对于单个参数而言,由于单个参数的任一水平的计算结果只受该参数影响,而不受其他参数的影响,所以单个参数的计算结果的期望和方差都应该满足)(20,σE N ,1、2这两条实际是为方差分析服务的。
3. 至于说在正交法中单个参数的计算结果只受该参数影响,而不受其他两个参数取值的影响,涉及了另一个假设:假设各个参数对计算结果的影响是独立的,也就是说计算结果是3个参数的作用的加和,比如说在B=30,C=64时,A 取12对计算结果的贡献是8。
当B=32,C=40时,A 取12对计算结果的贡献还是8。
当然,这都是理想状态,参数之间的作用肯定是有互相影响滴,这种影响叫做交互作用,而且,每次试验都有误差的,不可能互相没有影响,两次试验中A 对计算结果的贡献肯定是不相等的。
我们在试验时一般不急于考虑交互作用,且在我们这个项目中交互作用的影响比较小,查的文献中直接对交互作用闭口不提,所以就不考虑了。
这样的话不就可以列出各个参数下的计算结果的表达式了以B=90这个例子为例。
X 1=31=Y(A=80)+Y ’(A=80)+Y(B=90) +Y ’(B=90)+Y(C=5) +Y ’(C=5) X 4=53=Y(A=85)+Y ’(A=85)+Y(B=90) +Y ’(B=90)+Y(C=6) +Y ’(C=6) X 7=57=Y(A=90)+Y ’(A=90)+Y(B=90) +Y ’(B=90)+Y(C=7) +Y ’(C=7)其中Y (A=80)是理想状态下A 取80对计算结果的贡献,Y ’(A=80)是A 取80对计算结果贡献的实验误差。
其他的值也是一样道理,此不赘述。
把这三个式子相加,结果就是X1+X4+X7 =Y(A=80)+ Y(A=85)+ Y(A=90)+ Y(C=5) +Y(C=6) +Y(C=7)+ Y’(A=80)+ Y’(A=85)+ Y’(A=90)+ Y’(C=5) +Y’(C=6) +Y’(C=7)+3 Y(B=90) +3Y’(B=90)如何再算一下该参数在其他水平下的三个计算结果的加和,比如B=120时的三个计算X2+X5+X8 =Y(A=80)+ Y(A=85)+ Y(A=90)+ Y(C=5) +Y(C=6) +Y(C=7)+ Y’(A=80)+ Y’(A=85)+ Y’(A=90)+ Y’(C=5) +Y’(C=6) +Y’(C=7)+3 Y(B=120) +3Y’(B=120)怎么样?两个式子的红色部分是一样的,这就是正交表的好处所在,抵消了其他因素影响,两个式子结果的差值只是由B参数变化引起的。
而B有三个水平,可以得到三个这样的式子,这三个式子的差值的最大值再除以3就是极差。
即:B=90 X1+X4+X7= 141B=120 X2+X5+X8 =165B=150 X3+X6+X9=144极差为(165-141)/3=7同样,对于A和C,也可以求出极差,因为极差只反映由于参数本身的变化对结果的影响,所以极差越大,对最后结果的影响越大,也就是敏感度越高。
下面就可以说什么是方差分析了,本质是在极差的结果上进一步用平方的方法扩大结果的差异。
至于F检验,是基于数理统计的分析,下面具体说明。
设x为9次实验结果的平均值x=50总体的平方差为S T =291∑-)(xxi=984P=(1/9) (9x)2=22500W=291∑)(ix=23484简便计算可知:S T=W-P=984,与上面求得一致。
同理:对于单个参数而言,求单个参数的变差平方和。
还是以B参数为例,由B=90 X1+X4+X7= 141B=120 X2+X5+X8 =165B=150 X3+X6+X9=144将这三个数求平方和除以3得B的变差平方和S BS B=3[(141/3-50)2+(165/3-50)2+(144-50)2]=114化简的计算方法是:S B=Q B-P=(1412+1652+1442)/3 - 22500=22614-22500=114。
同样的方法求出S A S cS A = Q A -P=23118-22500=618 S c = Q C -P=22734-22500=234 S T =S A +S B +S c +S eS e 是误差平方和。
S e =S T -(S A +S B +S c )=18;这时候就可以说明为什么正交表要用4列了,也就是为什么空了一列出来如果将第四列也虚设一个参数设为D ,同样安排三个水平,并按正交表要求正确排列。
由D=1 X 1+X 5+X 8= 142 D=2 X 2+X 6+X 7 =157 D=3 X 3+X 4+X 9=155计算D 的变差平方和S D=Q D -P=(1422+1572+1552)/3 - 22500=22518-22500=18 发现了没有,S D = S e 。
这说明什么?我们在求误差平方和这一项的时候可以不通过公式S e =S T -(S A +S B +S c ),可以直接在空列(第4列)中按正交法的排列方法虚设上一组D 因素。
通过计算D 的变差平方和就可以得到误差平方和S e为什么会这么巧,这就是正交表设计的巧妙之处,要想达到这样的目的,正交表就会要求参数的个数,参数水平的个数,试验的组数满足一定的关系。
一般可以采用这种方式来设计正交表。
三个水平→需要32次的试验→需要(32-1)/(3-1)组参数下面说这关系的来历:由于我们在求总变差平方和时:S T =291∑-)(x x i =984表征的意思是各个试验结果和均值的偏差,前面在假设中提到,计算结果是满足正态分布),(~20σE N X i 。
所以多组试验的方差应该是2σ,我们的试验就是满足这个正态分布结果中的9个样本。
这九个样本的均值x 就被当做了正态分布中的0E 。
如果试验的组数是20组,那么求出的S T 一定比9组时求出的S T 大,故S T 是不能直接用来表征方差2σ的。
需要给S T 除以一个数得到均方,用均方与2σ对应,这个数就是传说中的自由度。
也许这时候我们会想当然的将S T 除以试验的组数,即样本的方差= S T /9。
其实不然,自由度的取值是根据具体的约束条件得到的。
对于所有9组试验,这9个结果满足一个约束条件:091=-∑=i ix n x就是这个约束关系约束了一个自由度,则对于所有9组试验的均方为S T /8。
对于单个参数的均方也是一样满足一个类似上式约束关系,所以自由度为3-1=2。
其实关于自由度的求解还涉及更深层次的推导,我们只需了解自由度概念就行了。
所以我们知道与S T 对应的自由度f T 是9-1=8,与单个参数对应的自由度f i 为3-1=2。
单个参数的变差平方和之和加上误差平方和等于总变差平方和S T =S A +S B +S c +S e,自由度也满足fe=f A +f B +f C +f e 在结合S e =S D 就不难理解为什么要加入一行,正交表为什么要满足这样的设计了。
所以:S T /f T 就是表征总结果对期望值的偏离S i /f i 就是表征单个参数的计算结果对期望值的偏离对于当个参数而言,如果偏离值越到,说明该参数取值对计算结果的影响越到,也就是越敏感。
我们又知道S i 的值来源于极差分析单个参数的计算结果的加和,所以说方差分析就是在极差分析的基础更进了一步,实际就是利用平方扩大了不同参数计算结果之间的差异。
到了这一步,单个参数计算结果对期望值的偏离S i /f i 已经可以求出来了,各个参数之间已经可以进行显著性相对的比较了。
但是方差分析还可以进一步的研究:我们知道所有计算结果都是正态分布中的9个样本,根据卡方分布的定义可知,各个参数的均方(就是上面说的偏离)正是满足卡方分布的。
两个卡方分布的商满足F 分布。
这个时候,我们可以这么理解,误差项的均方反映的是试验中非参数因素对试验结果的影响,而单个参数的均方是确定的某个参数对试验结果的影响,用单个参数的均方除以误差项的均分可以反映出已知参数对试验结果的有效程度和可信程度,即F=(S i /f i )/(S e /f e )。
又因为这个比值是满足F 分布,在F 分布中可以通过置信度水平α的确定来判断该比值是否可以在置信度水平α的容许范围之内,即F (α,f i ,f e )下面列出本例的计算结果说明一下:当误差项的自由度小于5时,可以考虑放松置信度,一般可以把0.2作为影响临界,把0.1作为显著临界。
如果误差项的自由度大于5,可把0.1作为影响临界,把0.05作为显著临界。
最后还要提一下交互作用的事情,在前面我们已经提到在这里忽略交互作用,实际上交互作用在有的情形下影响还是很大的,本例如果采用考虑交互作用,正交表的布局会发生变化,列数和行数都会增加,又因为正交法的两种分析方法的结果与相对敏感性的分析结果灰常一致,所以这里就做交互作用了,答辩的时候,老师不问则已,若问请一带而过。
说到这,方差分析的主要过程介绍完了,当然只是介绍了有关于正交法中较为简单情形的分析处理,正交法和方差分析还有很多内容需要我们去探究。