2k因子设计
- 格式:doc
- 大小:325.50 KB
- 文档页数:29
R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化数据分享原文链接:/?p=25921假设调查人员有兴趣检查减肥干预方法的三个组成部分。
这三个组成部分是:•记录食物日记(是/否)•增加活动(是/否)•家访(是/否)调查员计划调查所有,实验条件的组合。
实验条件为•要执行因子设计,您需要为多个因子(变量)中的每一个选择固定数量的水平,然后以所有可能的组合运行实验。
•这些因素可以是定量的或定性的。
•定量变量的两个水平可以是两个不同的温度或两个不同的浓度。
•定性因素可能是两种类型的催化剂或某些实体的存在和不存在。
符号:- 因子数 (3) - 每个因子的水平数 (2) - 设计中有多少实验条件 ()因子实验可以涉及具有不同水平数量的因子。
测试:考虑一个设计。
•有多少因子?•每个因子有多少个水平?•多少实验条件?答案:(a) 有 2+2+1 = 5 个因数。
(b) 两个因素有4个水平,2个因素有3个水平,1个因素有2个水平。
(c) 有 288 个实验条件。
向下滑动查看答案▼方差分析和因子设计之间的区别在 ANOVA 中,目标是比较各个实验条件。
让我们考虑一下上面的食物日记研究。
我们可以通过比较食物日记设置为 NO(条件 1-4)的所有条件的平均值和食物日记设置为YES(条件5-8)的所有条件的平均值来估计食物日记的效果。
这也被称为食物日记的主效应,形容词主要是提醒这个平均值超过了其他因素的水平。
食物日记的主效应是:体育锻炼的主效应是:家访的主效应是:使用了所有实验对象,但重新排列以进行每次比较。
受试者被回收以测量不同的效应。
这是析因实验更有效的原因之一。
执行因子设计要执行因子设计:•为每个因子选择固定数量的水平。
•以所有可能的组合运行实验。
我们将讨论每个因子只有两个水平的设计。
因素可以是定量的或定性的。
两个水平的定量变量可以是两个不同的温度或浓度。
定量变量的两个级别可以是两种不同类型的催化剂或某些实体的存在/不存在。
当有必要研究多因子对一反应变量的综合效果时,因子设计(Factorial Design)大量且普遍地应用于多因子的实验。
一最重要的情况是k个因子且各有2水准的状况(2k, Level Factor),此设计的完整反复需要2⨯2⨯…⨯2= 2k个观测值,且称之为2k因子设计(2k Factorial Design)。
本章重点将聚于此设计,另整章假设(1) 因子是固定的,(2) 设计是完全随机的,与(3) 一般的常态假设是满足的。
2k设计在实验工作的初期阶段,即当似乎有很多因子要研究时,是特别有效。
它提供了在一次完整因子设计里可以研究k个因子的最小次数。
因此,此种设计是大量应用于因子筛选实验(Factor Screening Experiments)。
因为每个因子只有2个水准,假设反应在选定的因子水准范围里是近似线性的,在很多因子筛选实验中,刚开始研究过(制)程或系统时,此假设是合理的。
6-22k设计(The 2k Design)在2k系列中首先讨论2个因子(22),A与B,各有2水准,此称之为22因子设计,因子水准可称之为”低”与”高”。
如,有一反应浓度和触媒量对化学反应过(制)程合格率效果的研究,令反应浓度为因子A,且有兴趣的2水准为15%与20%;另触媒量为因子B,且高水平为2 lbs与低水准为1 lb,实验反复3次,资料如下,图6-1 22设计之处理组合设计中的4个处理组合通常以小写字母表示,由上图知,在处理组合中任何因子的高水平以对应小写字母表示;处理组合中任何因子的低水准以对应字母的不出现表示。
依传统,(1)表示2因子都是在低水准,这个记号在整个2k系统都适用。
在22因子设计中,定义一个因子的平均效果为该因子水准改变所带来的反应改变。
同时,符号(1)、a、b、ab表示在处理组合下n次反复的总和,则在B为低水准时A的效果为[a-(1)]/n与在B为高水平时A的效果为[ab-b]/n,将此两者取平均即为A的主效果(Main Effect):A = {[a-(1)] + [ab-b]}/2nA = [ab + a - b - (1)]/2n (6-1)同理,B的主效果,即在A为低水准时B的效果为[b-(1)]/n 与在A为高水平时B的效果为[ab-a]/n,将此两者取平均,则为B = {[b-(1)] + [ab-a]}/2nB = [ab + b - a - (1)]/2n (6-2)定义交互作用(Interaction Effect) AB为B在高水平时A 的效果与B在低水准时A的效果间的平均差异,AB = {[ab-b]-[a-(1)]}/2n= [ab+ (1) - a - b]/2n (6-3)亦可定义AB 为A 在高水平时B 的效果与A 在低水准时B 的效果间的平均差异,其结果与式(6-3)同。
A 、B 与AB 效果的公式可用另一种方法导出,A 的效果可由图6-1中右边两个处理组合的平均反应(+A y )与左边两个处理组合的平均反应(或-A y )之差,即A = +A y - -A y = (ab + a) /2n – ( b – (1)) /2n= [ab + a – b – (1)] /2n此结果与式(6-1)完全一样。
同理,B 与AB 之效果,B = +B y - -B y = (ab + b) /2n – ( a – (1)) /2n= [ab + b – a – (1)] /2n此结果与式(6-2)亦完全一样。
AB = (ab + (1)) /2n – (a + b) /2n= [ab + (1) - b – a] /2n此结果与式(6-3)亦完全一样。
利用图6-1之实验数据,可估计出平均效果为, A = (90 + 100 - 60 - 80)/ 2(3) = 8.33 B = (90 + 60 - 100 - 80)/ 2(3) = -5.00AB = (90 + 80 - 100 - 60)/ 2(3) = 1.67◎A(反应物浓度)的效果是正的,即表示增加A,由从低水准的15%到高水平的25%会增加合格率。
◎B(触媒)的效果是负的,此意味过(制)程中触媒量的增加会降低合格率。
◎交互作用的效果相较于两个主效果是相当小的。
在2k设计的实验中,检视因子效果的『大小』(Magnitude)与『方向』(Direction)来决定何变量是重要的。
另ANOVA 是用来确认此种解释的。
考虑A、B与AB的平方和,式(6-1)是一个对比(Contrast)用以估计A,即Contrast A = ab + a - b – (1) (6-4)通称此对比为A的『总效果(Total Effect)』。
同理,由式(6-2)与(6-3)亦可用对比来估计B与AB。
再者,此3个对比是正交的(Orthogonal)。
任何对比的平方和可依式(3-29),即,SS A =[ab + a - b – (1)]2/4n (6-5)SS B =[ab + b - a – (1)]2/4n (6-6) 与SS AB =[ab + (1) - b - a]2/4n (6-7)为A、B与AB的平方和。
利用图6-1的实验数据,由式(6-5)、(6-6)、与(6-7)得,SS A =[ab + a - b – (1)]2/4n= (50)2/4(3) = 208.33 SS B =[ab + b - a – (1)]2/4n= (-30)2/4(3) = 75.00 (6-8)与 SS AB =[ab + (1) - b - a]2/4n= (10)2/4(3) = 8.33 而总平方和是以一般方式求得,即, SS T = n4y y 221i 21j 31k 2ijk ∙∙∙===-∑∑∑(6-9)= 9398.00 – 9075.00 = 323.00SS E = SS T – SS A – SS B – SS AB(6-10)= 323.00 – 208.33 – 75.00 – 8.33 = 31.34依上表(ANOV A),由P-值知,主效果均为统计上显着及因子间无交互作用。
依(1)、a、b、ab的顺序写下处理组合,称此为标准顺序(Standard Order, or Yates’ Order, for Dr. Frank Yates),亦可用以估计效果的对比系数为,如下表,注意,估计交互作用效果的对比系数正好是两个主效果系数的乘积。
对比系数永远均为+1或-1,如下表的『正负号表』(Table of Plus and Minus Signs)可用来决定每个处理组合的正确符号,上表中,”行”的标题为主效果A、B、交互作用AB、与I,I 代表整个实验的总和或平均,且对应到I 的”行”中均为正号。
而”列”表示处理组合。
欲估计任何效果的对比,只需将表中对应的符号乘以对应的处理组合后加总即可。
如,估计A,则对此为-(1)+a-b+ab,其结果与式(6-1)同。
回归模式(The Regression Model)对2k因子设计,用回归模式来表示实验结果,其回归模式为,y = β0 + β1x1+ β2x2 + ε其中,x1代表反应物浓度的『编码变量』(Coded Variable) (反应物浓度-Reactant Conc entration)、x2代表触媒量的编码变量(触媒量- Catalyst)、与β均为回归系数。
『原变量』(Natural Variables)与编码变量之间的关系为,x1 = [Conc-(Conc low+Conc high)/2]/ (Conc high-Conc low)/2与x2=[Catalyst-(Catalyst low+ Catalyst high)/2]/(Catalyst high- Catalyst low)/2 当原变量只有2水准时,则编码为-1或+1,x1 = [Conc-(15+25)/2]/ (25-15)/2 = (Conc-20)/5如果浓度是在高水平(Conc = 25%),即x1 = +1;如果浓度是在低水准(Conc = 15%),即x1 = -1。
再者,x2 = [Catalyst -(1+2)/2]/ (2-1)/2 = (Catalyst -1.5)/0.5 如果触媒量是在高水平(Catalyst = 2 lbs),即x2 = +1;如果触媒量是在低水准(Catalyst = 1 lb),即x2 = -1。
则配适后的回归模式为,yˆ = 27.5+(8.33/2)x 1 + (-5.00/2)x 2 其中,截距是12个观测值的总平均,与回归系数1ˆβ与2ˆβ为所对应的因子效果估计值的一半,回归系数正好是效果估计值一半的理由是回归系数度量的是x 的单位改变对y 平均的效果,而效果估计值是基于两个单位(从-1到+1)的改变,证明后续。
残差与模式适当性(Residuals and Model Adequacy)回归模式可以用来得到设计中4个点的y 值的预测值或配适值(The Predicted or Fitted Value),而残差即是观测值与配适值的差。
如,当反应物的浓度在低水准(x 1 = -1)与触媒量在低水准(x 2 = -1)时,则预测之格合率为,yˆ = 27.5+(8.33/2)x 1 + (-5.00/2)x 2 yˆ = 27.5+(8.33/2)(-1) + (-5.00/2)(-1) = 25.835 在此处理组合下有3个观测值,其残差为 e 1 = 28 - 25.835 = 2.165 e 2 = 25 - 25.835 = -0.835e 3 = 27 - 25.835 = 1.165同理可得其它的预测值与残差。
当反应物的浓度在高水平(x1 = +1)与触媒量在低水准(x2 = -1)时,则预测之格合率为,yˆ= 27.5+(8.33/2)x1 + (-5.00/2)x2yˆ= 27.5+(8.33/2)(+1)+ (-5.00/2)(-1) = 34.165在此处理组合下有3个观测值,其残差为e4 = 36 – 34.165= 1.835e5 = 32 –34.165 = -2.165e6= 32 – 34.165 = -2.165当反应物的浓度在低水准(x1 = -1)与触媒量在高水平(x2 = +1)时,则预测之格合率为,yˆ= 27.5+(8.33/2)x1 + (-5.00/2)x2yˆ= 27.5+(8.33)/2)(-1)+ (-5.00/2)(+1) = 20.835在此处理组合下有3个观测值,其残差为e7 = 18 – 20.835= -2.835e8 = 19 –20.835 = -1.835e9= 23 – 20.835 = 2.165当反应物的浓度在高水平(x1 = +1)与触媒量在高水平(x2 = +1)时,则预测之格合率为,yˆ= 27.5+(8.33/2)x1 + (-5.00/2)x2yˆ= 27.5+(8.33/2)(+1)+ (-5.00/2)(+1) = 29.165 在此处理组合下有3个观测值,其残差为e10 = 31 – 29.165= 1.835e11 = 30 –29.165 = 0.835e12= 29 – 29.165 = -0.165图6-2 化学过程实验之残差图反应曲线(The Response Surface)回归模式yˆ= 27.5+(8.33/2)x1 + (-5.00/2)x2可以用来产生反应曲面图。