正交试验方差分析
- 格式:doc
- 大小:111.00 KB
- 文档页数:7
实验设计的方差分析与正交试验一、实验设计中的方差分析方差分析(analysis of variance,ANOVA)是一种统计方法,用于比较不同组之间的均值差异是否具有统计学上的显著性。
在实验设计中,方差分析主要被用来分析因变量(dependent variable)在不同水平的自变量(independent variable)中的变化情况。
通过比较不同组之间的方差,判断是否存在显著差异,并进一步分析差异的原因。
1. 单因素方差分析单因素方差分析是最简单的方差分析方法,适用于只有一个自变量的实验设计。
该方法通过比较不同组之间的方差来判断各组均值是否有差异。
步骤如下:(1)确定研究目的,选择合适的因变量和自变量。
(2)设计实验,确定各组的样本个数。
(3)进行实验,并收集数据。
(4)计算各组的平均值和总平均值。
(5)计算组内方差和组间方差。
(6)计算F值,通过计算F值来判断各组均值是否有显著差异。
2. 多因素方差分析多因素方差分析是在单因素方差分析的基础上,增加了一个或多个自变量的情况下进行的。
这种方法可以用来分析多个因素对因变量的影响,并判断各因素的主效应和交互效应。
步骤如下:(1)确定研究目的,选择合适的因变量和多个自变量。
(2)设计实验,确定各组的样本个数。
(3)进行实验,并收集数据。
(4)计算各组的平均值和总平均值。
(5)计算组内方差、组间方差和交互方差。
(6)计算F值,通过计算F值来判断各组均值是否有显著差异。
二、正交试验设计正交试验设计是一种设计高效实验的方法,可以同时考虑多个因素和各个因素之间的交互作用,并通过较少的试验次数得到较准确的结果。
1. 正交表的基本原理正交表的设计是基于正交原理,即每个因素和其他所有因素的交互效应都是独立的。
通过正交表设计实验,可以确保各因素和交互作用在样本中能够均匀地出现,从而减少误差来源,提高实验结果的可靠性。
2. 正交试验设计的步骤(1)确定要研究的因素和水平。
第十一章正交设计试验资料的方差分析在实际工作中,常常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。
正交设计是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。
第一节、正交设计原理和方法(一) 正交设计的基本概念正交设计是利用正交表来安排多因素试验、分析试验结果的一种设计方法。
它从多因素试验的全部水平组合中挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优水平组合。
例如,研究氮、磷、钾肥施用量对某小麦品种产量的影响:A因素是氮肥施用量,设A1、A2、A3 3个水平;B因素是磷肥施用量,设B1、B2、B3 3个水平;C因素是钾肥施用量,设C1、C2、C3 3个水平。
这是一个3因素每个因素3水平的试验,各因素的水平之间全部可能的组合有27种。
如果进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。
但全面试验包含的水平组合数较多,工作量大,由于受试验场地、经费等限制而难于实施。
如果试验的主要目的是寻求最优水平组合,则可利用正交设计来安排试验。
正交设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。
正交试验是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。
如对于上述3因素每个因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。
一、正交设计的基本原理表11-1 33试验的全面试验方案正交设计就是从全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)来进行试验。
图1中标有‘9 ’个试验点,就是利用正交表L9(34)从27个试验点中挑选出来的9个试验点。
即:(1)A1B1C1(2)A1B2C2(3)A1B3C3(4)A2B1C2(5)A2B2C3 (6)A2B3C1(7)A3B1C3(8)A3B2C1(9)A3B3C2上述选择,保证了A因素的每个水平与B因素、C 因素的各个水平在试验中各搭配一次。
正交试验设计2正交试验数据方差分析和贡献率分析正交试验设计是一种实验设计方法,通过选择适当的试验水平组合和设置统计模型,以减少试验阶段的试验次数和工作量,提高试验的效率和准确性。
正交设计通过对变量进行排列组合,使各变量的效应独立出现并减少副效应的影响,从而使实验结果更加可靠。
正交设计数据分析方法方差分析(ANOVA)是一种统计方法,用于测试在不同因素水平下的平均值是否相等。
在正交试验中,方差分析可以用于测试各个因子对试验结果的影响是否显著。
方差分析通常包括总体均值检验、各因子的效应检验以及误差项的检验。
通过方差分析可以确定哪些因子对试验结果的影响是显著的,进而确定最佳的试验条件。
贡献率分析是一种用于确定各个因子对试验结果的贡献程度的方法。
贡献率分析可以通过计算各个因子的均方根(RMS)值来确定各个因子的贡献程度。
贡献率可以用来排除一些不显著的因子,从而进一步优化试验条件。
1.节省试验次数和工作量:由于正交设计能够减少变量之间的相关性,可以通过较少的试验次数得到可靠的结果。
2.减少误差项:正交设计通过考虑副效应的影响,减少了试验误差的可能性,提高了数据的可靠性。
3.确定关键因素:正交设计通过方差分析和贡献率分析,可以确定对试验结果有着显著影响的关键因素,从而进行进一步优化。
4.灵活性:正交设计可以根据实验需求进行灵活的调整和改变,以适应多样的试验条件和目标。
总结正交试验设计是一种有效的实验设计方法,可用于减少试验次数和工作量,提高试验效率和准确性。
方差分析和贡献率分析是对正交设计数据进行进一步分析和总结的重要工具,可以帮助确定关键因素和优化试验条件。
正交试验设计能够在实验设计的早期阶段对各个因子进行全面考虑,从而为实验结果的有效性和可靠性打下基础。
正交试验⽅差分析(通俗易懂)第⼗⼀章正交设计试验资料的⽅差分析在实际⼯作中,常常需要同时考察 3个或3个以上的试验因素,若进⾏全⾯试验,则试验的规模将很⼤,往往因试验条件的限制⽽难于实施。
正交设计是安排多因素试验、寻求最优⽔平组合的⼀种⾼效率试验设计⽅法。
第⼀节、正交设计原理和⽅法(⼀) 正交设计的基本概念正交设计是利⽤正交表来安排多因素试验、分析试验结果的⼀种设计⽅法。
它从多因素试验的全部⽔平组合中挑选部分有代表性的⽔平组合进⾏试验,通过对这部分试验结果的分析了解全⾯试验的情况,找出最优⽔平组合。
例如,研究氮、磷、钾肥施⽤量对某⼩麦品种产量的影响:A因素是氮肥施⽤量,设A1、A2、A3 3个⽔平;B因素是磷肥施⽤量,设B1、B2、B3 3个⽔平;C因素是钾肥施⽤量,设C1、C2、C3 3个⽔平。
这是⼀个3因素每个因素3⽔平的试验,各因素的⽔平之间全部可能的组合有27种。
如果进⾏全⾯试验,可以分析各因素的效应,交互作⽤,也可选出最优⽔平组合。
但全⾯试验包含的⽔平组合数较多,⼯作量⼤,由于受试验场地、经费等限制⽽难于实施。
如果试验的主要⽬的是寻求最优⽔平组合,则可利⽤正交设计来安排试验。
正交设计的基本特点是:⽤部分试验来代替全⾯试验,通过对部分试验结果的分析,了解全⾯试验的情况。
正交试验是⽤部分试验来代替全⾯试验,它不可能像全⾯试验那样对各因素效应、交互作⽤⼀⼀分析;当交互作⽤存在时,有可能出现交互作⽤的混杂。
如对于上述3因素每个因素3⽔平试验,若不考虑交互作⽤,可利⽤正交表L9(34)安排,试验⽅案仅包含9个⽔平组合,就能反映试验⽅案包含27个⽔平组合的全⾯试验的情况,找出最佳的⽣产条件。
⼀、正交设计的基本原理表11-1 33试验的全⾯试验⽅案正交设计就是从全⾯试验点(⽔平组合)中挑选出有代表性的部分试验点(⽔平组合)来进⾏试验。
图1中标有‘9 ’个试验点,就是利⽤正交表L9(34)从27个试验点中挑选出来的9个试验点。
第十一章正交设计试验资料的方差分析在实际工作中,常常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。
正交设计是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。
第一节、正交设计原理和方法(一)正交设计的基本概念正交设计是利用正交表来安排多因素试验、分析试验结果的一种设计方法。
它从多因素试验的全部水平组合中挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优水平组合。
例如,研究氮、磷、钾肥施用量对某小麦品种产量的影响:A因素是氮肥施用量,设A1、A2、A33个水平;B因素是磷肥施用量,设B1、B2、B33个水平;C因素是钾肥施用量,设C1、C2、C33个水平。
这是一个3因素每个因素3水平的试验,各因素的水平之间全部可能的组合有27种。
如果进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。
但全面试验包含的水平组合数较多,工作量大,由于受试验场地、经费等限制而难于实施。
如果试验的主要目的是寻求最优水平组合,则可利用正交设计来安排试验。
正交设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。
正交试验是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。
4)安排,试如对于上述3因素每个因素3水平试验,若不考虑交互作用,可利用正交表L9(3 验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。
一、正交设计的基本原理表11-133试验的全面试验方案正交设计就是从全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)4)从27个试验点中挑选出来的来进行试验。
图1中标有‘9’个试验点,就是利用正交表L9(3 9个试验点。
即:(1)A1B1C1(2)A1B2C2(3)A1B3C3(4)A2B1C2(5)A2B2C3(6)A2B3C1(7)A3B1C3(8)A3B2C1(9)A3B3C2上述选择,保证了A因素的每个水平与B因素、C因素的各个水平在试验中各搭配一次。
4.2.3 正交试验的方差分析简单地说,方差分析是把试验观测数据分解为各个影响因素的波动和误差波动,然后将它们的平均波动进行比较。
其中心点是把试验观测数据总的波动分解为反映因素水平变化引起的波动和反映试验误差引起的波动两部分。
前者是由于因素本身的离散性而存在的方差,简称为产品方差,它是产品所固有的;后者是由于试验误差(也称残差)二引起的方差,简称为试验方差,它是由试验中的随机因素所引起的。
方差分析亦即把观测数据的总的偏差平方和(S T)分解为反映必然性的各个因素的偏差平方和(S A、S B、…S N)与反映偶然性的误差偏差平方和(S e),并计算比较它们的平均偏差平方和,以找出对试验观测数据起决定性影响的因素(即显著性或高度显著性因素)作为进行定量分析判断的依据。
前面讲过的直观分析法虽然简单明了,计算工作量少,便于普及推广,但它不能把试验过程中试验条件改变所引起的数据波动与试验误差引起的数据波动区分开,同时对影响试验结果的各因素的重要程度,不能给以精确的数量估计。
而方差分析能够为分析提供一个标准,判断各因素的作用是否显著,从而弥补了直观分析法的不足。
为了考察某个因素对指标的作用,必须将总误差分解为条件误差和试验误差,并比较之,作出因素对指标的作用是否显著的结论。
这种分析方法称为方差分析法。
由于试验过程中误差的影响,不能直接测得试验结果的真值,但可以用同一条件下试验结果的平均值来代替真值,这样可近似反映出误差的大小。
同时,对误差来说,它们的正负是没有意义的。
主要的是知道它们的绝对值在什么范围内波动,所以,取它们的差值的平方和就可得到。
F值的大小,可以用来判断因素水平对考察指标影响的显著性。
F值接近1,说明因素水平改变对考察指标的影响在误差范围内,即水平间无显著差异;F值越大,说明因素水平的改变对指标的影响,超过了试验误差造成的影响,即条件误差相对试验误差大得多。
第三节正交试验设计及其方差分析
在工农业生产和科学实验中,为改革旧工艺,寻求最优生产条件等,经常要做许多试验,而影响这些试验结果的因素很多,我们把含有两个以上因素的试验称为多因素试验.前两节讨论的单因素试验和双因素试验均属于全面试验(即每一个因素的各种水平的相互搭配都要进行试验),多因素试验由于要考虑的因素较多,当每个因素的水平数较大时,若进行全面试验,则试验次数将会更大.因此,对于多因素试验,存在一个如何安排好试验的问题.正交试验设计是研究和处理多因素试验的一种科学方法,它利用一套现存规格化的表——正交表,来安排试验,通过少量的试验,获得满意的试验结果.
1.正交试验设计的基本方法
正交试验设计包含两个内容:(1)怎样安排试验方案;(2)如何分析试验结果.先介绍正交表.
正交表是预先编制好的一种表格.比如表9-17即为正交表L4(23),其中字母L表示正交,它的3个数字有3种不同的含义:
(1) L4(23)表的结构:有4行、3列,表中出现2个反映水平的数码1,2.
列数
↓
L4 (23)
↑↑
行数水平数
(2)L4(23)表的用法:做4次试验,最多可安排2水平的因素3个.
最多能安排的因素数
↓
L4(23)
↑↑
试验次数水平数
(3) L4(23)表的效率:3个2水平的因素.它的全面试验数为23=8次,使用正交表只需从8次试验中选出4次来做试验,效率是高的.
L4(23)
↑↑
实际试验数理论上的试验数
正交表的特点:
(1)表中任一列,不同数字出现的次数相同.如正交表L4(23)中,数字1,2在每列中均出现2次.
(2)表中任两列,其横向形成的有序数对出现的次数相同.如表L4(23)中任意两列,
数字1,2间的搭配是均衡的.
凡满足上述两性质的表都称为正交表(Orthogonal table).
常用的正交表有L9(34),L8(27),L16(45)等,见附表.用正交表来安排试验的方法,就叫正交试验设计.一般正交表L p(n m)中,p=m(n-1)+1.下面通过实例来说明如何用正交表来安排试验.
例9.7 提高某化工产品转化率的试验.
某种化工产品的转化率可能与反应温度A,反应时间B,某两种原料之配比C和真空度D有关.为了寻找最优的生产条件,因此考虑对A,B,C,D这4个因素进行试验.根据以往的经验,确定各个因素的3个不同水平,如表9-18所示.
分析各因素对产品的转化率是否产生显著影响,并指出最好生产条件.
解本题是4因素3水平,选用正交表L9(34).
把表头上各因素相应的水平任意给一个水平号.本例的水平编号就采用表9-18的形式;将各因素的诸水平所表示的实际状态或条件代入正交表中,得到9个试验方案,如表9-20所示.
从表9-20看出,第一行是1号试验,其试验条件是:
反应温度为60℃,反应时间为2.5小时,原料配比为1.1∶1,真空度为500毫米汞柱,记作A1B1C1D1.依此类推,第9号试验条件是A3B3C2D1.
由此可见,因素和水平可以任意排,但一经排定,试验条件也就完全确定.按正交试验表9-20安排试验,试验的结果依次记于试验方案右侧,见表9-21.
2.试验结果的直观分析
正交试验设计的直观分析就是要通过计算,将各因素、水平对试验结果指标的影响大小,通过极差分析,综合比较,以确定最优化试验方案的方法.有时也称为极差分析法.
例9.7中试验结果转化率列在表9-21中,在9次试验中,以第9次试验的指标86为最高,其生产条件是A3B3C2D1.由于全面搭配试验有81种,现只做了9次.9次试验中最好的结果是否一定是全面搭配试验中最好的结果呢?还需进一步分析.
(1)极差计算
在代表因素A的表9-21的第1列中,将与水平“1”相对应的第1,2,3号3个试验结果相加,记作T11,求得T11=151.同样,将第1列中与水平“2”对应的第4,5,6号试验结果相加,记作T21,求得T21=183.
一般地,定义T ij为表9-21的第j列中,与水平i对应的各次试验结果之和(i=1,2,3; j=1,2,3,4).记T为9次试验结果的总和,R j为第j列的3个T ij中最大值与最小值之差,称为极差.
显然T=
3
1ij
i
T =
∑,j=1,2,3,4.
此处T11大致反映了A1对试验结果的影响,
T21大致反映了A2对试验结果的影响,
T31大致反映了A3对试验结果的影响,
T12,T22和T32分别反映了B1,B2,B3对试验结果的影响,
T13,T23和T33分别反映了C1,C2,C3对试验结果的影响,
T14,T24和T34分别反映了D1,D2,D3对试验结果的影响.
R j反映了第j列因素的水平改变对试验结果的影响大小,R j越大反映第j列因素影响越
大.上述结果列表9-22.
(2) 极差分析(Analysis of range)
由极差大小顺序排出因素的主次顺序:
主→次
B;A、D;C
这里,R j值相近的两因素间用“、”号隔开,而R j值相差较大的两因素间用“;”号隔开.由此看出,特别要求在生产过程中控制好因素B,即反应时间.其次是要考虑因素A和D,即要控制好反应温度和真空度.至于原料配比就不那么重要了.
选择较好的因素水平搭配与所要求的指标有关.若要求指标越大越好,则应选取指标大的水平.反之,若希望指标越小越好,应选取指标小的水平.例9.7中,希望转化率越高越好,所以应在第1列选最大的T31=185;即取水平A3,同理可选B3C1D3.故例9.7中较好的因素水平搭配是A3B3C1D3.
例9.8某试验被考察的因素有5个:A,B,C,D,E.每个因素有两个水平.选用正交表L8(27),现分别把A,B,C,D,E安排在表L8(27)的第1,2,4,5,7列上,空出第3,6列仿例9.7做法,按方案试验.记下试验结果,进行极差计算,得表9-23.
表9-23
j 的大小顺序排出因素的主次顺序为
主→次
A、B;D;C、E
最优工艺条件为A2B1C1D2E1.
表9-23中因没有安排因素而空出了第3,6列.从理论上说,这两列的极差R j应为0,但因存有随机误差,这两个空列的极差值实际上是相当小的.
3.方差分析
正交试验设计的极差分析简便易行,计算量小,也较直观,但极差分析精度较差,判断
因素的作用时缺乏一个定量的标准.这些问题要用方差分析解决.
设有一试验,使用正交表L p (n m ),试验的p 个结果为y 1,y 2,…,y p ,记
T =1
p
i i y =∑, y =11p i i T
y p p ==∑,
S T =
2
1
()
p
i
i y y =-∑
为试验的p 个结果的总变差;
S j =2
2
2111n
n ij ij i i T T T r T r
p r p ==⎛⎫-=- ⎪⎝⎭∑∑ 为第j 列上安排因素的变差平方和,其中r =p/n .可证明
S T =
1
m
i
j S
=∑
即总变差为各列变差平方和之和,且总变差S T 的自由度为p -1,第j 列变差S j 的自由度为
n -1.当正交表的所有列没被排满因素时,即有空列时,所有空列的S j 之和就是误差的变差平方和S e ,这时S e 的自由度f e 也为这些空列自由度之和.当正交表的所有列都排有因素时,即无空列时,取S j 中的最小值作为误差的变差平方和S e .
从以上分析知,在使用正交表L p (n m )的正交试验方差分析中,对正交表所安排的因素选用的统计量为:
F =
1j
e
e
S S n f -.
当因素作用不显著时,
F ~F (n -1,f e ),
其中第j 列安排的是被检因素.
在实际应用时,先求出各列的S j /(n -1)及S e /f e ,若某个S j /(n -1)比S e /f e 还小时,则这第j 列就可当作误差列并入S e 中去,这样使误差S e 的自由度增大,在作F 检验时会更灵敏,将
所有可当作误差列的S j 全并入S e 后得新的误差变差平方和,记为S e Δ,其相应的自由度为f e Δ
,这时选用统计量
F =
1
j e e
S S n f - ~F (n -1,f e Δ
). 例9.9 对例9.8的表9-23作方差分析.
表9-23
解 由表9-23的最后一行的极差值R j ,利用公式S j =2
211
n ij i T T r p
=-∑,得表9-24.
表9-24
表9-24中第3,6列为空列,因此S e =S 3+S 6=1.250,其中f e =1+1=2,所以S e /f e =0.625,而第7列的S 7=0.125,S 7/f 7=0.125/1=0.125比S e /f e 小,故将它并入误差. S e Δ=S e +S 7=1.375,f e Δ
=3.整理成方差分析表9-25.
表9-25
由于F 0.05(1,3)=10.13, F 0.01(1,3)=34.12,故因素A ,B 作用高度显著,因素C 作用不显著,因素D 作用显著,这与前面极差分析的结果是一致的.F 检验法要求选取S e ,且希望f e 要大,故在安排试验时,适当留出些空列会有好处的.前面的方差分析中,讨论因素A 和B 的交互作用A ×B .这类交互作用在正交试验设计中同样有表现,即一个因素A 的水平对试验结果指标的影响同另一个因素B 的水平选取有关.当试验考虑交互作用时,也可用前面讲的基本方法来处理.本章就不再介绍了.。