正交试验设计及其方差分析
- 格式:doc
- 大小:102.00 KB
- 文档页数:6
实验设计的方差分析与正交试验一、实验设计中的方差分析方差分析(analysis of variance,ANOVA)是一种统计方法,用于比较不同组之间的均值差异是否具有统计学上的显著性。
在实验设计中,方差分析主要被用来分析因变量(dependent variable)在不同水平的自变量(independent variable)中的变化情况。
通过比较不同组之间的方差,判断是否存在显著差异,并进一步分析差异的原因。
1. 单因素方差分析单因素方差分析是最简单的方差分析方法,适用于只有一个自变量的实验设计。
该方法通过比较不同组之间的方差来判断各组均值是否有差异。
步骤如下:(1)确定研究目的,选择合适的因变量和自变量。
(2)设计实验,确定各组的样本个数。
(3)进行实验,并收集数据。
(4)计算各组的平均值和总平均值。
(5)计算组内方差和组间方差。
(6)计算F值,通过计算F值来判断各组均值是否有显著差异。
2. 多因素方差分析多因素方差分析是在单因素方差分析的基础上,增加了一个或多个自变量的情况下进行的。
这种方法可以用来分析多个因素对因变量的影响,并判断各因素的主效应和交互效应。
步骤如下:(1)确定研究目的,选择合适的因变量和多个自变量。
(2)设计实验,确定各组的样本个数。
(3)进行实验,并收集数据。
(4)计算各组的平均值和总平均值。
(5)计算组内方差、组间方差和交互方差。
(6)计算F值,通过计算F值来判断各组均值是否有显著差异。
二、正交试验设计正交试验设计是一种设计高效实验的方法,可以同时考虑多个因素和各个因素之间的交互作用,并通过较少的试验次数得到较准确的结果。
1. 正交表的基本原理正交表的设计是基于正交原理,即每个因素和其他所有因素的交互效应都是独立的。
通过正交表设计实验,可以确保各因素和交互作用在样本中能够均匀地出现,从而减少误差来源,提高实验结果的可靠性。
2. 正交试验设计的步骤(1)确定要研究的因素和水平。
正交试验设计2正交试验数据方差分析和贡献率分析正交试验设计是一种实验设计方法,通过选择适当的试验水平组合和设置统计模型,以减少试验阶段的试验次数和工作量,提高试验的效率和准确性。
正交设计通过对变量进行排列组合,使各变量的效应独立出现并减少副效应的影响,从而使实验结果更加可靠。
正交设计数据分析方法方差分析(ANOVA)是一种统计方法,用于测试在不同因素水平下的平均值是否相等。
在正交试验中,方差分析可以用于测试各个因子对试验结果的影响是否显著。
方差分析通常包括总体均值检验、各因子的效应检验以及误差项的检验。
通过方差分析可以确定哪些因子对试验结果的影响是显著的,进而确定最佳的试验条件。
贡献率分析是一种用于确定各个因子对试验结果的贡献程度的方法。
贡献率分析可以通过计算各个因子的均方根(RMS)值来确定各个因子的贡献程度。
贡献率可以用来排除一些不显著的因子,从而进一步优化试验条件。
1.节省试验次数和工作量:由于正交设计能够减少变量之间的相关性,可以通过较少的试验次数得到可靠的结果。
2.减少误差项:正交设计通过考虑副效应的影响,减少了试验误差的可能性,提高了数据的可靠性。
3.确定关键因素:正交设计通过方差分析和贡献率分析,可以确定对试验结果有着显著影响的关键因素,从而进行进一步优化。
4.灵活性:正交设计可以根据实验需求进行灵活的调整和改变,以适应多样的试验条件和目标。
总结正交试验设计是一种有效的实验设计方法,可用于减少试验次数和工作量,提高试验效率和准确性。
方差分析和贡献率分析是对正交设计数据进行进一步分析和总结的重要工具,可以帮助确定关键因素和优化试验条件。
正交试验设计能够在实验设计的早期阶段对各个因子进行全面考虑,从而为实验结果的有效性和可靠性打下基础。
第三节正交试验设计及其方差分析在工农业生产和科学实验中,为改革旧工艺,寻求最优生产条件等,经常要做许多试验,而影响这些试验结果的因素很多,我们把含有两个以上因素的试验称为多因素试验.前两节讨论的单因素试验和双因素试验均属于全面试验(即每一个因素的各种水平的相互搭配都要进行试验),多因素试验由于要考虑的因素较多,当每个因素的水平数较大时,若进行全面试验,则试验次数将会更大.因此,对于多因素试验,存在一个如何安排好试验的问题。
正交试验设计是研究和处理多因素试验的一种科学方法,它利用一套现存规格化的表——正交表,来安排试验,通过少量的试验,获得满意的试验结果。
1.正交试验设计的基本方法正交试验设计包含两个内容:(1)怎样安排试验方案;(2)如何分析试验结果.先介绍正交表.正交表是预先编制好的一种表格。
比如表9—17即为正交表L4(23),其中字母L表示正交,它的3个数字有3种不同的含义:(1) L4(23)表的结构:有4行、3列,表中出现2个反映水平的数码1,2.列数↓L4 (23)↑↑行数水平数(2) L4(23)表的用法:做4次试验,最多可安排2水平的因素3个。
最多能安排的因素数↓L4(23)↑↑试验次数水平数(3) L4(23)表的效率:3个2水平的因素.它的全面试验数为23=8次,使用正交表只需从8次试验中选出4次来做试验,效率是高的。
L4(23)↑↑实际试验数理论上的试验数正交表的特点:(1)表中任一列,不同数字出现的次数相同.如正交表L4(23)中,数字1,2在每列中均出现2次.(2)表中任两列,其横向形成的有序数对出现的次数相同.如表L4(23)中任意两列,数字1,2间的搭配是均衡的.凡满足上述两性质的表都称为正交表(Orthogonal table).常用的正交表有L9(34),L8(27),L16(45)等,见附表。
用正交表来安排试验的方法,就叫正交试验设计.一般正交表L p(n m)中,p=m(n—1)+1.下面通过实例来说明如何用正交表来安排试验。
例9。
7 提高某化工产品转化率的试验.某种化工产品的转化率可能与反应温度A,反应时间B,某两种原料之配比C和真空度D 有关。
为了寻找最优的生产条件,因此考虑对A,B,C,D这4个因素进行试验。
根据以往的经验,确定各个因素的3个不同水平,如表9—18所示.分析各因素对产品的转化率是否产生显著影响,并指出最好生产条件。
解本题是4因素3水平,选用正交表L9(34).把表头上各因素相应的水平任意给一个水平号.本例的水平编号就采用表9—18的形式;将各因素的诸水平所表示的实际状态或条件代入正交表中,得到9个试验方案,如表9-20所示。
从表9-20看出,第一行是1号试验,其试验条件是:反应温度为60℃,反应时间为2。
5小时,原料配比为1。
1∶1,真空度为500毫米汞柱,记作A1B1C1D1.依此类推,第9号试验条件是A3B3C2D1。
由此可见,因素和水平可以任意排,但一经排定,试验条件也就完全确定.按正交试验表9—20安排试验,试验的结果依次记于试验方案右侧,见表9—21.2。
试验结果的直观分析正交试验设计的直观分析就是要通过计算,将各因素、水平对试验结果指标的影响大小,通过极差分析,综合比较,以确定最优化试验方案的方法。
有时也称为极差分析法.例9。
7中试验结果转化率列在表9-21中,在9次试验中,以第9次试验的指标86为最高,其生产条件是A3B3C2D1.由于全面搭配试验有81种,现只做了9次。
9次试验中最好的结果是否一定是全面搭配试验中最好的结果呢?还需进一步分析.(1)极差计算在代表因素A的表9-21的第1列中,将与水平“1"相对应的第1,2,3号3个试验结果相加,记作T11,求得T11=151。
同样,将第1列中与水平“2”对应的第4,5,6号试验结果相加,记作T21,求得T21=183.一般地,定义T ij为表9-21的第j列中,与水平i对应的各次试验结果之和(i=1,2,3;j=1,2,3,4).记T为9次试验结果的总和,R j为第j列的3个T ij中最大值与最小值之差,称为极差.显然T=31ijiT =∑,j=1,2,3,4。
此处T11大致反映了A1对试验结果的影响,T21大致反映了A2对试验结果的影响,T31大致反映了A3对试验结果的影响,T12,T22和T32分别反映了B1,B2,B3对试验结果的影响,T13,T23和T33分别反映了C1,C2,C3对试验结果的影响,T14,T24和T34分别反映了D1,D2,D3对试验结果的影响.R j反映了第j列因素的水平改变对试验结果的影响大小,R j越大反映第j列因素影响越大。
上述结果列表9-22。
表9-22(2)极差分析(Analysis of range)由极差大小顺序排出因素的主次顺序:主→次B;A、D;C这里,R j值相近的两因素间用“、”号隔开,而R j值相差较大的两因素间用“;”号隔开.由此看出,特别要求在生产过程中控制好因素B,即反应时间.其次是要考虑因素A和D,即要控制好反应温度和真空度.至于原料配比就不那么重要了.选择较好的因素水平搭配与所要求的指标有关。
若要求指标越大越好,则应选取指标大的水平。
反之,若希望指标越小越好,应选取指标小的水平。
例9.7中,希望转化率越高越好,所以应在第1列选最大的T31=185;即取水平A3,同理可选B3C1D3.故例9.7中较好的因素水平搭配是A3B3C1D3.例9.8某试验被考察的因素有5个:A,B,C,D,E.每个因素有两个水平。
选用正交表L8(27),现分别把A,B,C,D,E安排在表L8(27)的第1,2,4,5,7列上,空出第3,6列仿例9。
7做法,按方案试验。
记下试验结果,进行极差计算,得表9-23.表9—23R j的大小顺序排出因素的主次顺序为主→次A、B;D;C、E最优工艺条件为A2B1C1D2E1.表9-23中因没有安排因素而空出了第3,6列。
从理论上说,这两列的极差R j应为0,但因存有随机误差,这两个空列的极差值实际上是相当小的。
3.方差分析正交试验设计的极差分析简便易行,计算量小,也较直观,但极差分析精度较差,判断因素的作用时缺乏一个定量的标准。
这些问题要用方差分析解决。
设有一试验,使用正交表L p (n m ),试验的p 个结果为y 1,y 2,…,y p ,记T =1pi i y =∑, y =11p i i Ty p p ==∑,S T =21()pii yy =-∑为试验的p 个结果的总变差;S j =222111nn ij ij i i T T T r T rp r p ==⎛⎫-=- ⎪⎝⎭∑∑ 为第j 列上安排因素的变差平方和,其中r =p/n 。
可证明S T =1mij S=∑即总变差为各列变差平方和之和,且S T 的自由度为p —1,S j 的自由度为n -1。
当正交表的所有列没被排满因素时,即有空列时,所有空列的S j 之和就是误差的变差平方和S e ,这时S e 的自由度f e 也为这些空列自由度之和。
当正交表的所有列都排有因素时,即无空列时,取S j 中的最小值作为误差的变差平方和S e 。
从以上分析知,在使用正交表L p (n m )的正交试验方差分析中,对正交表所安排的因素选用的统计量为:F =1jeeS S n f -.当因素作用不显著时,F ~F (n —1,f e ),其中第j 列安排的是被检因素.在实际应用时,先求出各列的S j /(n —1)及S e /f e ,若某个S j /(n -1)比S e /f e 还小时,则这第j 列就可当作误差列并入S e 中去,这样使误差S e 的自由度增大,在作F 检验时会更灵敏,将所有可当作误差列的S j 全并入S e 后得新的误差变差平方和,记为S e Δ,其相应的自由度为f e Δ,这时选用统计量F =1je eS S n f - ~F (n -1,f e Δ)。
例9。
9 对例9.8的表9-23作方差分析。
解 由表9-23的最后一行的极差值R j ,利用公式S j =2211n ij i T T r p=-∑,得表9—24.表9—24中第3,6列为空列,因此S e =S 3+S 6=1。
250,其中f e =1+1=2,所以S e /f e =0.625,而第7列的S 7=0.125,S 7/f 7=0.1251=0.125比S e /f e 小,故将它并入误差. S e Δ=S e +S 7=1.375,f e Δ=3.整理成方差分析表9—25.eeS f 818 由于F 0.05(1,3)=10.13, F 0.01(1,3)=34。
12,故因素A ,B 作用高度显著,因素C 作用不显著,因素D 作用显著,这与前面极差分析的结果是一致的.F 检验法要求选取S e ,且希望f e 要大,故在安排试验时,适当留出些空列会有好处的。
前面的方差分析中,讨论因素A 和B 的交互作用A ×B 。
这类交互作用在正交试验设计中同样有表现,即一个因素A 的水平对试验结果指标的影响同另一个因素B 的水平选取有关。
当试验考虑交互作用时,也可用前面讲的基本方法来处理.本章就不再介绍了。