当前位置:文档之家› 工程试验设计 回归正交试验设计

工程试验设计 回归正交试验设计

工程试验设计 回归正交试验设计
工程试验设计 回归正交试验设计

第一节 一次回归正交设计

一 正交设计和回归设计的特点

1 正交设计的特点

正交设计是一种很实用的试验设计方法,它利用较少的试验次数获得较好的试验结果;但是通过正交设计得到的优方案只是局限在确定的水平组合中,而不是一定试验范围内的最优方案。

2 回归设计

回归分析是一种有效的数据处理方法,通过所确定的回归方程,可对试验结果进行预测和控制;但是,它只能对试验数据进行被动的分析和处理,不涉及对试验设计的要求。

如果把两者的优势统一起来,不仅有合理的试验设计和较少的试验次数,还能建立有效的数学模型,这就是回归正交设计方法。

二 一次回归正交设计基本方法

一次回归正交设计就是利用回归正交设计原理,建立试验指标y 与m 个因素x 1、x 2、…、x m 之间的一次回归方程:

)(?1

k j x x b x b a y

j

k j k kj m

j j j ≠++=∑∑<=(k=1,2,…,m ) 如果不考虑交互作用,则一次回归方程为

m m x b x b x b a y

++++=...?2211 一次回归正交设计的基本步骤如下:

1 确定因素的变化范围

根据指标y ,确定需要考察的m 个因素x j (j=1,2,…,m ),并确定每个因素的取值范围。

设:x j 的变化范围为[x j 1,x j 2],分别称x j 1和x j 2为因素x j 的下水平和上水平,并将其算术平均值称为零水平,即

2

2

10j j j x x x +=

上水平与零水平之差或零水平与下水平之差称为x j 的变化间距j ?,即

2

1

21002j j j j j j j x x x x x x -=

-=-=?

例如,某试验中温度的变化范围为30-90℃,则其上水平为x j 2=90℃,x j 1=30℃,零水平x j 0=60℃,变化间距△j =30℃。

2 因素水平的编码

编码(coding )就是将x j 的各水平进行线性变换,即

j

j j j x x z ?-=

式中,z j ——x j 的编码。

显然,x j 1、x j 0、x j 2的编码分别为-1、0、+1,即z j 1=-1,z j 0=0,z j 2=+1。一般,x j 称为自变量,z j 称为规范变量。

因素水平的编码见表8-1。

表8-1 因素水平编码表

对因素水平进行编码的目的,是为了使每个因素的每个水平在编码空间是“平等”的,即规范变量z j 的取值范围在[-1,+1]内变化,不会受到自然变量x j 的单位和取值大小的影响。所以编码能将试验结果y 与因素x j 各水平之间的回归问题,转换为试验结果y 与因素z j 之间的回归问题,从而简化了回归计算量。

3 一次回归正交设计编码表

将二水平正交表中的“2”用“-1”代换,就可得到一次回归正交设计编码表。

例如,L 8(27)经过变换后得到的回归正交设计表如表8-2所示。 代换后,正交表中的编码不仅表示因素的不同水平,也表示因素水平数值上的大小。从表8-2可看出回归正交设计表具有如下特点:

(1)任意一列编码的和为零,即

01

=∑=n

i ji

z

(2)任意两列编码的乘积之和为零,即

)(01

k j z z

ki n

i ji

≠=?∑=

这些特点说明了转换之后的正交表同样具有正交性。

表8-2 一次回归正交设计编码表

4 试验方案的确定

在确定试验方案时,也要将规范变量z j 安排在一次回归正交编码表相应的列中,即进行表头设计。

例如,考察因素x 1、x 2和x 3,可选用L 8(27),根据L 8(27)的表头设计表,应将x 1、x 2和x 3分别安排在第1、2和4列,即将z 1、z 2和z 3安排在表8-2的第1、2和4列上。如果要考虑交互作用x 1x 2和x 1x 3,也可参考L 8(27)的交互作用表,将z 1z 2和z 1z 3分别安排在表8-2的第3、5列上。表头设计结果见表8-3。

表8-3 三因素一次回归正交表

从表8-3中看出,第3列的编码等于第1列和第2列编码的乘积,即交互作用列的编码等于表中对应两因素列编码的乘积。

表8-3中的第9、10号试验成为零水平试验或中心试验。安排零水平试验的目的是为了进行更精确的统计分析,得到精度较高的回归方程。

三 一次回归方程的建立

建立回归方程,关键是确定回归系数。

设总试验次数为n ,其包括m c 次二水平试验和m 0次零水平试验,即

0m m n c +=

如果试验结果为y i (i =1,2,…,n ),根据最小二乘原理和回归正交表的两个特点,可得到一次回归系数的计算公式:

y y n a n

i i ==∑=1

1

c

n

i i

ji j m y

z

b ∑==

1

)1(,...,2,1,)(1

-=>=

∑=m k k j m y

z z b c

n

i i

i

j k

kj

式中,z ji 表示z j 列各水平的编码,(z k z j )i 表示z k z j 列各水平的编码。 通过计算得到回归系数之后,可以直接根据它们绝对值的大小来判断各因素和交互作用的相对重要性,而不用转换成标准回归系数。另外,回归系数的符号反应了因素对试验指标影响的正负。

四 回归方程及偏回归系数的方差分析

1 无零水平试验 1.1 计算离差平方和

(1)总平方和

∑∑∑===-=-==n

i n

i i i

n i i yy T y n y y y L SS 1

21212

)(1)(

(2)回归平方和

∑∑+=kj j R SS SS SS

因素的偏回归平方和:

2j c j b m SS =

交互作用的偏回归平方和:

)1(,...,2,1,2

-=>=m k k j b m SS kj

c kj

(3)残差平方和

R T e SS SS SS -=

1.2 计算自由度

(1)总自由度

1-=n df T

(2)回归自由度

∑∑+=kj j R df df df

因素的自由度:

1=j df

交互作用的自由度

1=kj df

(3)残差自由度

R T e df df df -=

1.3 计算均方

j

j j df SS MS =

)1(,...,2,1,-=>=

m k k j df SS MS kj

kj kj

e

e

e d

f SS MS =

1.4 F 检验

e j j MS MS F =

e

kj kj MS MS F =

F j 服从自由度为(df j ,df e )的F 分布,对于给定的显著性水平α,若F j >F (df j ,df e ),说明因素z j 对试验指标有显著影响;否则无显著影响。

F kj 服从自由度为(df kj ,df e )的F 分布,对于给定的显著性水平 ,若F kj >F (df kj ,df e ),说明交互作用z k z j 对试验指标有显著影响;否则无显著影响。

2 有零水平试验

如果零水平的试验次数m 0≥2,则可进行回归方程的失拟性(lack of fit )检验。

2.1 F 检验的缺点

对回归方程进行显著性检验,只能说明相对于残差平方和而言,各因素对试验结果的影响是否显著。即使所建立的回归方程是显著的,也只是反映了回归方程在试验点上与试验结果拟合得较好,不能说明在整个研究范围内的拟合情况,应安排零水平试验,进行回归方程的失拟性检验,或称拟合度检验。

2.2 失拟性检验方法

设m 0次零水平试验结果为y 01、y 02、…、y 0m0,根据m 0次重复试验,可计算重复试验的误差为

∑∑∑===-=-=0

012001

2012

001)(1)(m i i m i i

m i i e y m y y y SS

试验误差的自由度为

101-=m df e

则,失拟平方和为

1e R T Lf SS SS SS SS --=

1e e Lf SS SS SS -=

失拟的自由度为

1e e Lf df df df -=

所以,有

1e Lf R e R T SS SS SS SS SS SS ++=+= 1e Lf R e R T df df df df df df ++=+=

这时,有

1

1//e e Lf Lf Lf df SS df SS F =

对于给定的显著性水平 (一般α=0.1),如果F Lf ≥F (df Lf ,df e1),说明失拟平方和中除误差外,还有其它因素的影响,需要进一步查明;如果F Lf

e

e R

R

e L

f e Lf R R df SS df SS df df SS SS df SS F //)/()(/112=++=

对于给定的显著性水平α,如果F 2≥F (df R , df e ),说明方程检验显著,即方程拟合得好;反之,说明方程拟合得不好,这可能是由于误差过大,或没有什么因素对y 有显著影响。

例题8-1 用石墨炉原子吸收分光光度计法测定食品中的铅,为提高测定灵

敏度,希望吸光度y 越大越好。试验中,讨论了x 1(灰化温度/℃)、x 2(原子化温度/℃)和x 3(灯电流/mA )三个因素对吸光度的影响,并考虑交互作用x 1x 2和x 1x 3。已知:x 1=300-700℃,x 2=1800-2400℃,x 3=8-10mA 。试通过一次回归正交试验确定吸光度与3个因素之间的函数关系式。 解:

(1)确定因素变化范围

因为x 1=300-700℃,所以其下水平x 11=300℃,x 12=700℃,则零水平

℃5002

7003002121110=+=+=x x x ,变化间距℃20050070010121=-=-=?x x 。

同理,可确定其他因素的下水平、上水平、零水平及变化区间。 (2)因素水平编码

根据公式j

j j j x x z ?-=

,对各因素进行编码,编码结果如表8-5所示。

表8-5 例8-1因素水平编码表

(3)正交表的选择和试验方案的确定

依题意,可以选用正交表L 8(27),经编码转换后,得到表8-2所示的回归正交表。入表8-6所示,将z 1、z 2、z 3分别安排在第1,2和4列,则第3和第5列分别为交互作用z 1 z 2,z 1 z 3列。不进行零水平试验,故总试验次数n

=8,试验结果也列在表8-6中(注:本例的试验方案和试验结果与例6-5是完全一样的)。 (4)回归方程的建立

依题意,m 0=0,n =m c =8。根据回归系数的计算公式,将有关计算列在表8-7中。

表8-6 例8-1 三元一次回归正交设计试验方案及试验结果

表8-7 例8-1 三元一次回归正交设计计算表

由表8-7得:

50475.08

038.411====∑=y y n a n i i

00975.08

078

.0111==

=

∑=c

n

i i

i

m y z

b 03375.08

270

.01

22==

=

∑=c

n

i i

i

m y z

b 00575.08

046

.01

33-=-=

=

∑=c

n

i i

i

m y z

b

00475.08

038

.0)(1

2112==

=

∑=c

n

i i

i

m y

z z b 00725.08

058

.0)(1

3113==

=

∑=c

n

i i

i

m y

z z b 所以回归方程为

312132100725.000475.000575.003375.000975.050475.0z z z z z z z y ++-++=y

由该回归方程中偏回归系数的大小,可以得到各因素和交互作用的主次顺序为:x 2﹥x 1﹥x 1x 3﹥x 3﹥x 1x 2,这与6-5中正交试验的分析结果一样的。 (5)方差分析

010864.08038.4049044.2)(1)(212

1

212

=-=-=-=∑∑∑===n

i n i i i

n

i i T y n y y y SS

000761.000975.082

211=?==b m SS c 009113.003375.082

222=?==b m SS c 000265.000575.082

233=?==b m SS c 000181.000475.082

21212=?==b m SS c 000421

.000725.082

21313=?==b m SS c 010741

.0000421.0000181.0000265.0009113.0000761.0=++

++=+=∑∑kj j R SS SS SS

000123.0010741.0010864.0=-=-=R T e SS SS SS 方差分析的结果见表8-8。

由表8-8,对于显著性水平α=0.05,只有因素z 2对试验指标y 有非常显著的影响,其他因素和交互作用对试验指标都无显著影响,故可以将z 1,z 3,z 1z 3,z 1z 2的平方和及自由度并入残差项,然后进行方差分析,这时的方差分析为一元方差分析,分析结果见表8-9。

表8-8 例8-1方差分析表

表8-9 例8-1第二次方差分析表

由表8-9,因素z 2对试验指标y 有非常显著的影响,因此原回归方程可以简化为:

y =0.50475+0.03375z 2

可见,只有原子化温度x 2对吸光度有显著影响,两者之间存在显著的线性关系,而且原子化温度取上水平时试验结果最好。

根据编码公式,将上述线性回归进行回代:

)3002100

(03375.050475.02-+=x y

整理后得到:20001125.049525.6x y +=

例8-2 从某种植物中提取黄酮类物质,为了对提取的工艺进行优化,选取了

三个相对重要的因素:乙醇浓度(x 1)、液固比(x 2)、和回流次数(x 3)进行了回归正交试验,不考虑交互作用。已知x 1=60%~80%

,x 2=8~12,x 3=1~3次。试通过回归正交试验确定黄酮提取率与三个因素之间的函数关系式。 解:(1)因素水平编码及试验方案的确定

由于不考虑交互作用,所以本例要求建立一个三元线性方程,因素水平编码如表8-10所示。选正交表L 8(27)安排试验,将三个因素分别安排在回归正交表的第1,2,4列,试验方案及试验结果见表8-11,表中的第9,10,11号试验为零水平试验。

表8-10 例8-2因素水平编码表

表8-11 例8-2试验方案及试验结果

(2)回归方程的建立

将有关计算过程列在表8-12中。

表8-12 例8-2试验结果及计算表

由计算表8-12得:

6182.611

8.7211===∑=n i i y n a

5125.08

1

.41

11==

=

∑=c

n

i i

i

m y z

b

5375.08

3

.41

22==

=

∑=c

n

i i

i

m y z

b 3125.08

5

.21

33==

=

∑=c

n

i i

i

m y z

b 所以回归方程为

3213125.05375.05125.06182.6z z z y +++=

由该回归方程偏回归系数绝对值的大小,可以得到各因素的主次顺序为:x 2﹥x 1﹥x 3,即液固比﹥乙醇浓度﹥回流次数。又由于各偏回归系数都为正,所以这些影响因素取上水平时,试验指标最好。 (3)回归方程显著性检验

有关平方和的计算如下:

296.5118.721.487)(1212

1

2=-=-=∑∑==n

i n i i i

T y n y SS

101.25125.082

211=?==b m SS c 311.25375.082222=?==b m SS c 781.03125.082233=?==b m SS c

193.5781.0311.2101.2=++==∑j R SS SS 103.0193.5296.5=-=-=R T e SS SS SS 方差分析结果见表8-13。

表8-13 例8-2 方差分析表

可见,三个因素对试验指标都有非常显著的影响,所建立的回归方程也非常显著。 (4)失拟性检验

本例中,零水平试验次数m 0=3,可以进行失拟行检验,有关计算如下:

00667

.0)6.65.66.6()56.4325.4256.43()(1212001

20100

=++-++=-=∑∑==m i i m i i

e y m y SS 0963.000667.0103.01=-=-=e e L

f SS SS SS

213101=-=-=m df e

5271=-=-=e e Lf df df df 这时,有

29.9)2,5(775.52

/00667.05

/0963.0//1.01

1=<==

=

F df SS df SS F e e Lf Lf Lf

检验结果表明,失拟不显著,回归模型与实际情况拟合得很好。 (5)回归方程的回代

根据编码公式:

107011-=x z ,2

1022-=x z ,1233-=x z 带入上述回归方程得:

)2(3125.0)2

10

(5375.0)1070(5125.06182.6321-+-+-+=x x x y

整理后得:

3213125.026875.05125.02818.0x x x y +++-=

第二节 二次回归正交组合设计

在实际生产和科学试验中,试验指标与试验因素之间的关系往往不宜用一次回归方程来描述,所以当所建立的一元回归方程经检验不显著时,就需用二次或更高次方程来拟合。

一 二次回归正交组合设计表

1 组合设计试验方案的确定

假设有m 个试验因素(自变量)x j (j =1,2,…,m),试验指标为因变量y ,则二次回归方程的一般形式为:

)(1,...,2,1?1

1

2k j m k x b x x b x b a y m

j j

k m

j j jj j k kj j j ≠-=+++=∑∑∑=<=

其中a 、b j 、b kj 、b jj 为回归系数,可以看出该方程共有1+m+m(m-1)/2+m=(m+1)(m+2)/2项,要使回归系数的估算成为可能,必要条

件为试验次数2

)

2)(1(++≥m m n ;同时,为了计算出二次回归方程的系数,

每个因素至少要取3个水平,所以用一元回归正交设计的方法来安排试验,往往不能满足这一条件。

例如,当因素数m =3时,二次回归方程的项数为10,要求试验次数n ≥10,如果用正交表L 9(34)安排试验,则试验次数不符合要求,如果进行全面试验,则试验次数未33=27次,试验次数又偏多。为解决这一矛盾,可以在一次回归正交试验设计的基础上再增加一些特定的试验点,通过适当的组合形成试验方案,即所谓的组合设计。

例如,设有两个因素x 1和x 2,试验指标为y ,则它们之间的二次回归方程为:

2

222211*********?x b x b x x b x b x b a y

+++++= 该方程共有3个回归系数,所以要求试验次数n ≥6,而二水平全面试验数为22=4次,显然不能满足要求,于是在次基础上再增加5次试验,试验方案如表8-14和图8-1所示。

可见,正交组合设计由三类试验点组成,即二水平试验点、星号试验点和零水平试验点。

二水平试验是一次回归正交试验设计中的试验点,设二水平试验的次数为m c ,若为全面试验(全实施),则m c =2m ;1/2实施时,m c =2(m-1);1/4实施时m c =2(m-2)。

表8-14 二元二次回归正交组合设计试验方案

由图8-1可以看出,5~8号试验点都在坐标轴上,用星号表示,所以被称作星号试验,它们与原点(中心点)的距离都为γ,称为星号臂或轴臂。星号试验次数m γ与试验因素数m 有关,即m γ=2m 。例如,对于二元二次回归正交组合设计,m γ=2×2=4。

零水平试验点位于图8-1的中心点(原点),即各因素水平编码都为零时的试验,该试验可只做一次,也可重复多次,零水平试验次数记为m 0。 所以,二次回归正交组合设计的总试验次数为:

n =m c +2m +m 0

类似的,如果有三个因素x 1,x 2和x 3,则它们的三元二次回归方程为:

23

3322222111322331132112332211?x b x b x b x x b x x b x x b x b x b x b a y +++++++++= 三元二次回归正交组合设计的实验方案见表8-15和图8-2。

表8-15 三元二次回归正交组合设计试验方案

如果将交互项列入组合设计表中,则可得到表8-16和表8-17。其中交互列和二次项列中的编码可直接由对应一次项的编码写出。例如,交互列z1z2的编码是对应z1和z2的乘积,而z12的编码是z1列编码的平方。

表8-16 二元二次回归正交组合设计

表8-17 三元二次回归正交组合设计

2星号臂长度与二次项的中心化

由表8-17和表8-18可以看出,增加了星号试验和零水平试验之后,二次项失去了正交性,就应该确定合适的星号臂长度,并对二次项进行中心化处理。

2.1 星号臂长度γ的确定

根据正交性的要求,可以推导出星号臂长度γ必须满足如下关系式:

2

)2(0c

c c m m m m m -++=

γ

可见,星号臂长度γ与因素m 、零水平试验次数m 0 及二水平试验m c 次数有关。为了设计的方便,将由上述公式计算出来的一些常用的γ值列于表8-18。

表8-18 二次回归正交组合设计γ值表

根据表8-18可知,对于二元二次回归正交组合设计,当零水平试验次数

m 0=1时,γ=1。

2.2 二次项的中心化

设二次回归方程中的二次项为z j 2 (j=1,2,…,m),其对应的编码用z ji 2 (j =1,2,…,n)表示,可以用下式对二次项的每个编码进行中心化处理:

∑=-='n i ji ji

ji z n z z 1

2

21

式中z ji '是中心化之后的编码。这样组合设计表中的z j 2列就变为z j '列。 表8-19是二次项中心化之后的二元二次回归正交组合设计编码表。

表8-19 二元二次回归正交组合设计编码表(m 0=1)

显然,中心化之后的二次项满足∑='0j z ,也就是具有正交性。 对于三元二次回归正交组合设计,也可用同样的方法得到具有正交性的组合设计编码表,见表8-20。

表8-20 三元二次回归正交组合设计编码表(m 0=1)

二 二次回归正交组合设计的基本步骤

二次回归正交组合设计的基本步骤如下:

1因素水平编码

确定因素x j (j =1,2,…,m )的变化范围和零水平试验的次数m 0,再根据星号臂长γ的计算公式(8-33)或表8-18确定γ的值,对因素水平进行编码,得到规范变量z j (j =1,2,…,m )。如果以x j2和x j 1分别表示因素x j 的上下水平,则它们的算术平均值就是因素x j 的零水平,以x j0表示。

假设:x j γ和x -j γ分别为因素x j 的上下星号臂水平,则x j γ和x -j γ是x j 的上下限,于是有

2

2

2

10γ

γj j j j j x x x x x -+=+=

所以,该因素的变化间距为

γ

γ0

j j j x x -=

?

然后对因素x j 进行线性变换,得到各水平编码为

j

j j j x x z ?-=

这样,编码公式将因素的实际取值x j 与编码值z j 一一对应起来了,如表8-21所示。编码后,因素的水平分别为-γ、-1、0、1、γ。

表8-21 因素水平的编码表

2 确定合适的二次回归正交组合设计

首先根据因素数m 选择合适的正交表进行变换,明确二水平试验方案、二水平试验次数m c 和星号实验次数m γ也能随之确定,可参考表8-22。

表8-22 二次回归正交组合设计正交表的选用

3 试验方案的实施

根据二次回归正交组合设计表确定的试验方案,进行n 次试验,得到n 个试验结果。

4 回归方程的建立

计算回归系数,建立含规范变量的回归方程。 回归系数的计算公式如下。

y y n a n

i i ==∑=1

1

m j z y

z

b n i ji

n

i i

ji j ,...,2,1)

(1

21='=

∑∑==

)1(,...,2,1,)

()(1

2

1-=>=

∑∑==m k k j z z y

z z b n

i j

k

n

i i

i

j k

kj i

m j z y

z b n

i ji

n

i i

ji jj ,...,2,1)

(1

2

1=''=

∑∑==

5 回归方程的显著性检验 5.1 平方和及其自由度

(1)总平方和及总自由度

∑∑∑===-=-==n

i n

i i i

n i i yy T y n y y y L SS 1

21212

)(1)(

1-=n df T

(2)偏回归平方和及其自由度

一次项偏回归平方和

m j z b SS ji

j j ,...,2,12

2==∑

交互项偏回归平方和

)1(,...,2,1,)

(1

22-=>=∑=m k k j z z b

SS n

i i

j k

kj

kj

二次项偏回归平方和

∑='=n

i ji

jj

jj z b

SS 1

2

2)

(

各项偏回归平方和的自由度均为1。 则,回归平方和及其自由度分别为

∑∑∑++=jj kj j R SS SS SS SS ∑∑∑++=jj kj j R df df df df

(5)残差平方和

R T e SS SS SS -=

回归正交试验设计

回归正交试验设计 一、概述 (1)回归分析与正交试验设计的主要优缺点 回归分析的主要优点是可以由试验数据求出经验公式,用于描述自变量与因变量之间的函数关系。它的主要缺点是毫不关心试验数据如何取得,这样,不仅盲目地增加了试验次数,而且试验数据还往往不能提供充分的信息。因此,有些工作者将经典的回归分析方法描述成:“这是撒大网,捉小鱼,有时还捉不到鱼”。所以说,回归分析只是被动地处理试验数据,并且回归系数之间存在相关关系,若从回归方程中剔除某个不显著因素时,需重新计算回归系数,耗费大量的时间。 正交试验设计的主要优点是科学地安排试验过程,用最少的试验次数获得最全面的试验信息,并对试验结果进行科学分析(如方差分析),从而得到最佳试验条件,但是它的主要缺点是试验结果无法用一个经验公式来表达,从而不便于考察试验条件改变后,试验指标将作如何变化。 (2)回归正交试验设计 回归正交试验设计,实际上就是将线性回归分析与正交试验设计两者有机地结合起来而发展出的一种试验设计方法,它利用正交试验设计法的“正交性”特点,有计划、有目的、科学合理地在正交表上安排试验,并将试验结果用一个明确的函数表达式即回归方程来表示,从而达到既减少试验次数、又能迅速地建立经验公式的目的。 根据回归模型的次数,回归正交试验设计又分为一次回归试验设计和二次回归试验设计。

二、一次回归正交试验设计 (一)一次回归正交试验设计的概念 一次回归设计研究的是一个因素z (或多个因素z 1,z 2,……)与试验指标y 之间的线性关系。当只研究一个因素时,其线性回归模型: y =β0+β1z +e (1) 其回归方程为: z y ∧ ∧ ∧ +=10ββ (2) 式中∧ 0β、∧ 1β称为回归系数,e 是随机误差,是一组相互独立、且服从正态分布N(0,σ2 )的随机变量。可以证明,∧0β、∧1β和∧ y 是β0、β1和y 的无偏估计,即 E(∧0β)=β0,E(∧1β)=β1,E(∧ y )=y 一次回归正交试验设计是通过编码公式x =f(z) ?? 即变量变换,将式(2)变为: b b y 10+=∧ (3) 且使试验方案具有正交性,即使得编码因素X的各水平之和为零: ∑==m i i x 1 (4) 式中m 是因素x 的水平数。 在回归分析中,回归系数的计算公式为:

正交试验设计方法 讲义及举例

正交试验设计方法讲义及举例 第5章 正交试验设计方法 5.1 试验设计方法概述 试验设计是数理统计学的一个重要的分支。多数数理统计方法主要用于分析已经得到的数据,而试验设计却是用于决定数据收集的方法。试验设计方法主要讨论如何合理地安排试验以及试验所得的数据如何分析等。 例5-1 某化工厂想提高某化工产品的质量和产量,对工艺中三个主要因素各按三个水平进行试验(见表5-1)。试验的目的是为提高合格产品的产量,寻求最适宜的操作条件。 对此实例该如何进行试验方案的设计呢? 很容易想到的是全面搭配法方案(如图5-1所示): 此方案数据点分布的均匀性极好,因素和水平的搭配十分全面,唯一的缺点是实验次数多达33=27次(指数3代表3个因素,底数3代表每因素有3个水平)。因素、水平数 愈多,则实验次数就愈多,例如,做一个6因素3水平的试验,就需36=729次实验,显然难以做到。因此需要寻找一种合适的试验设计方法。 试验设计方法常用的术语定义如下。 试验指标:指作为试验研究过程的因变量,常为试验结果特征的量(如得率、纯度等)。例1的试验指标为合格产品的产量。 因素:指作试验研究过程的自变量,常常是造成试验指标按某种规律发生变化的那些原因。如例1的温度、压力、碱的用量。 水平:指试验中因素所处的具体状态或情况,又称为等级。如例1的温度有3个水平。温度用T 表示,下标1、2、3表示因素的不同水平,分别记为T 1、T 2、T 3。

常用的试验设计方法有:正交试验设计法、均匀试验设计法、单纯形优化法、双水平单纯形优化法、回归正交设计法、序贯试验设计法等。可供选择的试验方法很多,各种试验设计方法都有其一定的特点。所面对的任务与要解决的问题不同,选择的试验设计方法也应有所不同。由于篇幅的限制,我们只讨论正交试验设计方法。 5.2 正交试验设计方法的优点和特点 用正交表安排多因素试验的方法,称为正交试验设计法。其特点为:①完成试验要求所需的实验次数少。②数据点的分布很均匀。③可用相应的极差分析方法、方差分析方法、回归分析方法等对试验结果进行分析,引出许多有价值的结论。 从例1可看出,采用全面搭配法方案,需做27次实验。那么采用简单比较法方案又如何呢? 先固定T 1和p 1,只改变m ,观察因素m 不同水平的影响,做了如图2-2(1)所示的三次实验,发现 m =m 2时的实验效果最好(好的用 □ 表示),合格产品的产量最高,因此认为在后面的实验中因素m 应取m 2水平。 固定T 1和m 2,改变p 的三次实验如图5-2(2)所示,发现p =p 3时的实验效果最好,因此认为因素p 应取p 3水平。 固定p 3和m 2,改变T 的三次实验如图5-2(3)所示,发现因素T 宜取T 2水平。 因此可以引出结论:为提高合格产品的产量,最适宜的操作条件为T 2p 3m 2。与全面搭配法方案相比,简单比较法方案的优点是实验的次数少,只需做9次实验。但必须指出,简单比较法方案的试验结果是不可靠的。因为,①在改变m 值(或p 值,或T 值)的三次实验中,说m 2(或p 3或T 2 )水平最好是有条件的。在T ≠T 1,p ≠p 1时,m 2 水平不是最好的可能性是有的。②在改变m 的三次实验中,固定T =T 2,p =p 3 应该说也是可以的,是随意的,故在此方案中数据点的分布的均匀性是毫无保障的。③用这种方法比较条件好坏时,只是对单个的试验数据进行数值上的简单比较,不能排除必然存在的试验数据误差的干扰。 运用正交试验设计方法,不仅兼有上述两个方案的优点,而且实验次数少,数据点分布均匀,结论的可靠性较好。 正交试验设计方法是用正交表来安排试验的。对于例1适用的正交表是L 9(34),其试验安排见表5-2。 所有的正交表与L 9(34)正交表一样,都具有以下两个特点: (1) 在每一列中,各个不同的数字出现的次数相同。在表L 9(34)中,每一列有三个水平,水平1、2、3都是各出现3次。 (2) 表中任意两列并列在一起形成若干个数字对, 不同数字对出现的次数也都相同。

正交试验设计常用正交表分析

选用正交表。根据提供的因素和水平进行正交表的选择, 选择的方法为试验的水平作为正 交表的水平, 试验的各个因素小于或等于正交表的列数,表格中没有数据的项空掉即可。 可以数据公式分析影响因子,也可以软件表征结果 (1) L 4(23) 任意两列间的交互作用为另外一列 (2) L 8(27) L 8(27)二列间的交互作用表 1 2 3 1 1 1 1 2 1 2 2 3 2 1 2 4 2 2 1 1 2 3 4 5 6 7 1 1 1 1 1 1 1 1 2 1 1 1 2 2 2 2 3 1 2 2 1 1 2 2 4 1 2 2 2 2 1 1 5 2 1 2 1 2 1 2 6 2 1 2 2 1 2 1 7 2 2 1 1 2 2 1 8 2 2 1 2 1 1 2 1 2 3 4 5 6 7 (1) 3 2 6 4 7 6 (2) 1 5 7 4 5 (3) 7 6 5 4 (4) 1 2 3 (5) 3 2 (6) 1 (7) 列 号 试 验 号 列 号 试 验 号 列 号 列 号

L 8(27)表头设计 1 2 3 4 5 6 7 3 A B A ×B C A ×C B ×C 4 A B A ×B C ×D C A ×C B ×D B ×C A ×D D 4 A B C ×D A ×B C B ×D A ×C D B ×C A ×D 5 A D ×E B C ×D A × B C ×E C B ×D A ×C B ×E D A × E B ×C E A ×D (3) L 8(4×24) L 8(4×24)表头设计 1 2 3 4 5 2 A B (A ×B)1 (A ×B)2 (A ×B)3 3 A B C 4 A B C D 5 A B C D E 1 2 3 4 5 1 1 1 1 1 1 2 1 2 2 2 2 3 2 1 1 2 2 4 2 2 2 1 1 5 3 1 2 1 2 6 3 2 1 2 1 7 4 1 2 2 1 8 4 2 1 1 2 列 号 因 子 数 列 号 试 验 号 列 号 因 子 数

二次回归正交试验

二次回归正交试验 为了检测某种原料的吸水倍率,重点考察氮肥含量和催化剂对试验指标的影响,已知氮肥含量(x1)的变化范围为0.7~0.9,催化剂(x2)的变化范围为1~3 mL,用二次正交组合设计分析出这两个因素与试验指标(y)之间的关系。 (1)因素水平编码 计算依据 m=2,取m0=2,根据星号臂γ计算公式或查表得γ=1.078 X(1γ)=0.9 ,x(-1γ)=0.7, x(10)=0.8 Δ1=(0.9-0.8)/1.078=0.093 X(2γ)=3 ,x(-1γ)=1, x(10)=2 Δ2=(3-2)/1.078=0.93

(2)试验方案 借助excel分析如下:

①回归方程显著性检验:F=186.5564,, ,12.4)74(95.0=F 因此回归方程非常显著。 '74.41'37.2375.656.2609.952.468y 212121z z z z z z ----+= ②偏回归系数的显著性检验 9 .496.113305.113806.113308.47058.14583.1822.44615.5528.4705701.274.41)(8.1458701.224.23)(3.182475.6)(2 .4461324.656.265.552324.609.95.113801046852206303)(122111221221222222221 121111221 21212 1222 1222222 112112212 1 =-=-==++++=++++==?===?===?===?===?===-=-=∑∑∑∑∑∑∑=======R T e R n i i n i i n i n i i n i i n i i n i i T SS SS SS SS SS SS SS SS SS z b SS z b SS z z b SS z b SS z b SS y n y SS 方差分析: dfT=n-1=10-1=9 df1=df2=df12=df1’=df2’=1

一次回归正交设计

第五讲回归设计及统计分析 设目标性状y与z1、z2……z m等因素有关,我们可以应用回归分析的方法建立y与诸因素的回归方程,以此对y进行预测和控制,或筛选y的最优指标。z1、z2……z m构成一个因子空间,每一组z1、z2……z m值对应一个y值。如何在因子空间中选择最适当的试验点,以最少的试验点寻求y的最优区域,这就要将回归分析与正交设计结合起来应用,称为回归正交设计。按回归模型的次数,回归正交设计又分为一次回归正交设计和二次回归正交设计。 一、一次回归正交设计 一次回归正交设计主要是应用2水平正交表进行设计,其设计和分析步骤如下。 1.确定试验因素的变化范围

例如研究m 个栽培因素z 1、z 2……z m 与作物产量y 的数量关系,首先需确定各个栽培因素的变化范围。设因素z j 的变化区间为(z 1j ,z 2j ),则z 1j 和z 2j 分别为因素z j 的下水平和上水平。那么 1202j j j z z z += 为因素z j 的零水平。 212j j j z z ?=- 为因素z j 的变化区间。 2.对各因素的水平编码 编码就是对各个因素的取值作如下线性变换: 0j j j j z z x =?-

式中x j 为编码值。如: 101211212 12j j j j j j j j j z z z z z x z z =?-+--==- 0000j j j j z z x =?-= 201222212 12j j j j j j j j j z z z z z x z z =?+--==- 这样就建立了z j 与x j 的一一对应关系: 下水平 z 1j x 1j (-1)

正交实验设计方法--非常有用

L9(34) 序号 1 2 3 4 1 1 1 1 1 2 1 2 2 2 3 1 3 3 3 4 2 1 2 3 5 2 2 3 1 6 2 3 1 2 7 3 1 3 2 8 3 2 1 3 9 3 3 2 1 回首页 正交试验设计法 正交试验设计法的基本思想 正交表 正交表试验方案的设计 试验数据的直观分析 正交试验的方差分析 常用正交表 1.正交试验设计法的基本思想 正交试验设计法,就是使用已经造好了的表格--正交表--来安排试验并进行数据分析的一种方法。它简单易行,计算表格化,使用者能够迅速掌握。下边通过一个例子来说明正交试验设计法的基本想法。 [例1]为提高某化工产品的转化率,选择了三个有关因素进行条件试验,反应温度(A),反应时间(B),用碱量(C),并确定了它们的试验范围: A:80-90℃ B:90-150分钟 C:5-7% 试验目的是搞清楚因子A、B、C对转化率有什么影响,哪些是主要的,哪些是次要的,从而确定最适生产条件,即温度、时间及用碱量各为多少才能使转化率高。

试制定试验方案。 这里,对因子A,在试验范围内选了三个水平;因子B和C 也都取三个水平: A:Al=80℃,A2=85℃,A3=90℃ B:Bl=90分,B2=120分,B3=150分 C:Cl=5%,C2=6%,C3=7% 当然,在正交试验设计中,因子可以是定量的,也可以是定性的。而定量因子各水平间的距离可以相等,也可以不相等。 这个三因子三水平的条件试验,通常有两种试验进行方法: (Ⅰ)取三因子所有水平之间的组合,即AlBlC1,A1BlC2,A1B2C1,……,A3B3C3,共有 33=27次 试验。用图表示就是图1 立方体的27个节点。这种试验法叫做全面试验法。 全面试验对各因子与指标间的关系剖析得比较清楚。但试验次数太多。特别是当因子数目多,每个因子的水平数目也多时。试验量大得惊人。如选六个因子,每个因子取五个水平时,如欲做全面试验,则需56=15625次试验,这实际上是不可能实现的。如果应用正交实验法,只做25次试验就行了。而且在某种意义上讲,这25次试验代表了15625次试验。 图1 全面试验法取点.......... (Ⅱ)简单对比法,即变化一个因素而固定其他因素,如首先固定B、C于Bl、Cl,使A变化之: ↗A1 B1C1 →A2 ↘A3 (好结果) 如得出结果A3最好,则固定A于A3,C还是Cl,使B变化之: ↗B1 A3C1 →B2 (好结果) ↘B3 得出结果以B2为最好,则固定B于B2,A于A3,使C变化之: ↗C1 A3B2→C2 (好结果) ↘C3 试验结果以C2最好。于是就认为最好的工艺条件是A3B2C2。 这种方法一般也有一定的效果,但缺点很多。首先这种方法的选点代表性很差,如按上述方法进行试验,试验点完全分布在一个角上,而在一个很大的范围内没有选点。因此这种试验方法不全面,所选的工艺条件A3B2C2不一定是27个组合中最好的。其次,用这种方法比较条件好坏时,是把单个的试验数据拿来,进行数值上的简单比较,而试验数据中必然要包含着误差成分,所以单个数据的简单比较不能剔除误差的干扰,必然造成结论的不稳定。

正交试验设计步骤(教学参考)

正交试验设计步骤 1 在SPSS中手动录入数据。请注意写入空白列。 2 点击数据→正交设计→生成,出现“生成正交设计”对话框。按因素水平表进行赋值, 空白列的赋值为1“1”,2“2”,3“3”

3 点击“数据”→“正交设计”→“显示”, 空白列的D可不加到右边的“因子”框中。 4 测量数据填入表8中的“STATUS_”列的相应单元格中 5单击“分析”→“一般线性模型”→“单变量” 注意不要选“空白列” 6 单击“对比”→选择“简单”

7 单击“模型”→选择“设定”→将“A”、“B”、“C”选入右边的“模型”中→单击“构建项”中的“主效应”, 8 单击“选项”→将“因子与因子交互”中的“A”、“B”、“C”选入“显示均值”中→勾选“比较主效应”, 9 结果分析 (1)方差分析结果 主体间因子 值标签N

硬脂酸钠溶液浓度 1 40 3 2 50 3 3 60 3 硫酸铝溶液浓度 1 40 3 2 50 3 3 60 3 浸渍时间 1 5 3 2 15 3 3 20 3 主体间效应的检验 因变量:STATUS_ 源III 型平方 和df 均方 F Sig. 校正模型733.073a 6 122.179 35.690 .028 截距10588.410 1 10588.410 3093.012 .000 A 423.487 2 211.743 61.853 .016 B 305.060 2 152.530 44.556 .022 C 4.527 2 2.263 .661 .602 误差 6.847 2 3.423 总计11328.330 9 校正的总计739.920 8 a. R 方 = .991(调整 R 方 = .963) 根据正交试验方差分析可知,硬脂酸钠溶液浓度和硫酸铝溶液浓度对试验指标的影响非常显著,而处理时间对试验指标的影响不显著。影响程度的大小也有差异,A>B (2)单因素统计量分析 1. 硬脂酸钠溶液浓度 估计 因变量:STATUS_ 硬脂酸钠溶液浓度 均值标准误差 95% 置信区间下限上限 dimensio n140 25.600 1.068 21.004 30.196 50 34.933 1.068 30.337 39.530 60 42.367 1.068 37.770 46.963

一次回归正交设计例子

一次回归正交设计 某冶炼厂排出的废水中含有大量的镉、鉮、铅等有害元素,对环境造成严重污染。考察的试验因素为温度(x1)、碱与硫酸亚铁之比(x2)以及硫酸亚铁用量(x3)对指标除镉效率(y)的影响。不考虑交互作用。已知x l=60~80℃,x2=8~12,x3=1~3ml。 (1)因素水平编码及试验方案的确定 表1 因素水平编码表 编码z j温度(x1) 碱与硫酸亚铁之比 (x2)硫酸亚铁用量 (x3) -1 60 8 1 0 70 10 2 1 80 1 2 3 △j 10 2 1 由于不考虑交互作用,所以建立一个三元线性方程。因素水平编码如表1所示。选正交表L8(27)安排试验,将三个因素分别安排在回归正交表的第1、2、4列,试验方案及试验结果见表2,表中的第9、 10、11号试验为零水平试验。 表2 试验方案及试验结果 试验 号z1 z2 z3 温度(x1) 碱与硫酸亚 铁之比(x2) 硫酸亚铁用 量(x3) 除镉效率 y/% 1 1 1 1 80 1 2 3 8.0 2 1 1 -1 80 12 1 7. 3

3 1 -1 1 80 8 3 6. 9 4 l -1 -l 80 8 l 6.4 5 -1 1 1 60 12 3 6.9 6 -1 1 -1 60 12 1 6.5 7 -1 -1 l 60 8 3 6.0 8 -1 -1 -1 60 8 1 5.1 9 0 0 0 70 10 2 6.6 10 0 0 0 70 10 2 6.5 11 0 0 0 70 10 2 6.6 ⑵回归方程的建立 表3试验结果及计算表 提取率y y2 z1y z2y z3y 试验号z1 z2 z3 /% 1 1 1 1 8.0 64.00 8.0 8.0 8.0 2 1 1 -1 7. 3 53.29 7.3 7.3 -7.3 3 l -1 1 6.9 47.61 6.9 -6.9 6.9 4 1 -1 -1 6.4 40.96 6.4 -6.4 -6.4 5-1 1 1 6.9 47.61 -6.9 6.9 6.9 6 -1 1 -1 6.5 42.25 -6.5 6.5 -6.5 7 -1 -1 1 6.0 36.00 -6.0 -6.0 6.0 8 -1 -1 -1 5.1 26.01 -5.1 -5.1 -5.1

正交试验设计

正交试验设计 1 正交试验设计的概念及原理 1.1 基本概念 利用正交表来安排与分析多因素试验的一种设计方法。 特点:在试验因素的全部水平组合中,仅挑选部分有代表性的水平组合进行试验。 通过部分实施的试验结果,了解全面试验情况,从中找出较优的处理组合。 考察增稠剂用量、pH 值和杀菌温度对豆奶稳定性的影响。每个因素设置3个水平进行试验 。 全面试验:可以分析各因素的效应,交互作用,也可选出最优水平组合。 全面试验包含的水平组合数较多,工作量大,在有些情况下无法完成 。 若试验的主要目的是寻求最优水平组合,则可利用正交表来设计安排试验。 ● 正交试验是用部分试验来代替全面试验的,它不可能像全面试验那样对各因素效应、交互作用一一分析; ● 当交互作用存在时,有可能出现交互作用的混杂。 ● 虽然正交试验设计有上述不足,但它能通过部分试验找到最优水平组合,因而很受实际工作者青睐。 1.2 基本原理 在试验安排中,每个因素在研究的范围内选几个水平, 可以理解为在选优区内打上网格, 如果网上的每个点都做试验,就是全面试验。 3个因素的选优区可以用一个立方体表示。 3个因素各取3个水平,把立方体划分成27个格点。 若27个网格点都试验,就是全面试验。 A2 A3 A1B1C1 B3 B2 A 因素:增稠剂用量,A1、A2、A3 B 因素:pH ,B1、B2、B3 C 因素:杀菌温度,C1、C2、C3 3因素 3水平 33 =27

1.2 基本原理 正交设计就是从选优区全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)来进行试验。

A1B1C1 A1B2C2 A1B3C3 A2B1C2 A2B2C3 A3B1C3 A3B2C1 A3B3C2 A2B3C1 A1B1C3 A1B3C1 A2B1C1 A2B2C1 A2B3C3 A3B1C1 A3B2C3 9个组合

第7章-正交试验设计的极差分析汇总

\ 第7章 正交试验设计的极差分析 正交试验设计和分析方法大致分为二种:一种是极差分析法(又称直观分析法),另一种是方差分析法(又称统计分析法)。本章介绍极差分析法,它简单易懂,实用性强,在工农业生产中广泛应用。 单指标正交试验设计及其极差分析 极差分析法简称R 法。它包括计算和判断两个步骤,其内容如图7-1所示。 & 图7-1 R 法示意图 — 图中,K jm 为第j 列因素m 水平所对应的试验指标和,K jm 为K jm 的平均值。由K jm 的大小可以判断j 因素的优水平和各因素的水平组合,即最优组合。R j 为第j 列因素的极差,即第j 列因素各水平下平均指标值的最大值与最小值之差: R j =max(jm j j K K K ,,,21 )-min(jm j j K K K ,,,21 )

R j反映了第j列因素的水平变动时,试验指标的变动幅度。R j越大,说明该因素对试验指标的影响越大,因此也就越重要。于是依据R j的大小,就可以判断因素的主次。 极差分析法的计算与判断,可直接在试验结果分析表上进行,现以例6-2来说明单指标正交试验结果的极差分析方法。 一、确定因素的优水平和最优水平组合 例6-2 为提高山楂原料的利用率,某研究组研究了酶法液化工艺制造山楂精汁。拟通过正交试验寻找酶法液化工艺的最佳工艺条件。 在例6-2中,不考虑因素间的交互作用(因例6-2是四因素三水平试验,故选用L9(34)正交表),表头设计如表6-5所示,试验方案则示于表6-6中。试验结果的极差分析过程,如表7-1所示. ( 表6-4 因素水平表 酶解温度 (C) ( C 表6-6 试验方案及结果

正交试验设计表

正交试验设计表 第十章正交试验设计对于单因素或两因素试验,因其因素少,试验的设计、实施与分析都比较简单。但在实际工作中,常常需要同时考察 3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。正交试验设计就是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。 1.1 正交试验设计的基本概念正交试验设计是利用正交表来安排与分析多因素试验的一种设计方法。它是由试验因素的全部水平组合中,挑选部分有代表性的水平组合进行试验的,通过对这部分试验结果的分析了解全面试验的情况,找出最优的水平组合。例如,要考察增稠剂用量、pH值和杀菌温度对豆奶稳定性的影响。每个因素设置3个水平进行试验。 A因素是增稠剂用量,设A1、A2、A3 3个水平;B因素是pH值,设B1、B2、B3 3个水平;C因素为杀菌温度,设C1、C2、C3 3个水平。这是一个3因素3水平的试验,各因素的水平之间全部可能组合有27种。全面试验:可以分析各因素的效应,交互作用,也可选出最优水平组合。但全面试验包含的水平组合数较多,工作量大,在有些情况下无法完成。若试验的主要目的是寻求最优水平组合,则可利用正交表来设计安排试验。正交试验设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。正因为正交试验是用部分试验来代替全面试验的,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。虽然正交试验设计有上述不足,但它能通过部分试验找到最优水平组合,因而很受实际工作者青睐。如对于上述3因素3水平试验,若不考虑交互作用,可利用正交表L9 34 安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。 1.2 正交试验设计的基本原理在试验安排中,每个因素在研究的范

一次回归正交设计、二次回归正交设计、二次回归旋转设计

一次回归正交设计 某产品的产量与时间、温度、压力和溶液浓度有关。实际生产中,时间控制在30~40min,温度控制在50~600C,压力控制在2*105~6*105Pa,溶液浓度控制在 20%~40%,考察Z 1~Z 2 的一级交互作用。 因素编码 Z j (x j ) Z 1 /min Z 2 /o C Z 3 /*105Pa Z 4 /% 下水平Z 1j (-1)30 50 2 20 上水平Z 2j (+1)40 60 6 40 零水平Z 0j (0)35 55 4 30 变化间距 5 5 2 10 编码公式X 1=(Z 1 -35)/5 X 2 =(Z 2 -55)/5 X 3 =(Z 3 -4)/2 X 4 =(Z 4 -30)/10 选择L8(27)正交表 因素x 1,x 1 ,x 3 ,x 4 依次安排在第1、2、4、7列,交互项安排在第3列。 试验号X0 X1(Z1) X2(Z2) X3(Z3) X4(Z4) X1X2 Yi 1 1 1 1 1 1 1 9.7 2 1 1 1 -1 -1 1 4.6 3 1 1 -1 1 -1 -1 10.0 4 1 1 -1 -1 1 -1 11.0 5 1 -1 1 1 -1 -1 9.0 6 1 -1 1 -1 1 -1 10.0 7 1 -1 -1 1 1 1 7.3 8 1 -1 -1 -1 -1 1 2.4 9 1 0 0 0 0 0 7.9 10 1 0 0 0 0 0 8.1 11 1 0 0 0 0 0 7.4 Bj=∑ xjy 87.4 6.6 2.6 8.0 12.0 -16.0 aj=∑ xj2 11 8 8 8 8 8 bj = Bj /aj 7.945 0.825 0.325 1.000 1.500 -2.00 Qj = Bj2 /aj 393 5.445 0.845 8.000 18.000 32.000 可建立如下的回归方程。 Y=7.945+0.825x1+0.325x2+x3+1.5x4-2x1x2 显著性检验: 1、回归系数检验

正交实验计算方法

正交试验设计方法(1)(2008-12-17 12:59:39) 标签:正交设计杂谈分类:其他 5.1试验设计方法概述 试验设计是数理统计学的一个重要的分支。多数数理统计方法主要用于分析已经得到的数据,而试验设计却是用于决定数据收集的方法。试验设计方法主要讨论如何合理地安排试验以及试验所得的数据如何分析等。 例5-1某化工厂想提高某化工产品的质量和产量,对工艺中三个主要因素各按三个水平进行试验(见表5-1)。试验的目的是为提高合格产品的产量,寻求最适宜的操作条件。 表5-1因素水平

对此实例该如何进行试验方案的设计呢 很容易想到的是全面搭配法方案(如图5-1所示): 此方案数据点分布的均匀性极好,因素和水平的搭配十分全面,唯一的缺点是实验次数多达33=27次(指数3代表3个因素,底数3代表每因素有3个水平)。因素、水平数愈多,则实验次数就愈多,例如,做一个6因素3水平的试验,就需36=729次实验,显然难以做到。因此需要寻找一种合适的试验设计方法。

图5-1 全面搭配法方案 试验设计方法常用的术语定义如下。 试验指标:指作为试验研究过程的因变量,常为试验结果特征的量(如得率、纯度等)。例1的试验指标为合格产品的产量。 因素:指作试验研究过程的自变量,常常是造成试验指标按某种规律发生变化的那些原因。如例1的温度、压力、碱的用量。 水平:指试验中因素所处的具体状态或情况,又称为等级。如例1的温度有3个水平。温度用T表示,下标1、2、3表示因素的不同水平,分别记为T1、T2、T3。

常用的试验设计方法有:正交试验设计法、均匀试验设计法、单纯形优化法、双水平单纯形优化法、回归正交设计法、序贯试验设计法等。可供选择的试验方法很多,各种试验设计方法都有其一定的特点。所面对的任务与要解决的问题不同,选择的试验设计方法也应有所不同。由于篇幅的限制,我们只讨论正交试验设计方法。 5.2正交试验设计方法的优点和特点 用正交表安排多因素试验的方法,称为正交试验设计法。其特点为:①完成试验要求所需的实验次数少。②数据点的分布很均匀。③可用相应的极差分析方法、方差分析方法、回归分析方法等对试验结果进行分析,引出许多有价值的结论。 从例1可看出,采用全面搭配法方案,需做27次实验。那么采用简单比较法方案又如何呢

(完整word版)正交试验设计方法

第5章 正交试验设计方法 5.1 试验设计方法概述 试验设计是数理统计学的一个重要的分支。多数数理统计方法主要用于分析已经得到的数据,而试验设计却是用于决定数据收集的方法。试验设计方法主要讨论如何合理地安排试验以及试验所得的数据如何分析等。 例5-1 某化工厂想提高某化工产品的质量和产量,对工艺中三个主要因素各按三个水平进行试验(见表5-1)。试验的目的是为提高合格产品的产量,寻求最适宜的操作条件。 对此实例该如何进行试验方案的设计呢? 很容易想到的是全面搭配法方案(如图5-1所示): 此方案数据点分布的均匀性极好,因素和水平的搭配十分全面,唯一的缺点是实验次数多达33 =27次(指数3代表3个因素,底数3代表每因素有3个水平)。因素、水平数 愈多,则实验次数就愈多,例如,做一个6因素3水平的试验,就需36=729次实验,显然难以做到。因此需要寻找一种合适的试验设计方法。 试验设计方法常用的术语定义如下。 试验指标:指作为试验研究过程的因变量,常为试验结果特征的量(如得率、纯度等)。例1的试验指标为合格产品的产量。 因素:指作试验研究过程的自变量,常常是造成试验指标按某种规律发生变化的那些原因。如例1的温度、压力、碱的用量。 水平:指试验中因素所处的具体状态或情况,又称为等级。如例1的温度有3个水平。温度用T 表示,下标1、2、3表示因素的不同水平,分别记为T 1、T 2、T 3。 常用的试验设计方法有:正交试验设计法、均匀试验设计法、单纯形优化法、双水平单纯形优化法、回归正交设计法、序贯试验设计法等。可供选择的试验方法很多,各种试

验设计方法都有其一定的特点。所面对的任务与要解决的问题不同,选择的试验设计方法也应有所不同。由于篇幅的限制,我们只讨论正交试验设计方法。 5.2 正交试验设计方法的优点和特点 用正交表安排多因素试验的方法,称为正交试验设计法。其特点为:①完成试验要求所需的实验次数少。②数据点的分布很均匀。③可用相应的极差分析方法、方差分析方法、回归分析方法等对试验结果进行分析,引出许多有价值的结论。 从例1可看出,采用全面搭配法方案,需做27次实验。那么采用简单比较法方案又如何呢? 先固定T1和p1,只改变m,观察因素m不同水平的影响,做了如图2-2(1)所示的三次实验,发现m=m2时的实验效果最好(好的用□表示),合格产品的产量最高,因此认为在后面的实验中因素m应取m2水平。 固定T1和m2,改变p的三次实验如图5-2(2)所示,发现p=p3时的实验效果最好,因此认为因素p应取p3水平。 固定p3和m2,改变T 的三次实验如图5-2(3)所示,发现因素T 宜取T2水平。 因此可以引出结论:为提高合格产品的产量,最适宜的操作条件为T2p3m2。与全面搭配法方案相比,简单比较法方案的优点是实验的次数少,只需做9次实验。但必须指出,简单比较法方案的试验结果是不可靠的。因为,①在改变m值(或p值,或T值)的三次实验中,说m2(或p3或T2)水平最好是有条件的。在T≠T1,p≠p1时,m2水平不是最好的可能性是有的。②在改变m的三次实验中,固定T=T2,p=p3应该说也是可以的,是随意的,故在此方案中数据点的分布的均匀性是毫无保障的。③用这种方法比较条件好坏时,只是对单个的试验数据进行数值上的简单比较,不能排除必然存在的试验数据误差的干扰。 运用正交试验设计方法,不仅兼有上述两个方案的优点,而且实验次数少,数据点分布均匀,结论的可靠性较好。 正交试验设计方法是用正交表来安排试验的。对于例1适用的正交表是L9(34),其试验安排见表5-2。 所有的正交表与L9(34)正交表一样,都具有以下两个特点: (1)在每一列中,各个不同的数字出现的次数相同。在表L9(34)中,每一列有三个水平,水平1、2、3都是各出现3次。 (2)表中任意两列并列在一起形成若干个数字对,不同数字对出现的次数也都相同。在表L9(34)中,任意两列并列在一起形成的数字对共有9个:(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3),每一个数字对各出现一次。

正交试验习题与解答

1.正交试验设计法的基本思想 正交试验设计法,就是使用已经造好了的表格--正交表--来安排试验并进行数据分析的一种方法。它简单易行,计算表格化,使用者能够迅速掌握。下边通过一个例子来说明正交试验设计法的基本想法。 [例1]为提高某化工产品的转化率,选择了三个有关因素进行条件试验,反应温度(A),反应时间(B),用碱量(C),并确定了它们的试验范围:A:80-90℃ B:90-150分钟 C:5-7% 试验目的是搞清楚因子A、B、C对转化率有什么影响,哪些是主要的,哪些是次要的,从而确定最适生产条件,即温度、时间及用碱量各为多少才能使转化率高。试制定试验方案。 这里,对因子A,在试验范围内选了三个水平;因子B和C也都取三个水平: A:A l=80℃,A2=85℃,A3=90℃ B:B l=90分,B2=120分,B3=150分 C:C l=5%,C2=6%,C3=7% 当然,在正交试验设计中,因子可以是定量的,也可以是定性的。而定量因子各水平间的距离可以相等,也可以不相等。 这个三因子三水平的条件试验,通常有两种试验进行方法:

(Ⅰ)取三因子所有水平之间的组合,即A l B l C1,A1B l C2,A1B2C1,……,A3B3C3,共有 33=27次 试验。用图表示就是图1 立方体的27个节点。这种试验法叫做全面试验法。 全面试验对各因子与指标间的关系剖析得比较清楚。但试验次数太多。特别是当因子数目多,每个因子的水平数目也多时。试验量大得惊人。如选六个因子,每个因子取五个水平时,如欲做全面试验,则需56=15625次试验,这实际上是不可能实现的。如果应用正交实验法,只做25次试验就行了。而且在某种意义上讲,这25次试验代表了15625次试验。 (Ⅱ)简单对比法,即变化一个因素而固定其他因素,如首先固定B、C 于B l、C l,使A变化之: ↗A1 B1C1→A2 ↘A3 (好结果)

正交试验设计常用正交表

(1) L 4(23) 任意两列间的交互作用为另外一列。 (2) L 8(27) L 8(27)二列间的交互作用表 1 2 3 1 1 1 1 2 1 2 2 3 2 1 2 4 2 2 1 1 2 3 4 5 6 7 1 1 1 1 1 1 1 1 2 1 1 1 2 2 2 2 3 1 2 2 1 1 2 2 4 1 2 2 2 2 1 1 5 2 1 2 1 2 1 2 6 2 1 2 2 1 2 1 7 2 2 1 1 2 2 1 8 2 2 1 2 1 1 2 1 2 3 4 5 6 7 (1) 3 2 6 4 7 6 (2) 1 5 7 4 5 (3) 7 6 5 4 (4) 1 2 3 (5) 3 2 (6) 1 (7) 列 号 试 验 号 列 号 试 验 号 列 号 列 号

L 8(27)表头设计 1 2 3 4 5 6 7 3 A B A ×B C A ×C B ×C 4 A B A ×B C ×D C A ×C B ×D B ×C A ×D D 4 A B C ×D A ×B C B ×D A ×C D B ×C A ×D 5 A D ×E B C ×D A × B C ×E C B ×D A ×C B ×E D A × E B ×C E A ×D (3) L 8(4×24) L 8(4×24)表头设计 1 2 3 4 5 2 A B (A ×B)1 (A ×B)2 (A ×B)3 3 A B C 4 A B C D 5 A B C D E 1 2 3 4 5 1 1 1 1 1 1 2 1 2 2 2 2 3 2 1 1 2 2 4 2 2 2 1 1 5 3 1 2 1 2 6 3 2 1 2 1 7 4 1 2 2 1 8 4 2 1 1 2 列 号 因 子 数 列 号 试 验 号 列 号 因 子 数

回归试验设计作业

1、研究氮(N )、磷(52O P )、钾(O K 2)对玉米产量的影响。已知施氮、磷、钾肥的下限和上限依次为:氮,0 和17kg/亩;磷,0 和7kg/亩、钾,0 和18kg/亩. 试用二次回归正交设计方法写出它们的因素编码表并制定试验方案。 2、为提高钻头的寿命,在数控机床上进行试验,考察钻头的寿命与钻头轴向振动频率F 及振幅A 的关系。在试验中,F 与A 的变动范围分别为:[125 Hz ,375Hz]与[1.5,5.5],试写出因素水平编码表并利用二次回归正交旋转组合设计安排试验,并写出参与运算的数据结构矩阵。 3、国内民用剪生产一直是沿袭千百年的传统工艺,近代虽有改进,但绝大多数民用剪的生产工艺仍然存在工序多、工艺流程长、质量不稳定、劳动条件差、生产率低、经济效益少等缺点。在全国民用剪生产新工艺的研究中,某厂确定了最佳工艺参数试验因素及取值范围如下:1z 剪刀运行速度[230,370];2z 感应器与剪刀的距离[5.18,10.82];3z 屏极电流[1.24, 1.68],应用二次回归旋转设计写出因素水平编码表和设计方案。 4、应用二次回归旋转设计寻求有害废水净化的最佳工艺条件。 某冶练厂排出的废水中含有大量的镉、砷、铅等有害元素,对环境造成污染。务了保护环境,消除污染,该厂在铁氧体净化废水工艺中应用正交试验设计和二次回归旋转设计。根据废水净化工艺的需要,进行了三指标四因素试验:考察的试验指标为:镉、砷、铅的净化率,试验因素为温度1z (34~42)、时间2z (30~50)、碱与硫酸亚铁之比(1.34~1.46)3z 和硫酸亚铁用量4z (1.5~2.5),给出试验设计方案. 5、利用通用旋转设计寻求镓溶液导电率与因素1z (镓的浓度)和2z (苛性碱浓度)的二次回归试验设计。已知因素试验考察的范围: 1z :L g /70~30, 2z L g /150~90写出因素水平编码表和设计方案。 6、用3GA 、BA 和多菌灵防治苹果腐烂病的试验,各因素的下水平和上水平分别为: 3GA : 0kg mg /和200kg mg /;BA 0kg mg /和 200kg mg /;多菌灵:0%和10%

回归正交试验设计

8 回归正交试验设计 前面介绍的正交试验设计是——种很实用的试验设计方法,它能利用较少的试验次数获得较好的试验结果,但是通过正交设计所得到的优方案只能限制在已定的水平上,而不是一定试验范围内的最优方案;回归分析是一种有效的数据处理方法,通过所确立的回归方程,可以对试验结果进行预测和优化,但回归分析往往只能对试验数据进行被动的处理和分析,不涉及对试验设计的要求。如果能将两者的优势统一起来,不仅有合理的试验设计和较少的试验次数,还能建立有效的数学模型,这正是我们所期望的。回归正交设计(orthogonal regression design)就是这样一种试验设计方法,它可以在因素的试验范围内选择适当的试验点,用较少的试验建立一个精度高、统计性质好的回归方程,并能解决试验优化问题。 8.1 一次回归正交试验设计及结果分析 一次回归正交设计就是利用回归正交设计原理,建立试验指标(y)与m 个试验因素x 1,x 2,……,x m ,之间的一元回归方程: $1122m m y a b x b x b x =++++L (8-1) 或者 $1 m j j kj k j j k j y a b x b x x =?=++∑∑ k=1,2,…,m -1(j≠k ) (8-2) 8.1.1 一次回归正交设计的基本方法 (1)确定因素的变化范围 根据试验指标y ,选择需要考察的m 个因素x j (j =1,2,…,m),并确定每个因素的取值范围。设因素x j 的变化范围为[x j1,x j2],分别称x j1和x j2为因素x j 的下水平和上水平,并将它们的算术平均值称作因素x j 的零水平,用x j0。表示。 12j02 j j x x x += (8-3) 上水平与零水平之差称为因素x j 的变化间距,用△j 表示,即: 20j j j x x ?=- (8-4) 或 21 2 j j j x x -?= (8-5) (2)因素水平的编码 编码(coding)是将x j 的各水平进行线性变换,即: j j j x x z j -= ? (8-6) 式(8—6)中z j 就是因素x j 的编码,两者是一一对应的。显然,与x j1,x j0和x j2的编码分别为-1,0和1,即z j1=-1,z j2=0,z j2=1。一般称x j 为自然变量,z j 为规范变量。因素水平的编码结果可表示成表8—1。 对因素x j 的各水平进行编码的目的,是为了使每个因素的每个水平在编码空间是“平等”的,即规范变量z j 的取值范围都在[1,-1]内变化,不会受到自然变量x j 的单位和取值大小的影响。所以编码能将试验结果y 与因素z j (j =1,2,…,m)各水平之间的回归问题,转换成试验结果y 与编码值z j 之间的回归问题,

相关主题
文本预览
相关文档 最新文档