当前位置:文档之家› 一次回归正交设计、二次回归正交设计、二次回归旋转设计

一次回归正交设计、二次回归正交设计、二次回归旋转设计

一次回归正交设计、二次回归正交设计、二次回归旋转设计
一次回归正交设计、二次回归正交设计、二次回归旋转设计

一次回归正交设计

某产品的产量与时间、温度、压力和溶液浓度有关。实际生产中,时间控制在30~40min,温度控制在50~600C,压力控制在2*105~6*105Pa,溶液浓度控制在

20%~40%,考察Z

1~Z

2

的一级交互作用。

因素编码

Z j (x

j

) Z

1

/min Z

2

/o C Z

3

/*105Pa Z

4

/%

下水平Z

1j

(-1)30 50 2 20

上水平Z

2j

(+1)40 60 6 40

零水平Z

0j

(0)35 55 4 30 变化间距 5 5 2 10

编码公式X

1=(Z

1

-35)/5 X

2

=(Z

2

-55)/5 X

3

=(Z

3

-4)/2 X

4

=(Z

4

-30)/10

选择L8(27)正交表

因素x

1,x

1

,x

3

,x

4

依次安排在第1、2、4、7列,交互项安排在第3列。

试验号X0 X1(Z1) X2(Z2) X3(Z3) X4(Z4) X1X2 Yi

1 1 1 1 1 1 1 9.7

2 1 1 1 -1 -1 1 4.6

3 1 1 -1 1 -1 -1 10.0

4 1 1 -1 -1 1 -1 11.0

5 1 -1 1 1 -1 -1 9.0

6 1 -1 1 -1 1 -1 10.0

7 1 -1 -1 1 1 1 7.3

8 1 -1 -1 -1 -1 1 2.4

9 1 0 0 0 0 0 7.9

10 1 0 0 0 0 0 8.1

11 1 0 0 0 0 0 7.4 Bj=∑

xjy

87.4 6.6 2.6 8.0 12.0 -16.0

aj=∑

xj2

11 8 8 8 8 8

bj = Bj

/aj

7.945 0.825 0.325 1.000 1.500 -2.00

Qj = Bj2

/aj

393 5.445 0.845 8.000 18.000 32.000

可建立如下的回归方程。

Y=7.945+0.825x1+0.325x2+x3+1.5x4-2x1x2

显著性检验:

1、回归系数检验

回归关系的方差分析表

变异来源

SS 平方和 Df 自由度 MS 均方 F 显著水平

x 1 5.445 1 5.445 76.25 0.01

x 2 0.845 1 0.845 11.83 0.05

x 3 8.000 1 8.000 112.04 0.01

x4 18.000 1 18.000 252.10 0.01

x1x2 32.000 1 32.000 448.18 0.01

回归 64.29 5 12.858 180.08 0.01 剩余 0.357 5 0.0714 失拟

0.097

3

0.0323

0.25

<1

误差e 0.26 2 0.13

总和 64.647 10

经F 检验不显著的因素或交互作用直接从回归方程中剔掉,不必再重新进行回归分析。

2、回归方程的检验 进行此项检验时,通常对F 值小于等于1的项不进行检验,直接从回归方程中剔除,对经检验而α>0.25的项,根据实际需要决定是否剔除。

3、失拟检验

Lf Lf Lf Lf e e e MS SS df F MS SS df ==

由回归系数的检验,回归方程的检验,失拟检验可以得出,

产量 y 与各因素之间的总回归关系达到显著,回归方程拟合效果较好。

回归方程的变换

将各因素的编码公式代入,得

Y=-162.05+4.57z1+2.87z2+0.50z3+0.15z4-0.08z1z2

二次回归正交设计

某食品加香试验,3个因素,即 Z1(香精用量)、 Z2(着香时间) 、 Z2(着香温度)

(1) 确定γ值、 mc 及 m0 。

根据本试验目的和要求,确定 mc= 2 m = 2 3= 8 , m0 =1 ,查表得γ=

1.215。

(2)确定因素的上、下水平,变化间距以及对因子进行编码

编码Z1/(mL/kg物

料)

Z2 / h Z3/ ℃

+γ182448

+ 116.9422.645.7

0121635

- 17.069.424.3

-γ6822

Δi 4.94 6.610.7

计算各因素的零水平:

Z01 =(18+6)/2=12 (mL/kg)

Z02 =(24+8)/2=16 (h)

Z03 =(48+22)/2=35 (℃)

计算各因素的变化间距:

Δ01 =(18-12)/1.215=4.94 (mL/kg)

Δ02 =(24-16)/1.215=6.6 (h)

Δ03 =(48-35)/1.215=10.7 (℃)

(3)列出试验设计及试验方案

试验号

试验设计实施方案x0x1x2

香精用量/(mL

/kg)

着香时间

/h

着香温

度/ ℃

111116.9422.645.7 211-116.9422.624.3 31-1116.949.445.7 41-1-116.949.424.3

5-1117.0622.645.7 6-11-17.0622.624.3 7-1-117.069.445.7 8-1-1-17.069.424.3 9 1.21500181635 10-1.2150061635 110 1.2150122435 120-1.215012835 1300 1.215121648 1400-1.215121622 150********

试验结果的统计分析

建立回归方程

试验号 0x

1x 2x 3x 21x x 31x x 32x x 1x ' 2x ' 3x ' 结果(y ) 1 1

1 1 1 1 1 1 0.27 0.27 0.27 2.32

2 1 1 1 -1 1 -1 -1 0.27 0.27 0.27 1.25

3 1 1 -1 1 -1 1 -1 0.27 0.27 0.27 1.93

4 1 1 -1 -1 -1 -1 1 0.27 0.27 0.27 2.13

5 1 -1 1 1 -1 -1 1 0.27 0.27 0.27 5.85

6 1 -1 1 -1 -1 1 -1 0.2

7 0.27 0.27 0.17 7 1 -1 -1 1 1 -1 -1 0.27 0.27 0.27 0.80

8 1 -1 -1 -1 1 1 1 0.27 0.27 0.27 0.56

9 1 1.215 0 0 0 0 0 0.746 -0.73 -0.73 1.60 10 1 -1.215 0 0 0 0 0 0.746 -0.73 -0.73 0.56 11 1 0 1.215 0 0 0 0 -0.73 0.746 -0.73 5.54 12 1 0 -1.215 0 0 0 0 -0.73 0.746 -0.73 3.89 13 1 0 0 1.215 0 0 0 -0.73 -0.73 0.746 3.57 14 1 0 0 -1.215 0 0 0 -0.73 -0.73 0.746 2.52 15

1 0 0 0 0 0 0 -0.73 -0.73 -0.73 5.80

∑=2j j x a

15 10.9525 10.9525 10.9525 8 8 8

4.3607

4.3607

4.3607

∑2

y

51.8443

∑=y x j j β

37.37 2.6336 7.2948 9.1858 -6.27

-6.17

5.59

-10.2019 0.5286 -4.3721

y SS =

58.7432

j j j a B b = 0b

0.2405 0.6660 0.8387 -0.7838 -0.7713 0.6988 -2.3395 0.1212

-1.0093

R SS =

55.2032

j j j a B Q 2=

0.6333 4.8586 7.7040 4.9141 4.7586 3.9060 23.8676 0.0641 4.4422

r SS =3.540

1231213

222

231234.90910.24050.66600.83870.78380.77130.6988 2.33950.1212 1.0093y x x x x x x x x x x x x =+++--+-+-)()2

011137.3710.9525 2.33950.1212 1.0093 4.9091

1515m

aj jj j b y x b N N ==-?=--+-=∑∑∑

回归关系的显著性测验。

变异来源平方和(SS)自由度(df)均方(MS)F显著程度

x10.6332710.63327<1ns

x2 4.858561 4.85856 6.8624*0.05(6.61) x37.7040017.7040010.8814*0.05(6.61) x1x2 4.914101 4.9141010.3994*0.05(6.61) x1x3 4.758611 4.75861 6.9409*0.05(6.61) x2x3 3.906011 3.90601 5.51700.10(4.06) x1223.86763123.8676333.7116**0.01(16.30) x220.0640710.06407<1ns

x32 4.442201 4.44220 6.27430.10(4.06)回归55.203209 6.133698.6635*0.05(4.77)剩余 3.5399850.70799

总变异58.7431714

方差分析表明,总回归达到显著水平,说明本食品的加香试验与所选因素之间存在显著的回归关系,试验设计方案是正确的,选用二次正交回归组合设计也是恰当的。除 x1 和 x22 以外,其余各项因子基本达到显著或极显著,说明香料用量、着香时间、着香温度与这一食品的加香有显著或极显著关系。本试验设计的因素、水平选择是成功的。

在这种回归正交试验中,第一次方差分析往往因为误差(剩余)自由度偏小而影响了检验的精确度。并且由于回归正交试验计划具有的正交性,保证了试验因素的列与列之间没有互作(即没有相关性)存在,因此我们可以将未达到0.25以上显著水平的因素(或者互作)剔除,将其平方和和自由度并入误差(剩余)项,进行第二次方差分析,以提高检验的精确度。

第二次方差分析结果见下表:

变异来源平方和

(SS)

自由

度(df)

均方(MS)F显著程度

x2 4.858561 4.858568.0263*

0.05(5.59)

x37.7040017.7040012.7269**

0.01(12.20)

x1x2 4.914101 4.914108.1180*0.05

x 1x 3 4.75861 1 4.75861 7.8612*

0.05(5.59) x 2x 3 3.90601 1 3.90601 6.4527*

0.05(5.59) x 12 23.86763 1 23.86763 39.4290**

0.01(12.20)

x 32 4.44220 1 4.44220 7.3385*

0.05(5.59) 回归 54.24265 7 7.74895 12.8012**

0.01(6.99)

剩余 4.23732 7 0.60533

总变异

58.47997 14

第二次方差分析表明,总回归及各项因素均达到显著或极显著水

平,说明这一食品加香与试验因素之间存在极显著的回归关系,其优化的回归方程为:

本试验由于 m0=1,故不能进行失拟检验,这是试验的一个缺陷。如果取 m0=4,对试验进行失拟检验,则本试验将更为圆满。

222312132313

4.90910.66600.83870.78380.77130.6988 2.3395 1.0093y x x x x x x x x x x =++-----)

二次回归旋转设计

对乳酸发酵的产酸条件进行优化试验,采用二次回归旋转设计对盐浓度、糖浓度、

发酵温度和发酵时间进行试验。

因素水平表

盐浓度x1糖浓度x2发酵温度x3发酵时间x4编码

/%/%/℃/h

+28.0 6.037.048

+17.0 5.034.044

0 6.0 4.031.040

-1 5.0 3.028.036

-2 4.0 2.025.0

设计方案及结果

处理号x1x2x3x4含酸量y α/ %

111110.654 2111-10.433 311-110.538 411-1-10.321 51-1110.314 61-11-10.279 71-1-110.295 81-1-1-10.242 9-11110.779 10-111-10.594 11-11-110.710 12-11-1-10.529 13-1-1110.481 14-1-11-10.307 15-1-1-110.328

处理号x1x2x3x4含酸量y α/ %

16-1-1-1-10.291 1720000.125 18-20000.648 1902000.785 200-2000.213 2100200.429 2200-200.198 2300020.842 24000-20.486 2500000.797 2600000.709 2700000.759 2800000.694

29 0 0 0 0 0.728

30 0 0 0 0 0.738

31 0 0 0 0 0.746

根据计算 建立回归方程

回归方程的显著性检验

变异原因 平方和SS 自由度df 均方MS F 值 显著程度 x 1 0.16484 1 0.16484 49.28 8.53 x 2 0.41738 1 0.41738 127.79 x 3 0.04585 1 0.04585 13.71 x 4 0.13726 1 0.13726 41.04 x 1 x 2 0.00946 1 0.00946 2.83 x 1 x 3 0.00002 1 0.00002 <1 x 1 x 4

0.00016

1

0.00016

<1

12340.74480.08290.13190.04370.0786y x x x x ∧

=--+++121214230.02430.00120.00320.0086x x x x x x x x +

--+222434120.03160.00790.09340.0652x x x x x x -+--2234

0.11160.0239x x -

x 2 x 3 0.00117 1 0.00117 <1 x 2 x 4 0.01594 1 0.01594 4.77 4.49 x 3 x 4 0.00101 1 0.00101 <1 x 1′ 0.16884 1 0.16884 50.48 x 2′ 0.07959 1 0.07959 23.79 x 3′ 0.34411 1 0.34411 102.88 x 4′ 0.01648 1 0.01648 4.93 回归 1.40211 0.10015 29.94 3.56 剩余 0.05352 0.00334 误差 0.00853 0.00142 失拟 0.04499 0.00450 3.17 4.74 总变异

1.45563

通过回归方程检验,回归系数检验,失拟检验,可以看出,回归达到极显著水平。说明本试验设计及分析效果都很好,各因素间显著与不显著也很分明。因此没有必要做二次回归方差分析,可直接将 F <1 的回归系数去掉而得到含酸量与各因素间的回归方程为:

222

12241230.02430.03160.09340.06520.1116x x x x x x x +----

24

0.0239x

12340.74480.08290.13190.04370.0786y x x x x ∧

=+++-

-

回归正交试验设计

回归正交试验设计 一、概述 (1)回归分析与正交试验设计的主要优缺点 回归分析的主要优点是可以由试验数据求出经验公式,用于描述自变量与因变量之间的函数关系。它的主要缺点是毫不关心试验数据如何取得,这样,不仅盲目地增加了试验次数,而且试验数据还往往不能提供充分的信息。因此,有些工作者将经典的回归分析方法描述成:“这是撒大网,捉小鱼,有时还捉不到鱼”。所以说,回归分析只是被动地处理试验数据,并且回归系数之间存在相关关系,若从回归方程中剔除某个不显著因素时,需重新计算回归系数,耗费大量的时间。 正交试验设计的主要优点是科学地安排试验过程,用最少的试验次数获得最全面的试验信息,并对试验结果进行科学分析(如方差分析),从而得到最佳试验条件,但是它的主要缺点是试验结果无法用一个经验公式来表达,从而不便于考察试验条件改变后,试验指标将作如何变化。 (2)回归正交试验设计 回归正交试验设计,实际上就是将线性回归分析与正交试验设计两者有机地结合起来而发展出的一种试验设计方法,它利用正交试验设计法的“正交性”特点,有计划、有目的、科学合理地在正交表上安排试验,并将试验结果用一个明确的函数表达式即回归方程来表示,从而达到既减少试验次数、又能迅速地建立经验公式的目的。 根据回归模型的次数,回归正交试验设计又分为一次回归试验设计和二次回归试验设计。

二、一次回归正交试验设计 (一)一次回归正交试验设计的概念 一次回归设计研究的是一个因素z (或多个因素z 1,z 2,……)与试验指标y 之间的线性关系。当只研究一个因素时,其线性回归模型: y =β0+β1z +e (1) 其回归方程为: z y ∧ ∧ ∧ +=10ββ (2) 式中∧ 0β、∧ 1β称为回归系数,e 是随机误差,是一组相互独立、且服从正态分布N(0,σ2 )的随机变量。可以证明,∧0β、∧1β和∧ y 是β0、β1和y 的无偏估计,即 E(∧0β)=β0,E(∧1β)=β1,E(∧ y )=y 一次回归正交试验设计是通过编码公式x =f(z) ?? 即变量变换,将式(2)变为: b b y 10+=∧ (3) 且使试验方案具有正交性,即使得编码因素X的各水平之和为零: ∑==m i i x 1 (4) 式中m 是因素x 的水平数。 在回归分析中,回归系数的计算公式为:

一次回归正交设计

第五讲回归设计及统计分析 设目标性状y与z1、z2……z m等因素有关,我们可以应用回归分析的方法建立y与诸因素的回归方程,以此对y进行预测和控制,或筛选y的最优指标。z1、z2……z m构成一个因子空间,每一组z1、z2……z m值对应一个y值。如何在因子空间中选择最适当的试验点,以最少的试验点寻求y的最优区域,这就要将回归分析与正交设计结合起来应用,称为回归正交设计。按回归模型的次数,回归正交设计又分为一次回归正交设计和二次回归正交设计。 一、一次回归正交设计 一次回归正交设计主要是应用2水平正交表进行设计,其设计和分析步骤如下。 1.确定试验因素的变化范围

例如研究m 个栽培因素z 1、z 2……z m 与作物产量y 的数量关系,首先需确定各个栽培因素的变化范围。设因素z j 的变化区间为(z 1j ,z 2j ),则z 1j 和z 2j 分别为因素z j 的下水平和上水平。那么 1202j j j z z z += 为因素z j 的零水平。 212j j j z z ?=- 为因素z j 的变化区间。 2.对各因素的水平编码 编码就是对各个因素的取值作如下线性变换: 0j j j j z z x =?-

式中x j 为编码值。如: 101211212 12j j j j j j j j j z z z z z x z z =?-+--==- 0000j j j j z z x =?-= 201222212 12j j j j j j j j j z z z z z x z z =?+--==- 这样就建立了z j 与x j 的一一对应关系: 下水平 z 1j x 1j (-1)

一次回归正交设计例子

一次回归正交设计 某冶炼厂排出的废水中含有大量的镉、鉮、铅等有害元素,对环境造成严重污染。考察的试验因素为温度(x1)、碱与硫酸亚铁之比(x2)以及硫酸亚铁用量(x3)对指标除镉效率(y)的影响。不考虑交互作用。已知x l=60~80℃,x2=8~12,x3=1~3ml。 (1)因素水平编码及试验方案的确定 表1 因素水平编码表 编码z j温度(x1) 碱与硫酸亚铁之比 (x2)硫酸亚铁用量 (x3) -1 60 8 1 0 70 10 2 1 80 1 2 3 △j 10 2 1 由于不考虑交互作用,所以建立一个三元线性方程。因素水平编码如表1所示。选正交表L8(27)安排试验,将三个因素分别安排在回归正交表的第1、2、4列,试验方案及试验结果见表2,表中的第9、 10、11号试验为零水平试验。 表2 试验方案及试验结果 试验 号z1 z2 z3 温度(x1) 碱与硫酸亚 铁之比(x2) 硫酸亚铁用 量(x3) 除镉效率 y/% 1 1 1 1 80 1 2 3 8.0 2 1 1 -1 80 12 1 7. 3

3 1 -1 1 80 8 3 6. 9 4 l -1 -l 80 8 l 6.4 5 -1 1 1 60 12 3 6.9 6 -1 1 -1 60 12 1 6.5 7 -1 -1 l 60 8 3 6.0 8 -1 -1 -1 60 8 1 5.1 9 0 0 0 70 10 2 6.6 10 0 0 0 70 10 2 6.5 11 0 0 0 70 10 2 6.6 ⑵回归方程的建立 表3试验结果及计算表 提取率y y2 z1y z2y z3y 试验号z1 z2 z3 /% 1 1 1 1 8.0 64.00 8.0 8.0 8.0 2 1 1 -1 7. 3 53.29 7.3 7.3 -7.3 3 l -1 1 6.9 47.61 6.9 -6.9 6.9 4 1 -1 -1 6.4 40.96 6.4 -6.4 -6.4 5-1 1 1 6.9 47.61 -6.9 6.9 6.9 6 -1 1 -1 6.5 42.25 -6.5 6.5 -6.5 7 -1 -1 1 6.0 36.00 -6.0 -6.0 6.0 8 -1 -1 -1 5.1 26.01 -5.1 -5.1 -5.1

四种回归设计方法的比较

四种回归设计方法比较表 试验设计方法一次回归正交二次回归正交二次回归正交旋转二次回归通用旋转 特点正 交 性 在p维因素空间内,如果试验方案使所有j个因素的不同水平x ij 满足: ) ; ,..., 2,1 ; ,..., 2,1 ; ,..., 2,1 ( 1 1 j t N t x x N j N i x N i it ij N i ij ≠ = = = = = ∑ ∑ = = 则该方案具有正交性。则,一次回归正交、二次回归正交,及二次回归正交旋转试验均具有正交性, 具有以下特点: 1.利用正交试验设计安排试验,运用回归分析方法处理数据; 2.减少试验次数,适用于因素水平不太多的多因素试验; 3.“均匀分散,整齐可比”; 4.由于试验设计的正交性,消除回归系数之间的相关性,使其具有独立性。 注:二次回归正交旋转中,由公式p m m c 2 ) 1(42/1 - + =计算出m0为整数时,则旋转组合设计是 完全正交的;当m0不为整数时,则旋转组合设计是近似正交的。 一次项系数b j与交互项系数b ij具有 正交性,但常数项b0与平方项回归 系数b jj,以及各平方项回归系数b jj 之间均存在相关,因此不具有正交 性。 旋 转 性 具有旋转性无 具有旋转性(在p维因素空间中,若使用方案使得试验指标预测值 ?的预测方差仅与试验点到试验中心的距离ρ有关,而与方向无关, 因此具有旋转性。) 通 用 性 无 具有通用性(各试验点与中心的 距离ρ在因子空间编码值区间0< ρ <1范围内,其预测值?的方差基 本相等,即具有通用性。)

优点科学地安排实验,用最少的试验次数,获得最全面的试验信息,并对试验结果进行科学分析,从而得 到最佳实验条件,迅速建立经验公式,简化计算。 1.中心点试验次数m0有所减少。 2.试验方案具有通用性与旋转性。消除回归系数之间的相关性,使其具有独立性,剔除回归方程某一 变量时,其余变量的回归系数不变。 1.可直接比较各点预测值的好 坏,找出预测值相对较优的区 域; 2.有助于寻找最优生产的过程 中排除误差的干扰。 缺点1.只适用于因素水平不太多的多 因素试验,且水平数一般不大于 3; 2.适用性具有局限,一次回归方程 经检验可能在区域内部拟合不 好。 试验指标预测值?的方差依靠 试验点在p维空间的位置,影响 不同回归值之间的直接比较。 1.中心试验次数明显增加,对于 试验费用昂贵或试验数据难以 取得的研究不利。 2.在不同半径球面上各试验点 的预测值?的方差不等,不便 于比较。 常数项b0与平方项回归系数b jj、以 及各平方项回归系数b jj 存在相关, 牺牲了部分正交性而达到一致精度 的要求。 因素水平编码试验次 数N N(不包括零水平试验次数) 2 2 2 + = ≥ + + = p c C q N m p m N m0根据试验设计需求而定 p m m m p m N c 2 ) 1(4 2 2/1 - + = + + = m0由公式求得 2m p m N c + + = m0查相关工具表或由公式求得 确定星 号臂r 无 2 ) 2 ( 2c c c m m m p m r - + + = ? ? ? ? ? = = - 实施 实施 全面实施 4/1,2 2/1,1 ,0 , 24i r i p 中心化 处理 无) ,..., 2,1 ; ,..., 2,1 (, 1 1 2 2p j N i x N x x N i ij j j = = - = '∑ = 无

二次回归正交试验

二次回归正交试验 为了检测某种原料的吸水倍率,重点考察氮肥含量和催化剂对试验指标的影响,已知氮肥含量(x1)的变化范围为0.7~0.9,催化剂(x2)的变化范围为1~3 mL,用二次正交组合设计分析出这两个因素与试验指标(y)之间的关系。 (1)因素水平编码 计算依据 m=2,取m0=2,根据星号臂γ计算公式或查表得γ=1.078 X(1γ)=0.9 ,x(-1γ)=0.7, x(10)=0.8 Δ1=(0.9-0.8)/1.078=0.093 X(2γ)=3 ,x(-1γ)=1, x(10)=2 Δ2=(3-2)/1.078=0.93

(2)试验方案 借助excel分析如下:

①回归方程显著性检验:F=186.5564,, ,12.4)74(95.0=F 因此回归方程非常显著。 '74.41'37.2375.656.2609.952.468y 212121z z z z z z ----+= ②偏回归系数的显著性检验 9 .496.113305.113806.113308.47058.14583.1822.44615.5528.4705701.274.41)(8.1458701.224.23)(3.182475.6)(2 .4461324.656.265.552324.609.95.113801046852206303)(122111221221222222221 121111221 21212 1222 1222222 112112212 1 =-=-==++++=++++==?===?===?===?===?===-=-=∑∑∑∑∑∑∑=======R T e R n i i n i i n i n i i n i i n i i n i i T SS SS SS SS SS SS SS SS SS z b SS z b SS z z b SS z b SS z b SS y n y SS 方差分析: dfT=n-1=10-1=9 df1=df2=df12=df1’=df2’=1

一次回归正交设计、二次回归正交设计、二次回归旋转设计

一次回归正交设计 某产品的产量与时间、温度、压力和溶液浓度有关。实际生产中,时间控制在30~40min,温度控制在50~600C,压力控制在2*105~6*105Pa,溶液浓度控制在 20%~40%,考察Z 1~Z 2 的一级交互作用。 因素编码 Z j (x j ) Z 1 /min Z 2 /o C Z 3 /*105Pa Z 4 /% 下水平Z 1j (-1)30 50 2 20 上水平Z 2j (+1)40 60 6 40 零水平Z 0j (0)35 55 4 30 变化间距 5 5 2 10 编码公式X 1=(Z 1 -35)/5 X 2 =(Z 2 -55)/5 X 3 =(Z 3 -4)/2 X 4 =(Z 4 -30)/10 选择L8(27)正交表 因素x 1,x 1 ,x 3 ,x 4 依次安排在第1、2、4、7列,交互项安排在第3列。 试验号X0 X1(Z1) X2(Z2) X3(Z3) X4(Z4) X1X2 Yi 1 1 1 1 1 1 1 9.7 2 1 1 1 -1 -1 1 4.6 3 1 1 -1 1 -1 -1 10.0 4 1 1 -1 -1 1 -1 11.0 5 1 -1 1 1 -1 -1 9.0 6 1 -1 1 -1 1 -1 10.0 7 1 -1 -1 1 1 1 7.3 8 1 -1 -1 -1 -1 1 2.4 9 1 0 0 0 0 0 7.9 10 1 0 0 0 0 0 8.1 11 1 0 0 0 0 0 7.4 Bj=∑ xjy 87.4 6.6 2.6 8.0 12.0 -16.0 aj=∑ xj2 11 8 8 8 8 8 bj = Bj /aj 7.945 0.825 0.325 1.000 1.500 -2.00 Qj = Bj2 /aj 393 5.445 0.845 8.000 18.000 32.000 可建立如下的回归方程。 Y=7.945+0.825x1+0.325x2+x3+1.5x4-2x1x2 显著性检验: 1、回归系数检验

回归试验设计作业

1、研究氮(N )、磷(52O P )、钾(O K 2)对玉米产量的影响。已知施氮、磷、钾肥的下限和上限依次为:氮,0 和17kg/亩;磷,0 和7kg/亩、钾,0 和18kg/亩. 试用二次回归正交设计方法写出它们的因素编码表并制定试验方案。 2、为提高钻头的寿命,在数控机床上进行试验,考察钻头的寿命与钻头轴向振动频率F 及振幅A 的关系。在试验中,F 与A 的变动范围分别为:[125 Hz ,375Hz]与[1.5,5.5],试写出因素水平编码表并利用二次回归正交旋转组合设计安排试验,并写出参与运算的数据结构矩阵。 3、国内民用剪生产一直是沿袭千百年的传统工艺,近代虽有改进,但绝大多数民用剪的生产工艺仍然存在工序多、工艺流程长、质量不稳定、劳动条件差、生产率低、经济效益少等缺点。在全国民用剪生产新工艺的研究中,某厂确定了最佳工艺参数试验因素及取值范围如下:1z 剪刀运行速度[230,370];2z 感应器与剪刀的距离[5.18,10.82];3z 屏极电流[1.24, 1.68],应用二次回归旋转设计写出因素水平编码表和设计方案。 4、应用二次回归旋转设计寻求有害废水净化的最佳工艺条件。 某冶练厂排出的废水中含有大量的镉、砷、铅等有害元素,对环境造成污染。务了保护环境,消除污染,该厂在铁氧体净化废水工艺中应用正交试验设计和二次回归旋转设计。根据废水净化工艺的需要,进行了三指标四因素试验:考察的试验指标为:镉、砷、铅的净化率,试验因素为温度1z (34~42)、时间2z (30~50)、碱与硫酸亚铁之比(1.34~1.46)3z 和硫酸亚铁用量4z (1.5~2.5),给出试验设计方案. 5、利用通用旋转设计寻求镓溶液导电率与因素1z (镓的浓度)和2z (苛性碱浓度)的二次回归试验设计。已知因素试验考察的范围: 1z :L g /70~30, 2z L g /150~90写出因素水平编码表和设计方案。 6、用3GA 、BA 和多菌灵防治苹果腐烂病的试验,各因素的下水平和上水平分别为: 3GA : 0kg mg /和200kg mg /;BA 0kg mg /和 200kg mg /;多菌灵:0%和10%

一次回归正交设计二次回归正交设计二次回归旋转设计样本

一次回归正交设计 某产品产量与时间、温度、压力和溶液浓度关于。实际生产中,时间控制在30~40min,温度控制在50~600C,压力控制在2*105~6*105Pa,溶液浓度控制在 20%~40%,考察Z 1~Z 2 一级交互作用。 因素编码 Z j (x j ) Z 1 /min Z 2 /o C Z 3 /*105Pa Z 4 /% 下水平Z 1j (-1)30 50 2 20 上水平Z 2j (+1)40 60 6 40 零水平Z 0j (0)35 55 4 30 变化间距 5 5 2 10 选取L8(27)正交表 因素x 1,x 1 ,x 3 ,x 4 依次安排在第1、2、4、7列,交互项安排在第3列。 实验号X0 X1(Z1) X2(Z2) X3(Z3) X4(Z4) X1X2 Yi 1 1 1 1 1 1 1 9.7 2 1 1 1 -1 -1 1 4.6 3 1 1 -1 1 -1 -1 10.0 4 1 1 -1 -1 1 -1 11.0 5 1 -1 1 1 -1 -1 9.0 6 1 -1 1 -1 1 -1 10.0 7 1 -1 -1 1 1 1 7.3 8 1 -1 -1 -1 -1 1 2.4 9 1 0 0 0 0 0 7.9 10 1 0 0 0 0 0 8.1 11 1 0 0 0 0 0 7.4 Bj=∑ xjy 87.4 6.6 2.6 8.0 12.0 -16.0 aj=∑ xj2 11 8 8 8 8 8 bj = Bj /aj 7.945 0.825 0.325 1.000 1.500 -2.00 Qj = Bj2 /aj 393 5.445 0.845 8.000 18.000 32.000

回归正交试验设计

8 回归正交试验设计 前面介绍的正交试验设计是——种很实用的试验设计方法,它能利用较少的试验次数获得较好的试验结果,但是通过正交设计所得到的优方案只能限制在已定的水平上,而不是一定试验范围内的最优方案;回归分析是一种有效的数据处理方法,通过所确立的回归方程,可以对试验结果进行预测和优化,但回归分析往往只能对试验数据进行被动的处理和分析,不涉及对试验设计的要求。如果能将两者的优势统一起来,不仅有合理的试验设计和较少的试验次数,还能建立有效的数学模型,这正是我们所期望的。回归正交设计(orthogonal regression design)就是这样一种试验设计方法,它可以在因素的试验范围内选择适当的试验点,用较少的试验建立一个精度高、统计性质好的回归方程,并能解决试验优化问题。 8.1 一次回归正交试验设计及结果分析 一次回归正交设计就是利用回归正交设计原理,建立试验指标(y)与m 个试验因素x 1,x 2,……,x m ,之间的一元回归方程: $1122m m y a b x b x b x =++++L (8-1) 或者 $1 m j j kj k j j k j y a b x b x x =?=++∑∑ k=1,2,…,m -1(j≠k ) (8-2) 8.1.1 一次回归正交设计的基本方法 (1)确定因素的变化范围 根据试验指标y ,选择需要考察的m 个因素x j (j =1,2,…,m),并确定每个因素的取值范围。设因素x j 的变化范围为[x j1,x j2],分别称x j1和x j2为因素x j 的下水平和上水平,并将它们的算术平均值称作因素x j 的零水平,用x j0。表示。 12j02 j j x x x += (8-3) 上水平与零水平之差称为因素x j 的变化间距,用△j 表示,即: 20j j j x x ?=- (8-4) 或 21 2 j j j x x -?= (8-5) (2)因素水平的编码 编码(coding)是将x j 的各水平进行线性变换,即: j j j x x z j -= ? (8-6) 式(8—6)中z j 就是因素x j 的编码,两者是一一对应的。显然,与x j1,x j0和x j2的编码分别为-1,0和1,即z j1=-1,z j2=0,z j2=1。一般称x j 为自然变量,z j 为规范变量。因素水平的编码结果可表示成表8—1。 对因素x j 的各水平进行编码的目的,是为了使每个因素的每个水平在编码空间是“平等”的,即规范变量z j 的取值范围都在[1,-1]内变化,不会受到自然变量x j 的单位和取值大小的影响。所以编码能将试验结果y 与因素z j (j =1,2,…,m)各水平之间的回归问题,转换成试验结果y 与编码值z j 之间的回归问题,

回归正交设计

实验内容:P201习题2、5 模版: 实验3 回归正交试验设计 ◆实验目的 掌握回归正交试验设计原理及统计分析方法,并能通过SAS编程实现 ◆实验内容及实验步骤 1某橡胶制品有橡胶,竖直和改良剂复合而成,为提高撕裂强度,考虑进行一次响应曲面正交设计,三个变量的取值范围分别为: Z:橡胶中等成分的含量0~20 Z:树脂中等成分的含量10~20 Z:改良剂的阿百分比0.1~0.3 (2)如果在试验中心进行了四次重复试验,结果分别为:417,401,455,439,试检验在区域中心一次响应曲面方程是否合适? 实验步骤: I)在SAS系统软件中对该数据进行一次相应曲面正交试验设计,程序如下:data raw1; input tno x1 x2 x3 y @@; cards; 1 -1 -1 -1 407 2 -1 -1 1 421 3 -1 1 -1 322 4 -1 1 1 371 5 1 -1 -1 230 6 1 -1 1 243 7 1 1 -1 250 8 1 1 1 259 ;

proc print data = raw1; proc glm data =raw1; model y= x1 x2 x3 ; Run ; 321625.10375.12375.67875.312x x x y +--= 从方差分析结果来看,2x 和3x 的显著性不高,可推断该曲面方程的忽略了几个变量之间的交互作用,但是拟合度已经达到90.2027%,整个实验还是显著的。 II) 一次响应曲面方程的最大值是403.25,而四次重复试验的结过分别为417, 401,455,439,其中的三个结果都超出了一次相应曲面方程的最大值,所以在区域中心的一次相应曲面方程是不合适的。下面再对三个变量的交互作用进行二次相应曲面方程拟合。程序如下: data raw1; input tno x1 x2 x3 y @@; cards ; 1 -1 -1 -1 407 2 -1 -1 1 421 3 -1 1 -1 322 4 -1 1 1 371 5 1 -1 -1 230 6 1 -1 1 243 7 1 1 -1 250 8 1 1 1 259

正交试验结果分析的回归分析方法

正交试验结果分析的回归分析方法 方法简述 本节的题目表明,本方法仅仅是对正交试验结果进行分析的一种方法。在对正交试验结果进行分析之前,如何明确试验指标、因素和水平,如何选择正交表,如何进行表头设计,如何做实验等,与本章所讲的常规的正交试验设计方法是完全相同的。本方法实际上是用正交表来设计试验方案,再用逐步回归方法来处理正交试验的实验数据。用正交表来设计试验方案,目的是使数据点的分布均匀合理;用逐步回归方法来处理实验数据,目的是为了得到有多种用途的数学回归式。 回归模型和回归方法 正交试验设计方法特别适合于解决多因素试验问题。化工上,大多数的实际问题都是多因素的问题,而且多数问题都是非线性的问题。一个适用于多元线性和非线性回归的回归模型,是下式所示的多元二次多项式:(以4个自变量为例) (4-7) 可见,在4个自变量时,若包括b0则待求的回归系数就多达15个。为此实验的次数至少应16次,而且求回归系数的过程和应用回归式求y的计算过程都很长,舍入误差较大。实际上,如同在方差分析时有些列在F检验中会不显著一样,在按式(4-7)进行回归分析时有些项在F检验中也会不显著。若只让F检验显著的项进入和保留在回归式中,则所得的回归式肯定会比式(4-7)简化许多。为此,我们推荐使用逐步回归方法来进行多元二次多项式的回归。 逐步回归方法见本书的第3章3.5.5。在这种回归方法中,用每次选入时至多选入一项,每次剔除时至多剔除一项,选入、剔除交替进行的办法来进行回归操作。该选入时,从当前尚在回归式之外的众“项”中选择F值最大且F检验显著的一项,送入回归式。该剔除时,从当前已在回归式之中的众“项”中选择F值最小且F检验不显著的一项,从回归式剔除出去。由此可知,在最后所得的回归式中,每一项回归系数的F检验都是显著的。

EXCEL和SPSS在回归分析、正交试验设计和判别分析中应用

实验2指导:EXCEL和SPSS在回归分析、正交试验设计和判别分析中的应用 实验目的 1. 熟悉EXCEL和SPSS在数据分析中的操作; 2. 使用EXCEL和SPSS进行回归分析、正交试验设计和判别分析。 实验内容 1.一元线性回归分析 例:近年来国家教育部决定将各高校的后勤社会化。某从事饮食业的企业家认为这是一个很好的投资机会,他得到十组高校人数与周边饭店的季销售额的数据资料,并想根据高校的数据决策其投资规模,数据见data.xls的Sheet1。 1)选择数据区域B2:C11,从“插入”菜单中选择“散点图”。Excel将显示相应 散点图。 2)选择图上的点,右键菜单,选择添加趋势线,如下图所示: 3)在趋势线选项,将“显示公式”和“显示R平方”选项打勾,如下图:

结果不仅显示散点图的趋势线,还会显示相应公式,即一元线性回归的回归函数,同时显示R平方值,R即相关系数,其绝对值越接近1,表示两组数据的线性相关程度越高。一元线性回归函数描述了两组数据间存在的线性关系,在上述例子中只要知道其它高校的人数即可根据该公式预测大概的季度销售额。而R 的大小能够用于度量这种预测的准确度。 另外,使用EXCEL自带的函数也能实现一元线性回归: 截距函数INTERCEPT 功能:利用已知的x 值与y 值计算回归直线在y 轴的截距。 语法结构:INTERCEPT(known_y's,known_x's) 斜率函数SLOPE 功能:返回根据known_y‘s 和known_x’s 中的数据点拟合的线性回归直线的斜率。 语法结构:SLOPE(known_y's,known_x's) 相关系数函数RSQ 功能:返回根据known_y‘s 和known_x’s 中数据点计算得出的相关系数的平方。 语法结构:RSQ(known_y's,known_x's) 试比较图表法和函数法计算得出的一元线性回归方程是否一致。 2.多元线性回归分析 例:一家房地产评估公司想对某城市的房地产销售价格(y)与地产的评估价值(x1)和使用面积(x2)建立一个模型,一边对销售价格作出合理的预测。为此收集20栋住宅的房地产评估数据(data.xls的Sheet2)。 由于本问题有两个自变量,因此需要使用多元线性回归,需要借助于Excel 的数据分析功能。 1)点击“数据分析”,跳出回归分析对话框; 2)填充应变量y和自变量x1,x2对应的区域和输出区域,如下图:

正交试验设计方法

第5章 正交试验设计方法 5.1 试验设计方法概述 试验设计是数理统计学的一个重要的分支。多数数理统计方法主要用于分析已经得到的数据,而试验设计却是用于决定数据收集的方法。试验设计方法主要讨论如何合理地安排试验以及试验所得的数据如何分析等。 例5-1 某化工厂想提高某化工产品的质量和产量,对工艺中三个主要因素各按三个水平进行试验(见表5-1)。试验的目的是为提高合格产品的产量,寻求最适宜的操作条件。 对此实例该如何进行试验方案的设计呢? 很容易想到的是全面搭配法方案(如图5-1所示): 此方案数据点分布的均匀性极好,因素和水平的搭配十分全面,唯一的缺点是实验次数多达33 =27次(指数3代表3个因素,底数3代表每因素有3个水平)。因素、水平数 愈多,则实验次数就愈多,例如,做一个6因素3水平的试验,就需36=729次实验,显然难以做到。因此需要寻找一种合适的试验设计方法。 试验设计方法常用的术语定义如下。 试验指标:指作为试验研究过程的因变量,常为试验结果特征的量(如得率、纯度等)。例1的试验指标为合格产品的产量。 因素:指作试验研究过程的自变量,常常是造成试验指标按某种规律发生变化的那些原因。如例1的温度、压力、碱的用量。 水平:指试验中因素所处的具体状态或情况,又称为等级。如例1的温度有3个水平。温度用T 表示,下标1、2、3表示因素的不同水平,分别记为T 1、T 2、T 3。 常用的试验设计方法有:正交试验设计法、均匀试验设计法、单纯形优化法、双水平单纯形优化法、回归正交设计法、序贯试验设计法等。可供选择的试验方法很多,各种试

验设计方法都有其一定的特点。所面对的任务与要解决的问题不同,选择的试验设计方法也应有所不同。由于篇幅的限制,我们只讨论正交试验设计方法。 5.2 正交试验设计方法的优点和特点 用正交表安排多因素试验的方法,称为正交试验设计法。其特点为:①完成试验要求所需的实验次数少。②数据点的分布很均匀。③可用相应的极差分析方法、方差分析方法、回归分析方法等对试验结果进行分析,引出许多有价值的结论。 从例1可看出,采用全面搭配法方案,需做27次实验。那么采用简单比较法方案又如何呢? 先固定T1和p1,只改变m,观察因素m不同水平的影响,做了如图2-2(1)所示的三次实验,发现m=m2时的实验效果最好(好的用□表示),合格产品的产量最高,因此认为在后面的实验中因素m应取m2水平。 固定T1和m2,改变p的三次实验如图5-2(2)所示,发现p=p3时的实验效果最好,因此认为因素p应取p3水平。 固定p3和m2,改变T 的三次实验如图5-2(3)所示,发现因素T 宜取T2水平。 因此可以引出结论:为提高合格产品的产量,最适宜的操作条件为T2p3m2。与全面搭配法方案相比,简单比较法方案的优点是实验的次数少,只需做9次实验。但必须指出,简单比较法方案的试验结果是不可靠的。因为,①在改变m值(或p值,或T值)的三次实验中,说m2(或p3或T2)水平最好是有条件的。在T≠T1,p≠p1时,m2水平不是最好的可能性是有的。②在改变m的三次实验中,固定T=T2,p=p3应该说也是可以的,是随意的,故在此方案中数据点的分布的均匀性是毫无保障的。③用这种方法比较条件好坏时,只是对单个的试验数据进行数值上的简单比较,不能排除必然存在的试验数据误差的干扰。 运用正交试验设计方法,不仅兼有上述两个方案的优点,而且实验次数少,数据点分布均匀,结论的可靠性较好。 正交试验设计方法是用正交表来安排试验的。对于例1适用的正交表是L9(34),其试验安排见表5-2。 所有的正交表与L9(34)正交表一样,都具有以下两个特点: (1)在每一列中,各个不同的数字出现的次数相同。在表L9(34)中,每一列有三个水平,水平1、2、3都是各出现3次。 (2)表中任意两列并列在一起形成若干个数字对,不同数字对出现的次数也都相同。在表L9(34)中,任意两列并列在一起形成的数字对共有9个:(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3),每一个数字对各出现一次。

相关主题
文本预览
相关文档 最新文档