当前位置:文档之家› 正交试验方差分析(通俗易懂)

正交试验方差分析(通俗易懂)

正交试验方差分析(通俗易懂)
正交试验方差分析(通俗易懂)

第十一章正交设计试验资料的方差分析

在实际工作中,常常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。

正交设计是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。

第一节、正交设计原理和方法

(一) 正交设计的基本概念

正交设计是利用正交表来安排多因素试验、分析试验结果的一种设计方法。它从多因素试验的全部水平组合中挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优水平组合。

例如,研究氮、磷、钾肥施用量对某小麦品种产量的影响:

A因素是氮肥施用量,设A1、A2、A3 3个水平;

B因素是磷肥施用量,设B1、B2、B3 3个水平;

C因素是钾肥施用量,设C1、C2、C3 3个水平。

这是一个3因素每个因素3水平的试验,各因素的水平之间全部可能的组合有27种。

如果进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。

但全面试验包含的水平组合数较多,工作量大,由于受试验场地、经费等限制而难于实施。

如果试验的主要目的是寻求最优水平组合,则可利用正交设计来安排试验。

正交设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。

正交试验是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。

如对于上述3因素每个因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。

一、正交设计的基本原理

表11-1 33试验的全面试验方案

正交设计就是从全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)来进行试验。图1中标有…9 ?个试验点,就是利用正交表L9(34)从27个试验点中挑选出来的9个试验点。即:

(1)A1B1C1(2)A1B2C2(3)A1B3C3

(4)A2B1C2(5)A2B2C3 (6)A2B3C1

(7)A3B1C3(8)A3B2C1(9)A3B3C2

上述选择,保证了A因素的每个水平与B因素、C 因素的各个水平在试验中各搭配一次。

从图1中可以看到,9个试验点分布是均衡的,在立方体的每个平面上有且仅有3个试验点;每两个平面的交线上有且仅有1个试验点。

9个试验点均衡地分布于整个立方体内,有很强的代表性,能够比较全面地反映全面试验的基本情况。

二、正交表及其特性

(一) 正交表

表11-2 是L8(27)正交表,其中“L”代表正交表;L 右下角的数字“8”表示有8行,用这张正交表安排试验包含8个处理(水平组合) ;括号内的底数“2” 表示因素的水平数,括号内2的指数“7”表示有7列,用这张正交表最多可以安排7个2水平因素。

表11-2 L8(27)正交表

2水平正交表还有L4(23)、L16(215)等;

3水平正交表有L9(34)、L27(313) 、…、等。

(二) 正交表的特性

1、任一列中,不同数字出现的次数相同

例如L8(27)中不同数字只有1和2,它们各出现4次;L9(34)中不同数字有1、2和3,它们各出现3次。

2、任两列中,同一横行所组成的数字对出现的次数相同

例如L8(27)的任两列中(1, 1), (1, 2), (2, 1), (2, 2)各出现两次;L9(34)任两列中(1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (3, 3)各出现1次。即每个因素的一个水平与另一因素的各个水平互碰次数相等,表明任意两列各个数字之间的搭配是均匀的。

用正交表安排的试验,具有均衡分散和整齐可比的特点。

均衡分散,是指用正交表挑选出来的各因素水平组合在全部水平组合中的分布是均衡的。由图11-1可以看出,在立方体中,任一平面内都包含 3 个试验点,任两平面的交线上都包含1个试验点。

整齐可比是指每一个因素的各水平间具有可比性。

因为正交表中每一因素的任一水平下都均衡地包含着另外因素的各个水平,当比较某因素不同水平时,其它因素的效应都彼此抵消。如在A、B、C 3个因素中,A因素的3 个水平A1、A2、A3条件下各有B、C 的3 个不同水平,即:

在这9个水平组合中,A因素各水平下包括了B、C因素的3个水平,虽然搭配方式不同,但B、C皆处于同等地位,当比较A因素不同水平时,B因素不同水平的效应相互抵消,C因素不同水平的效应也相互抵消。所以A因素3个水平间具有可比性。同样,B、C因素3个水平间亦具有可比性。

(三) 正交表的类别

1、相同水平正交表各列中出现的最大数字相同的正交表称为相同水平正交表。

L4(23)、L8(27)、L12(211)等各列中最大数字为2,称为两水平正交表;

L9(34)、L27(313)等各列中最大数字为3,称为3水平正交表。

2、混合水平正交表各列中出现的最大数字不完全相同的正交表称为混合水平正交表。

L8(41×24)表中有一列最大数字为4,有4列最大数字为2。也就是说该表可以安排1个4水平因素和4个2水平因素。

L16(44×23),L16(4×212)等都混合水平正交表。

三、正交设计方法

【例11·1】某水稻栽培试验选择了3个水稻优良品种(A):二九矮、高二矮、窄叶青,3种密度(B):15、20、25(万苗/666.7m2);3种施氮量(C):3、5、8(kg/666.7m2),试采用正交设计安排一个试验方案。

(一) 确定试验因素及其水平, 列出因素水平表

表11-3 因素水平表

(二) 选用合适的正交表

根据因素、水平及需要考察的交互作用的多少来选择合适的正交表。

选用正交表的原则是:既要能安排下试验的全部因素(包括需要考查的交互作用),又要使部分水平组合数(处理数)尽可能地少。

一般情况下,试验因素的水平数应恰好等于正交表记号中括号内的底数;因素的个数(包括需要考查交互作用)应不大于正交表记号中括号内的指数;各因素及交互作用的自由度之和要小于所选正交表的总自由度,以便估计试验误差。

若各因素及交互作用的自由度之和等于所选正交表总自由度,则可采用有重复正交试验来估计试验误差。

此例有3个3水平因素,若不考察交互作用,则各因素自由度之和为因素个数×(水平数-1) = 3 ×(3-1) =6,小于L9(34)总自由度9-1=8,故可以选用L9(34);

若要考察交互作用,则应选用L27(313),此时所安排的试验方案实际上是全面试验方案。

(三) 表头设计

表头设计就是把挑选出的因素和要考察的交互作用分别排入正交表的表头适当的列上。

在不考察交互作用时,各因素可随机安排在各列上;若考察交互作用,就应按该正交表的交互作用列表安排各因素与交互作用。

此例不考察交互作用,可将品种(A)、密度(B)和施氮量(C)依次安排在L9(34)的第1、2、3列上,第4 列为空列,见表2-4。

表11-4 表头设计

L9(34)表头设计

L8(27) 表头设计

(四) 列出试验方案

把正交表中安排因素的各列(不包含欲考察的交互作用列)中的每个数字依次换成该因素的实际水平,就得到一个正交试验方案。

表11-5 正交试验方案

第二节正交试验资料的方差分析

若各号试验处理都只有一个观测值,则称之为单个观测值正交试验;

若各号试验处理都有两个或两个以上观测值,则称之为有重复观测值正交试验。

一、单个观测值正交试验资料的方差分析

对【例11-1】用L9(34)安排试验方案后,各号试验只进行一次,试验结果列于表2-6。试对其进行方差分析。

表11-6 正交试验结果计算表

T i为各因素同一水平试验指标之和,T为9个试验号的试验指标之和;

x为各因素同一水平试验指标的平均数。

该试验的9个观测值总变异由A因素、B因素、C因素及误差变异4部分组成,因而进行方差分析时平方和与自由度的分解式为:

SS T = SS A + SS B + SS C+SSe

df T= df A+ df B+ df C + dfe

用n表示试验(处理)数;a、b、c表示A、B、C因素的水平数;k a、k b、k c表示A、B、C因素的各水平重复数。本例,n=9、a=b=c=3、k a=k b=k c=3。

1、计算各项平方和与自由度

矫正数

C = T2/n = 37112/9 = 1530169.00

总平方和

SST =Σx2-C

=(340.02+422.52+…+462.52)-1530169.00

=21238.00

A因素平方和

T/k a-C

SS A=Σ2

A

=(1201.52+1291.52+1218.02)/3 -1530169.00

=1530.50

B因素平方和

T/k b-C

SS B= Σ2

B

=(1092.02+1278.52+1340.52)/3 -1530169.00

=11153.17

C因素平方和

T/k c-C

SS C=Σ2

C

=(1142.52+1245.02+1323.52)/3 -1530169.00

=5492.17

误差平方和

SS e=SS T-SS A-SS B-SS C

=21238.00-1530.5-11153.17 -5492.17

=3062.16

总自由度df T=n-1=9-1=8

A因素自由度df A=a-1=3-1=2

B因素自由度df B=b-1=3-1=2

C因素自由度df C=c-1=3-1=2

误差自由度df e= df T-df A-df B-df C

= 8-2-2-2 = 2

2、列出方差分析表,进行F检验

表11-7 方差分析表

F 检验结果表明,三个因素对产量的影响都不显著。究其原因可能是本例试验误差大且误差自由度小(仅为2),使检验的灵敏度低,从而掩盖了考察因素的显著性。

由于各因素对增重影响都不显著,不必再进行各因素水平间的多重比较。此时,可从表11-6中选择平均数大的水平A2、B3、C3组合成最优水平组合A2B3C3。

若F检验结果3个因素对试验指标的影响显著或极显著,进行各因素水平间多重比较常采用SSR法。

本例是选用相同水平正交表L9(34)安排的试验,A、B、C因素各水平重复数相同,即k a=k b=k c=3,它们的标准误相同,即

单个观测值正交试验资料的方差分析,其误差是由“空列”来估计的。然而“空列”并不空,实际上是被未考察的交互作用所占据。

这种误差既包含试验误差,也包含交互作用,称为模型误差。

若交互作用不存在,用模型误差估计试验误差是可行的;若因素间存在交互作用,则模型误差会夸大试验误差,有可能掩盖考察因素的显著性。

试验误差应通过重复试验值来估计。所以,进行正交试验最好能有二次以上的重复。正交试验的重复,可采用完全随机或随机区组设计。

二、有重复观测值正交试验资料的方差分析

【例11·4】为了探讨花生锈病药剂防治效果的好坏,进行了药剂种类(A)、浓度(B)、剂量(C)3因素试验,各有3个水平,选用正交表L9(34)安排试验。试验重复2次,随机区组设计。正交试验方案及试验结果(产量kg/小区,小区面积133.3m2)见表11—10,对试验结果进行方差分析。

用r表示试验处理的重复数(区组数);

n,a、b、c,k a、k b、k c的意义同上。

此例r=2;n=9,a=b=c=3,k a=k b=k c=3。

表11-10 防治花生锈病药剂种类、浓度、剂量正交试验方案及结果计算表

T i为各因素同一水平试验指标之和,T为9个试验号的试验指标之和;

x为各因素同一水平试验指标的平均数。

对于有重复、且重复采用随机区组设计的正交试验,总变异可以划分为处理间、区组间和误差变异三部分,而处理间变异可进一步划分为A因素、B因素、C因素与模型误差变异四部分。此时,平方和与自由度分解式为:

SS T=SS t+SSr+SS e2

df T = df t+ df r + df e2

而SS t=SS A+SSB+SS C+SS e1

df t= df A + df B + df C + df e1

于是

SS T= SS A+SS B+SS C+SS r+SS e1+ SS e2

df T = df A + df B + df C + df r + df e1 + df e2

其中:SS r为区组间平方和;SS e1为模型误差平方和;SS e2为试验误差平方和;SS t为处理间平方和;df r、df e1、df e2、df t 为相应自由度。

注意,对于重复采用完全随机设计的正交试验,在平方和与自由度划分式中无SS r、df r项。

1、计算各项平方和与自由度

矫正数

C =T2/ r n =549.02/(2×9)=16744.50

总平方和

SS T=Σx2-C

=28.02+35.02+…+30.02-16744.50

=246.62

区组间平方和

SS r=ΣT2r /n-C

=(273.52+275.52)/9- 16744.50

=0.22

处理间平方和

SS t= ΣT2t / r - C

=(56.52+69.82+…+59.42)/2-16744.50

=245.96

A因素平方和

SS A= ΣT2A / k a r - C

= (191.02+184.42+173.62)/(3×2) - 16744.50

=25.72

B因素平方和

SS B=ΣT2B / k b r - C

=(191.42+169.72+187.92)/(3×2) - 16744.50

=45.24

C因素平方和

SS C= ΣT2C / k c r - C

=(165.82+195.42+187.82)/(3×2) -16744.50

=78.77

模型误差平方和

SS e1= SS t– SS A– SS B - SS C

=245.96- 25.72- 45.24.- 78.77

= 96.23

试验误差平方和

SS e2=SS T– SS r - SS t

=246.62- 0.22- 245.96

= 0.44

总自由度df T=rn-1=2×9-1=17

区组自由度df r=r-1=2-1=1

处理自由度df t=n-1=9-1=8

A因素自由度df A=a-1=3-1=2

B因素自由度df B=b-1=3-1=2

C因素自由度df C=c-1=3-1=2

模型误差自由度df e1 = df t-df A-df B-df C

= 8-2-2-2= 2

试验误差自由度df e2=df T-df r-df t=17-1-8 = 8

2、列出方差分析表,进行F检验

表11-10 有重复观测值正交试验资料的方差分析表

首先检验MS e1与MS e2差异的显著性,若经F检验不显著,则可将其平方和与自由度分别合并,计算出合并的误差均方,进行F检验与多重比较,以提高分析的精度;若F检验显著,说明存在交互作用,二者不能合并,此时只能以MS e2进行F检验与多重比较。

本例MS e1 / MS e2=802.00** ,模型误差均方MS e1与试验误差均方MS e2 差异极显著,说明试验因素间交互作用极显著,只能以试验误差均方MS e2进行F检验与多重比较。

F检验结果表明,药剂种类(A)、浓度(B)、剂量(C)3 因素对花生产量都有极显著影响;区组间差异不显著。

3、多重比较

(1) 若模型误差显著,说明试验因素间存在交互作用,各因素所在列有可能出现交互作用的混杂,此时各试验因素水平间的差异已不能真正反映因素的主效,因而进行各因素水平间的多重比较无多大实际意义,但应进行试验处理间的多重比较,以寻求最处理,即最优水平组合。进行各试验处理间多重比较时选用试验误差均方MS e2。模型误差显著,还应进一步试验,以分析因素间的交互作用。

(2) 若模型误差不显著,说明试验因素间交互作用不显著,各因素所在列有可能未出现交互作用的混杂,此时各因素水平间的差异能真正反映因素的主效,因而进行各因素水平间的多重比较有实际意义,并从各因素水平间的多重比较中选出各因素的最优水平相组合,得到最优水平组合。

进行各因素水平间的多重比较时,用合并的误差均方

MSe=(SS e1+ SS e2)/(df e1+ df e2)

此时可不进行试验处理间的多重比较。

本例模型误差极显著,说明因素间存在交互作用,不必进行各因素水平间的多重比较,应进行试验处理间的多重比较,以寻求最处理,即最优水平组合。为了让读者了解多重比较的方法,下面仍对各因素水平间、各试验处理间进行多重比较。

(1)A、B、C因素各水平平均数的多重比较

表11-12 A因素各水平平均数的多重比较表(SSR法)

表11-13 B因素各水平平均数的多重比较表(SSR法)

表11-14 C因素各水平平均数的多重比较表(SSR法)

因为

由df e=8和k=2, 3, 查得SSR值并计算出LSR值列于表11-15。

表11-15 SSR值与LSR值表

多重比较结果表明:A因素各水平平均产量间、B因素各水平平均产量间、C因素各水平平均产量间差异显著或极显著。各因素的最优水平为A1、B1、C2。

注意,本例模型误差显著,试验因素间存在交互作用,不宜从各因素水平间的多重比较中选出各因素的最优水平相组合来得到最优水平组合。

(2)各试验处理平均数间的多重比较

表11-16 各试验处理平均数多重比较表(LSD法)

因为

由df e=8, 查得t0.05(8)=2.306,t0.01(8)=3.355,计算出LSD值为:

LSD0.05= t0.05(8)×

=2.306

×0.245=0.565

LSD0.01= t0.01(8)×=3.355×0.245=0.822

各试验处理间平均数多重比较结果,除第2号试验处理与第7号试验处理、第3号试验处理与第6 号试验处理平均产量差异不显著外,其余各试验处理平均产量间差异极显著或显著,最优水平组合为第 2 号试验处理A1B2C2(或第7号试验处理A3B1C3)

本例模型误差显著,试验因素间存在交互作用,应以试验处理间的多重比较寻求的最优水平组合,即第2号试验处理A1B2C2(或第7号试验处理A3B1C3)为该试验的最优水平组合。

正交试验方差分析

第三节正交试验设计及其方差分析 在工农业生产和科学实验中,为改革旧工艺,寻求最优生产条件等,经常要做许多试验,而影响这些试验结果的因素很多,我们把含有两个以上因素的试验称为多因素试验.前两节讨论的单因素试验和双因素试验均属于全面试验(即每一个因素的各种水平的相互搭配都要进行试验),多因素试验由于要考虑的因素较多,当每个因素的水平数较大时,若进行全面试验,则试验次数将会更大.因此,对于多因素试验,存在一个如何安排好试验的问题.正交试验设计是研究和处理多因素试验的一种科学方法,它利用一套现存规格化的表——正交表,来安排试验,通过少量的试验,获得满意的试验结果. 1.正交试验设计的基本方法 正交试验设计包含两个内容:(1)怎样安排试验方案;(2)如何分析试验结果.先介绍正交表. 正交表是预先编制好的一种表格.比如表9-17即为正交表L4(23),其中字母L表示正交,它的3个数字有3种不同的含义: (1) L4(23)表的结构:有4行、3列,表中出现2个反映水平的数码1,2. 列数 ↓ L4 (23) ↑↑ 行数水平数 (2)L4(23)表的用法:做4次试验,最多可安排2水平的因素3个. 最多能安排的因素数 ↓ L4(23) ↑↑ 试验次数水平数 (3) L4(23)表的效率:3个2水平的因素.它的全面试验数为23=8次,使用正交表只需从8次试验中选出4次来做试验,效率是高的. L4(23) ↑↑ 实际试验数理论上的试验数 正交表的特点: (1)表中任一列,不同数字出现的次数相同.如正交表L4(23)中,数字1,2在每列中均出现2次. (2)表中任两列,其横向形成的有序数对出现的次数相同.如表L4(23)中任意两列,

正交实验_方差分析法

正交实验 1. 选择正交表 根据上面的水平表,由于水平数2,所以要选用L n (2 )型正交表,本例中有3个因素,且考虑因素间的交互作用,所以要选一张5 m 的表,而L 8(27)是满足条件的最小L n (2m )型正交表。 2. 表头设计 3. 数据的填写与试验结果 4. 计算K1、K2、R 由于计算K1、K2、R ,数据量小,且数据所在列不规则,可以直接在要求和单元格里直接输入=单元格+单元格 的简单公式如下图 水平 (A)碱含量/% (B)操作温度/°C ?填料种类 1 5 40 甲 2 10 20 乙 试验号 A B A ×B C 空列 B ×C 空列 SO 2摩尔分率×100 1 2 3 4 5 6 7

同理用这个方法可以求得K2、R ,如下图 5. 计算离差平方和 利用Excel 内置函数SUMSQ ()该函数返回所选数的平方和,如计算A 2+B 2可以输入=SUMSQ(A,B),可得到结果,与平时所用求和函数SUM ()类似。 由于n T K K n SS A 22 2)21(2-+= ;其中∑== n i i y T 1 =97,可用SUM 求得

其中,P=T2/n可在单元格B24中输入“=B23*B23/8”求得。 而SS A的计算可在B20单元格中输入“=SUMSQ(B16:B17)/4-$B$24”; 其中$代表绝对引用。复制公式到C20,D20,E20,F20,G20,G20,可得到各自的离散和。6.方差分析 下图为所填写好的方差分析表: 差异源SS df MS F 显著性 A 6.125 1 6.125 B 136.125 1 136.125 14.91781 * C 3.125 1 3.125 A×B 171.125 1 171.125 18.75342 * B×C 105.125 1 105.125 11.52055 * 误差e 27.25 2 13.625 误差e△36.5 4 9.125 (1,4) 7.708647421 F 0.05 F (1,4) 21.19768958 0.01 其中A,B,C的自由度是为m(水平数)-1,A×B,B×C的自由度为dfA×df B, df B× df C 误差e是空列SS之和,自由度也是空列个数之和。 误差e△是合并A,B两因素离散平方和后的结果,因为SS A,SS B都小于误差项e,故将其并入误差e△中去。 对于显著性水平α=0.05,0.01,的F0.05(1,4),与F0.01(1,4),可通过函数FINV()求得。7.主次顺序分析 从离散和可以直接看出主次顺序:A×B , B ,B×C 由于存在交互项的影响较在,故应该在通过因子的搭配来确定最优方案。

正交试验方差分析(通俗易懂)

第十一章正交设计试验资料的方差分析 在实际工作中,常常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。 正交设计是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。 第一节、正交设计原理和方法 (一) 正交设计的基本概念 正交设计是利用正交表来安排多因素试验、分析试验结果的一种设计方法。它从多因素试验的全部水平组合中挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优水平组合。 例如,研究氮、磷、钾肥施用量对某小麦品种产量的影响: A因素是氮肥施用量,设A1、A2、A3 3个水平; B因素是磷肥施用量,设B1、B2、B3 3个水平; C因素是钾肥施用量,设C1、C2、C3 3个水平。 这是一个3因素每个因素3水平的试验,各因素的水平之间全部可能的组合有27种。 如果进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。 但全面试验包含的水平组合数较多,工作量大,由于受试验场地、经费等限制而难于实施。 如果试验的主要目的是寻求最优水平组合,则可利用正交设计来安排试验。 正交设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。 正交试验是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。 如对于上述3因素每个因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。 一、正交设计的基本原理 表11-1 33试验的全面试验方案

利用SPSS 进行方差分析以及正交试验设计

实验设计与分析课程论文 题目利用SPSS 软件进行方差分析和正交试验设计 学院 专业 年级 学号 姓名 2012年6月29日

一、SPSS 简介 SPSS 是世界上最早的统计分析软件,1984年SPSS 总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS 微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS 的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。 SPSS 的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS 统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic 回归、Probit 回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS 也有专门的绘图系统,可以根据数据绘制各种图形。SPSS 的分析结果清晰、直观、易学易用,而且可以直接读取EXCEL 及DBF 数据文件,现已推广到多种各种操作系统的计算机上,它和SAS 、BMDP 并称为国际上最有影响的三大统计软件。 SPSS 输出结果虽然漂亮,但不能为WORD 等常用文字处理软件直接打开,只能采用拷贝、粘贴的方式加以交互。这可以说是SPSS 软件的缺陷。 二、方差分析 例如 某高原研究组将籍贯相同、年龄相同、身高体重接近的30名新战士随机分为三组,甲组为对照组,按常规训练,乙组为锻炼组,每天除常规训练外,接受中速长跑与健身操锻炼,丙组为药物组,除常规训练外,服用抗疲劳药物,一月后测定第一秒用力肺活量(L),结果见表。试比较三组第一秒用力肺活量有无差别。对照组为组一,锻炼组为组二,药物组为组三。 第一步:打开 SPSS 软件 表1 三组战士的第一秒用力肺活量(L) 对照组 锻炼组 药物组 合计 3.25 3.66 3.44 3.32 3.64 3.62 3.29 3.48 3.48 3.34 3.64 3.36 3.16 3.48 3.52 3.64 3.20 3.60 3.60 3.62 3.32 3.28 3.56 3.44 3.52 3.44 3.16 3.26 3.82 3.28

正交试验方差分析(通俗易懂)

第十一章正交设计试验资料得方差分析 在实际工作中,常常需要同时考察3个或3个以上得试验因素,若进行全面试验,则试验得规模将很大,往往因试验条件得限制而难于实施。 正交设计就是安排多因素试验、寻求最优水平组合得一种高效率试验设计方法. 第一节、正交设计原理与方法 (一)正交设计得基本概念 正交设计就是利用正交表来安排多因素试验、分析试验结果得一种设计方法。它从多因素试验得全部水平组合中挑选部分有代表性得水平组合进行试验,通过对这部分试验结果得分析了解全面试验得情况,找出最优水平组合. 例如,研究氮、磷、钾肥施用量对某小麦品种产量得影响: A因素就是氮肥施用量,设A1、A2、A3 3个水平; B因素就是磷肥施用量,设B1、B2、B3 3个水平; C因素就是钾肥施用量,设C1、C2、C3 3个水平。 这就是一个3因素每个因素3水平得试验,各因素得水平之间全部可能得组合有27种。 如果进行全面试验,可以分析各因素得效应,交互作用,也可选出最优水平组合。 但全面试验包含得水平组合数较多,工作量大,由于受试验场地、经费等限制而难于实施。 如果试验得主要目得就是寻求最优水平组合,则可利用正交设计来安排试验. 正交设计得基本特点就是:用部分试验来代替全面试验,通过对部分试验结果得分析,了解全面试验得情况。 正交试验就是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用得混杂。 如对于上述3因素每个因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合得全面试验得情况,找出最佳得生产条件。 一、正交设计得基本原理 表11-1 33试验得全面试验方案

#正交试验结果的方差分析方法

正交试验结果的方差分析方法 计算公式和项目 试验指标的加和值= , 试验指标的平均值和表4-13一样,第j列的 (1) I j”水平所对应的试验指标的数值之和 (2) II j——“ 2”水平所对应的试验指标的数值之和 (3)…… (4) k j——同一水平出现的次数。等于试验的次数除以第j列的水平数. (5)I j/k j——“水平所对应的试验指标的平均” (6)II j/k j——“2”水平所对应的试验指标的平均值 (7)……以上各项的计算方法,和“极差法”同,见4.1.7节 (8)偏差平方和 (4-1) (9) f j ——自由度.f j 第j列的水平数-1. (10)V j ——方差. Vj =S j /f j (4-2) (11)V e ——误差列的方差。 (4-3) (12)F j ——方差之比 (4-4)

(13)查F分布数值表(见附录6),做显著性检验。显著性检验结果的具体表示方法和第3章相同。 (14)总的偏差平方和 (4-5) (15)总的偏差平方和等于各列的偏差平方和之和。即 (4-6) 式中,m为正交表的列数。 若误差列由5个单列组成,则误差列的偏差平方和S e等于5个单列的偏差平方和之和,即:S e=S e1+S e2+S e3+S e4+S e5;也可用S e= S总-S’来计算,其中:S’为安排有因素或交互作用的各列的偏差平方和之和 应引出的结论。 和极差法相比,方差分析方法可以多引出一个结论:各列对试验指标的影响是否显著,在什么水平上显著。在数理统计上,这是一个很重要的问题。显著性检验强调试验误差在分析每列对指标影响中所起的作用。如果某列对指标的影响不显著,那么,讨论试验指标随它的变化趋势是毫无意义的。因为在某列对指标的影响不显著时,即使从表中的数据可以看出该列水平变化时,对应的试验指标的数值也在以某种“规律”发生变化,但那很可能是由于实验误差所致,将它作为客观规律是不可靠的。有了各列的显著性检验之后,最后应将影响不显著的交互作用列和原来的“误差列”合并起来,组成新的“误差列”,重新检验各列的显著性。 方差分析方法使用举例 例4-6为了提高猪发酵饲料的营养和猪爱吃的程度,选择了四个因素进行正交试验,其因素水平见表4-18。 表4-18例4-6的因素水平表 因素发酵温度/℃发酵时间/h 初始的PH值投曲量/ % 符号x1x2x3x4 水平 1 10 1 2 7 5 2 20 24 6 10 3 30 48 5

正交试验方差分析(通俗易懂)复习过程

正交试验方差分析(通 俗易懂)

第十一章正交设计试验资料的方差分析 在实际工作中,常常需要同时考察 3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。 正交设计是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。 第一节、正交设计原理和方法 (一) 正交设计的基本概念 正交设计是利用正交表来安排多因素试验、分析试验结果的一种设计方法。它从多因素试验的全部水平组合中挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优水平组合。例如,研究氮、磷、钾肥施用量对某小麦品种产量的影响: A因素是氮肥施用量,设A1、A2、A3 3个水平; B因素是磷肥施用量,设B1、B2、B3 3个水平; C因素是钾肥施用量,设C1、C2、C3 3个水平。 这是一个3因素每个因素3水平的试验,各因素的水平之间全部可能的组合有27种。 如果进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。 但全面试验包含的水平组合数较多,工作量大,由于受试验场地、经费等限制而难于实施。 如果试验的主要目的是寻求最优水平组合,则可利用正交设计来安排试验。

正交设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。 正交试验是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。如对于上述3因素每个因素3水平试验,若不考虑交互作用,可利用正交表 L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。 一、正交设计的基本原理 表11-1 33试验的全面试验方案

第8章 正交试验设计的方差分析例题

8.3.2 考虑交互作用的三水平正交试验的方差分析(因学时有限和正交表太大L27(313),不讲解!只讲解二水平情况,因为二水平会,三水平自然也会!) 例8-4 运动发酵单细胞菌是一种酒精生产菌。为了确定其发酵培养基的最佳配方,进行了四因素三水平正交试验,试验指标为酒精浓度(g/ml)。表8-12给出了因素水平表,要求考察交互作用A×B、A×C和A×D。查附表7可得,本试验应选用L27(313)正交表,表头设计应按照“L27(313)二列间的交互作用表”进行。本例只考虑一级交互作用(p=1),所以每个三水平交互作用应占(m-1)P=(3-1)1=2列,即A ×B、A×C,和A×D在L27(313)正交表中各占二列。 表8-12 因素水平表 表头设计时应避免混杂,试验方案及试验结果见表8-13。 由交互作用表可知,将因素A、B安排在第1、2列之后,第3、4列为A×B交互作用列;再将C安排在第5列后,A×C交互作用在第6、7列;最后将D安排在第9列,则A×D交互作用类落在第8、10列(当然也可将D安排在第8列,则第9、10列为A×D交互作用列)。 表8-13 试验方案及结果分析 L27(313)

一、计算(计算过程省略) 1.计算各列各水平的K ij 值(K 1j ,K 2j ,K 3j )和K 2 ij (K 21j ,K 22j ,K 23j ) 各列各水平对应的试验数据之和K 1j ,K 2j ,K 3j ,及其平方和K 21j , K 22j , K 23j ,列于表8-13中,例如 K 1A = ∑=9 1 i i X =0.20+0.50*2+1.50+1.10+1.20*2+1.60*2=9.40=K 11 , K 2 11= 88.36 K 2A =∑=9 1i i X =0.40+0.50+……+6.15=33.05= K 21 , K 221=1092.30 K 3A =∑=9 1 i i X =0.40+0.30+……+2.80=25.80= K 31 , K 231 =665.64 表示A ×B 的有两列,即第3,4列,计算后可知 K 13 =32.75, K 23 =17.90; K 33 =17.60 K 14 =26.40; K 24 =24.55, K 34 =17.30 2.计算各列的偏差平方和(S j )及其自由度(f j ) 由式(8-4),可知: S j =CT Q n T K r j m i ij -=-∑=2 2 11 r=n/m=27/3=9; CT=T 2/n=1/27×68.252=172.52

第8章 正交试验设计的方差分析

第8章正交试验设计的方差分析 前面我们讨论了如何安排正交试验以及用极差分析法(即直观分析法)对试验结果进行计算分析.极差分析法简单明了,通俗易懂,计算工作量少,便于普及推广.但这种方法不能把试验中由于试验条件的改变引起的数据波动,同试验误差引起的数据波动区分开来.也就是说,不能区分因素各水平对应的试验结果间的差异,究竟是由于因素水平不同引起的,还是由于试验误差引起的,即不知道试验的精度.同时,对影响试验结果的各个因素的重要程度,既不能给出精确的定量估计,也不能提供一个标准,用来判断所考察的因素的作用是否显著. 为了弥补极差分析法的不足,对试验结果的分析可采用方差分析法. 8.1 正交试验方差分析的基本步骤 在第2章中我们已经介绍过,方差分析的基本思想是将数据的总偏差平方和(S T)分解为因素的偏差平方和(S A、S B)和误差的偏差平方和(S e),然后将偏差平方和除以相对应的自由度(f)得到方差(V A、V B),最后利用因素方差与误差方差之比(V A/V e,V B/V e),作F检验,即可判断因素的作用是否显著.正交试验设计的方差分析也是按这样的步骤进行的,所不同的是这是考虑的是多因素试验的方差分析,而第2章中只考虑单因素和双因素试验的方差分析. 一、计算 1.偏差平方和与自由度的计算

方差分析的关键是偏差平方和的分解,现在以最简单的L 4(23)正交表上安排的试验为例来说明(见表8-1,板书).不考虑哪些因素安排在哪些列上(即表头设计时),设试验结果为x 1、x 2、x 3和x 4. 总的偏差平方和: 4 )(2 4 1 221 212 _T x n T x x x S i i n i i n i i T - =- =-=∑∑∑=== T=∑=n i i x 1 =(x 21+x 22+x 23+x 24)-4 1 (x 4321x x x +++)2 整理后可得 43 = (24232221x x x x +++) 2 1 - (434232413121x x x x x x x x x x x x +++++) 第1列各水平偏差平方和为 S 1=22 _ 21_ 2 _11_ )(2)(x K x K -+- =2[221211)4 2()42( T K T K -+-] =2[T K T K T K T K 2111222122114 1 41164164--+++] =22 2121141)(21T K K -+ )(211141 K K x T i i +==∑= =24321243221)(41])()[(21x x x x x x x x +++-+++ =)(2 1)(414321423241312 42322 21x x x x x x x x x x x x x x x x --+++-+++ 表8-1 L 4(23)正交表及计算表

相关主题
文本预览
相关文档 最新文档