当前位置:文档之家› 第九章方差分析

第九章方差分析

第九章方差分析
第九章方差分析

第七章 方差分析

第一节什么是方差分析

首先通过一个实例,简要地说明什么是方差分析,方差分析具体解决什么问题。 【例7-1】:对稻谷作物采用5种不同的施肥方法进行试验,每种方法取4块条件相同,面积均为0.1亩的地块。试验结果,稻谷产量如表7-1所示。

表7-1

如果把每一种施肥方法下的稻谷作物产量看作一个总体,则上表中各列数据可看成来自五个不同总体的样本值。将各个总体的均值依次记为12345,,,,μμμμμ,按题意需检验假设

01251125::,,,H H μμμμμμ=== 不全相等

解决以上问题,能否使用前一章假设检验中的两样本均值t 检验,即两两分别检验两总体(例如,1μ和2μ,1μ和3μ,1μ和4μ,…,2μ和3μ,…)的均值是否相等呢?这样做在统计上不妥的。因为统计学的结论都是讲概率性的,存在着犯错误的可能。在上例中,若进行两两样本均值t 检验,需进行10次,对于某一次比较,其犯第一类错误的概率是α,那么连续10次比较,其犯第一类错误的概率是多少?答案不是10

α,而是10

1(1)α--。也就是说,如果检验水准取0.05,那么在连续10次t 检验中,犯一类错误的概率将上升0.4013!这是一个令人震惊的数字,就好像考试及格线原本是60分,现在被降到了20分,导致考试的权威性大打折扣一样。因此,多个均数比较时不宜采用t 检验作两两比较。

方差分析(Analysis of Variance,简写为ANOV ),则能有效、快速的解决以上问题,一次性检验出多个总体均值是否相同。可见,方差分析是假设检验的分支,是工农业生产和科学研究中分析数据的一种重要工具,常用于研究不同生产条件对试验结果有无显著影响的问题。

在方差分析中,我们将要考察的指标称为观察变量,影响观察变量的条件称为因素,又称因子,通常用A ,B ,C ,…表示。因素可以分为两类,一类是人可以控制的因素,称为可控因素;一类是人很难控制的,称为随机因素。上例中,施肥方法就是一个可控因素,而测量误差、气象条件等则一般是难以控制的。若某因素A 有r 个不同状态,就称它有r 个水平,用1A ,

2A ,…,r A 表示。

方差分析就是要分析可控因素的不同水平是否对观察变量产生了显著影响。方差分析中,仅考虑一个因素的变动称为单因素方差分析;考虑两上或以上因素的变动则称为多因素方差分析。多因素方差分析中,若各因素之间相互独立,称为无交互作用;如果各因素间相互影响,则称为有交互作用,交互作用也是影响观察变量的一个因素,必须纳入方差分析。

本章就单因素方差分析和两因素方差分析进行系统的介绍

第二节单因素方差分析

单因素方差分析(One –way ANOV A ),用来分析某一个可控因素的不同水平是否给观察变量造成显著差异和变动,或者说检验其各水平分组下的均值是否来自同一总体。如上例7-1中,假定其它条件完全相同,仅考虑施肥方法不同对作物产量有无显著影响。 一、单因素方差分析数据结构

为了分析的标准化,把上面的例子一般化,即:设检验因素A 取r 个水平,记作12,,,r A A A Λ。在i A 水平下作了n 次重复试验(这里每个水平所作的试验重复次数可以不同)。i A 水平下第j 次试验结果的观测值为ij x 2(1,2,,;1,2,,),(,)ij i i i r j n x N μσ=Λ=Λ ,单因素r 个水平数据结构表如表7-2所示。

表7-2 单因素 r 个水平数据结构表

其中, (1)

11

,,,,(1,2,,)n

r

n

i i ij ij i j i j x x

x x x x x x i r n nr

====

==

==Λ∑∑∑ (7.1)

二、单因素方差分析的基本原理

表7-1的的每一列的观测值都是完全相同条件下的试验结果,是来自同一个总体的样本值,故同一水平各观测值之间的差异应为随机因素导致的随机误差。如果因素A 的各水平对观察变量没有影响,各列的观测值均来自同一个总体,那么,各列的平均值i x 应基本相等,若有差异也是随机误差。反之,如果因素A 不同水平对观察变量有影响,各列的观测值就是来自不同的总体,各列的平均值之间则会有显著的差异。此时的差异,不能再由随机误差完全解释,而有充分理由判断主要是因素A 的不同水平导致的系统误差。

方差分析解决问题的思想就是:从所有观察值的总变异中,分离出系统误差和随机误差,并用数量表示。在一定意义下比较系统误差和随机误差,两者差别不大,说明因素水平的不同对试验结果影响不大;如果两者相差较大,且系统误差大得多,说明因素水平的不同对试验结果有显著影响。

在方差分析中,差异的大小以离差平方和来衡量。所有观察值的总变异程度用总离差平方和反映,记作SST (Sum of Squares for Total );这个总变异被分解为两项,一项是各组间的离差平方和,记作SSA (Sum of Squares Among Gourp ) ,既包括了因素A 的作用(如果这个作用存在的话),也包括了随机误差;另一项为各组内的离差平方和,记作SSE (Sum of Squares for Error ),完全是随机因素导致的随机误差。

2()ij i

j

SST x x =-∑∑ (7.2)

2

..2

2

....()()()()2()()

ij i i i

j

ij i i ij i i i

j

i

j

i

j

x x x x x x x x x x x x ??=-+-??

=-+-+--∑∑∑∑∑∑∑∑

上式中,交叉项之和为零,即:

.....()()()()

()00

ij

i i i ij i i

j

i

j

i i

x

x x x x x x x x x --=--=-?=∑∑∑∑∑

进一步记:

2.()i i

j

SSA x x =-∑∑ (7.3)

2.()ij i i

j

SSE x x =-∑∑ (7.4)

因此,我们得到总离差平方和的分解式:

SST=SSA+SSE (7.5)

显然,上述离差的分解公式和理论上误差的来源分解间存在着如下的对应关系:

总变差=因素不同水平导致系统误差+随机因素导致的随机误差

总离差平方和=组间离差平方和+组内离差平方和

三、检验统计量的设置和方差分析表

前面己指出,检验因素作用的显著性,实质上就是检验以下假设:

012112::,,,r r H H μμμμμμ=== 不全相等

原假设是否为真,关键是看SSA 和SSE 两者间的相对比较,即:

SSA

F SSE

=

(7.6) 但考虑到SSA 与SSE 的构造,其大小与参加求和的项数有关,显然项数越多SS 越大,比值不具有可比性。因此,在F 检验统计量的分子、分母上都除以各自的自由度。SSA 是因素A 在不同水平上的均值.i x 变化而产生的离差平方和,由于r 个均值并不是独立的,它们必须满足约束条件:

.

()0i i

x

x -=∑,因此失去一个自由度,它的自由度是1r -。SSE 是由ij x 在各水平

i A 上围绕其均值.i x 波动产生的,它们必须满足约束条件:.()0ij i j

x x -=∑,一共有r 个,失去r

个自由度,所以SSE 的自由度是nr r -; SST 是nr 个ij x 围绕x 波动引起的,但这nr 个变量必须满足一个约束条件:()0ij

i

j

x

x -=∑∑,所有自由度只有自1nr -。SST ,SSA 和SSE 的

自由度满足如下关系:

1(1)()nr r nr r -=-+- (7.7)

由此,改进后的检验统计量为:

/1(1,)/SSA r MSA

F F r nr r SSE nr r MSE

-=

=--- (7.8)

这里,MSA 称为组间均方差(Mean Squares Among Group ),MSE 称为组内均方差(Mean Squares for Error )。

显而易见,在H 。成立时,各列平均数之间没有系统误差,纯属随机误差,则MSA 和MSE 大致相等,F 值应接近于1。如果原假设不成立,即各列平均数之间除随机误差外,还有系统误差,则SSA SSE ,F 值也远大于1,并且各组间的不一致程度越强,F 值越大,说明因素A 的影响越显著。因此,检验的拒绝域在右侧。对于给定的显著性水平α,查F 分布表得临界值(1,)F r nr r α--,当F F α 时,拒绝原假设,接受备择假设,认为所检验因素对观测变量有显著影响;当F F α 时,接受原假设,认为没有证据说明所检验因素对观测变量有显著影响。

四、实例运用

现在我们去解决例7-1中提出的问题。 解:建立原假设和备择假设

01251125::,,,H H μμμμμμ=== 不全相等

计算组内离差平方和SSE 、组间离差平方和SSA 。 首先,计算各组组内离差平方和,即:

第一组:2222(6757.75)(6757.75)(5557.75)(4257.75)426.68-+-+-+-= 第二组:2222(9887.75)(9687.75)(9187.75)(6687.75)665.62-+-+-+-=

同理可得第三组、第四组、第五组的组内离差平方和分别为:637.10,189.00,252.68 则: 426.68665.626371.1189252.682171.08SSE =++++=

22

2224(57.7570.85)4(87.7570.85)4(53.570.85)4(73.570.85)4(81.7570.85)3537.68

SSA =-+-+-+-+-= 本例中,施肥方法有5种,即r=5,SSA 的自由度为1514r -=-=;每一种施肥方法下都进行了4次试验,即n=4,SSE 的自由度为45515nr r -=?-=;SST 的自由度为145119nr -=?-=。

检验统计量

/1/3

537.68/46.112171.08/15S

S A r M S A F S S E n r r M S E -==-==

查表,临界值0.010.05(4,15) 4.89,(4,15) 3.06F F ==

因为,F F α ,所以拒绝原假设,说明不同施肥方法对稻谷作物的产量有显著影响。 在实际应用中,大多统计软件如SPSS 、SAS ,以及EXECL 常以方差分析表的形式给出有关计算结果。如表7-3所示。

五、单因素方差分析中的几个问题

使用单因素方差分析时,应注意以下几个问题:

第一, 方差分析需满足的假设条件。方差分析实质上是对各总体均值相等假设进行检验,为了得到检验统计量的精确分布,要求满足的前提条件是:①样本是独立的随机样本(Independence sample )。举例来说,对于田间试验,两个区块中庄稼的产量差别应当仅仅与处理有关,而应当与两块地是否邻近无关;对于实验室研究,应当尽量避免由于试验者主观的系统误差而导致相关性。然而测量误差或者试验设计时的失误往往均会导致独立性的要求得不到满足,此时原始资料存在着信息“重叠”的现象,方差分析的结果往往会受到相当大的影响。因此在试验设计阶段就应当保证随机化真正得到实施。②各样本均来自正态分体(Normality )。Box 和Anderson 等人的研究表明,正态性得不到满足时,方差分析的结论并不会受到太大的影响,也就是说,方差分析对于正态性的要求是健的。③总体方差具有齐性,即各总体方差相等(Homoscedascity )。在各组间样本含量相差不太大时,方差轻微不齐仅会对方差分析的结论有少许影响,一般而言,只要最大/最小方差之比小于3,分析结果都是稳定的。一般情况下,我们总认为以上的假定条件都是满足的或近似满足的。这一点对于多因素分析也有效。

第二,均衡性问题。在前而的数据结构中,因素各水平下的样本容量可以相等也可以不相等,分析过程和结果不受到影响。但各组在样本含量上的均衡性将会为分析计算提供极大的便利,也能在一定程度上弥补正态性或方差齐性得不到满足时对检验效能所产生的影响,这一点在多因素分析时体现得尤为明显。因此,在试验设计时就应当注意到均衡性的问题。

第三,方差分析将所有样本结合在一起,使数据数量增多,提高了分析结果的稳定性。但是,方差分析也存在不足之处。如假设检验结果拒绝了原假设,我们认为各总体的均值不全相等,至于哪个总体均值大,哪个总体均值小,方差分析本身不能回答,而需要进一步进行单因素水平间的多重比较(Multiple –Comparision ),限于篇幅,这里不作介绍,有兴趣的读者可以参考其他资料。

第三节 双因素方差分析

在实际问题中,影响一个量的因素很多,它们对所考虑的观测变量都有一定的影响,如某公司在分析商品销售量的影响因素时,不仅要考虑产品包装,还要考虑销售价格、新闻广告等其他因素,那么主要因素是什么?各因素之间有无交互作用?这是多因素方差分析解决的问题。多因素方差分析与单因素方差分析类似,关键是如何把总离差平方和进行分解。下面以两因素的方差分析为例,分两种情况进行介绍。 一、无交互作用的双因素方差分析

设A 和B 是可能对试验结果产生影响的两个因素,两因素相互独立,无交互作用。因素A 有a 个水平:12,,,a A A A Λ,因素B 有b 个水平:12,,,b B B B Λ,则因素A 和B 共有a b ?个组合,在每一种组合条件下各做一次试验,其结果记为(1,2,,;1,2,,)ij x i a j b =Λ=Λ,得到数据结构如表7-4所示。

表7-4 双因素无交互作用因素分析数据结构表

其中:

.1

1(1,2,,)b

i ij j x x i a b ===Λ∑ (7.9) .1

1(1,2,,)a

j ij

i x x j b a ===Λ∑ (7.10)

11

1(1,2,,;1,2,,)a

b

ij i j x x i a j b ab ====Λ=Λ∑∑

(7.11)

现要分析因素A 和B 对观测变量有无显著影响,就是要对以下两个假设做出检验:

0 1. 2..:a H x x x === (因素A 对观测变量无显著影响)

1.:,1,2,,i H x i a =Λ不全相等 (因素A 对观测变量有显著影响) 0.1.

2.:b H x x x === (因素B 对观测变量无显著影响) 1.:,1,2,,j H x j b =Λ不全相等 (因素B 对观测变量有显著影响)

同单因素方差分析的原理一样,将观测变量的总离差平方和加以分解,有:

SST SSA AAB AAE =++ (7.12) 其中:

2

11()a b

ij

i j SST x

x ===-∑∑ (7.13) 2

2.

.111()()a

b

a

i i i j i SSA x

x b x x ====-=-∑∑∑ (7.14)

2

2..11

1

()()a

b b

j

j i j j SSB x

x a x x ====-=-∑∑∑ (7.15)

2..11

()a

b ij

i j i j SSE x

x x x ===

--+∑∑ (7.16)

SST 表示总的离差平方和;SSA 表示因素A 水平变化引起的误差,称为因素A 的离差平方

和;SSB 表示因素B 水平变化引起的误差,称为因素B 的离差平方和;SSE 表示除了因素A 、B 以外的随机因素引起的误差,称随机误差的离差平方和。各离差平方和的自由度分别是:1,ab -1,a -1,b -(1)(1)a b --。且有:

1(1)(1)(1)(1)ab a b a b -=-+-+-- (7.17) 分别构造检验因素A 和B 影响是否显著的检验统计量:

[]/11,(1)(1)/(1)(1)A SSA a MSA

F F a a b SSE a b MSE -=

=----- (7.17)

[]/11,(1)(1)/(1)(1)B SSB b MSB

F F b a b SSB a b MSE

-==----- (7.18)

这里,MSA 称因素A 的均方差,MSB 称因素B 的均方差,MSE 称随机因素均方差。

【例7-2】将土质基本相同的一块耕地,等分成5个区块,每个区块又分成3个小区。现有3个品种的小麦,将这四种小麦随机地分种在每个区块的3个小区里。测得其收获量如下表(7-5): 表7-5 四种小麦收获量(单位:公斤)

试问不同区块和品种对小麦收获量有无显著影响。 解:根据题意,检验的假设有两个:

0:A H 不同品种对小麦收获量无显著影响;

1:A H 不同品种对小麦收获量有显著影响。 0:B H 不同区块对小麦收获量无显著影响; 1:B H 不同区块对小表收获量有显著影响。

利用有关公式进行计算(具体步骤略),计算结果以方差分析表给出,见表7-6所示。

从表7-6可知:05.0A ,拒绝0A ,接受1A ,认为不同品种对小麦收获量有显著影响;0.051.59 3.837854B F F == ,接受0B H ,说明不同区块对小麦收获量无显著影响。

二、有交互作用的双因素方差分析

在双因素方差分析中,若我们没有充足理由判定因素A 和因素B 是相互独立的,就必须考虑两因素之间的交互作用。因素间联合搭配对实验结果所起的作用称为交互作用,因素A 和因素B 的交互作用表示为A ×B ,为了考察交互作用的影响,需要对换每一对水平组合作m 次重复试验,得到试验数据结构如表7-7所示。

表7-7 双因素有交互作用方差分析数据结构

其中:ijl x 表示在因素水平组合下(i A ,j B )下第l 次试验的结果。在此组合下m 次试

验结果的平均值:.1

1m

ij ijl l x x m ==∑ (7.19) ..11

1b m

i ijl j l x x bm ===∑∑ (7.20)

..111a m

j ijl i l x x am ===∑∑ (7.21)

111

1a b m

ijl i j l x x abm ====∑∑∑ (7.22)

类似可将观测变量的总离差平方和分解,有:

SST SSA SSB SSAB SSE =+++ (7.23) 式中,

2111

()a b m

ijl i j l SST x x ====-∑∑∑ (7.24)

2..

1

()a

i i SSA bm x

x ==-∑ (7.25) 2..

1()b

j j SSB am x

x ==-∑ (7.26) 2.

(11)

()a

b ij i j i j SSAB m

x

x x x ===--+∑∑ (7.27) 2.1

1

()a

b

m ijl

ij i j l SSE x

x ====

-∑∑∑ (7.28)

与无交互作用的双因素方差分析分解相比,这里多出了一项SSAB ,它反映两个因素交互

作用的结果。各离差平方和SST 、SSA 、SSB 、SSAB 和SSE 的自由度分别是:1abm -,1a -, 1b - ,(1)(1)a b --,(1)ab m -,且有如下关系:

1(1)(1)(1)(1)(1)abm a b a b ab m -=-+-+--+- (7.29) 则检验因素A 和B 影响是否显著的检验统计量分别是:

[]/(1)

/(1)A SSA a MSA

F SSE ab m MSE -==

- (7.30) []

/(1)

/(1)B SSB b MSB

F SSE ab m MSE

-==

- (7.31) 检验交互影响是否显著的检验统计量为:

[]/(1)(1)/(1)AB SSAB a b MSAB

F SSE ab m MSE

--=

=

- (7.32)

【例7-3】考查合成纤维中对纤维弹性有影响的两个因素:收缩率A 和总拉伸倍数B 。A 和B 各取四个水平,所有水平组合都重复试验一次,结果如表7-7所示。

表7-7 纤维弹性测试数据

问收缩率、总拉伸倍数及它们的交互作用对纤维弹性的影响是否显著? 解:检验的假设有三个:

0:A H 收缩率对纤维弹性无显著影响;

1:A H 收缩率对纤维弹性有显著影响。

0:B H 拉伸倍数对纤维无显著影响; 1:B H 拉伸倍数对纤维弹性有显著影响。 0:AB H 收缩率和拉伸倍数没有交互作用;

1:AB H 收缩率和拉伸倍数有交互作用,且对纤维弹性有显著影响。

利用有关公式进行计算(具体步骤略),计算结果以方差分析表给出,见表7-8所示。

从表7-8可知:0.05A ,拒绝0A ,有充分证据说明收缩率对纤维弹性有显著影响;0.052.1(3,16) 3.24B F F == ,接受0B H ,没有充分证据说明拉伸倍数对纤维弹性有显著影响;0.056.6(9,16) 2.54AB F F == ,拒绝0AB H ,有充分证据说明收缩率和拉伸倍数有交互作用,且对纤维弹性有显著影响。

第九章 方差分析

第九章 方差分析(讲义) 第一节 方差分析的基本原理和步骤 思考: 1.如果想要分析A 总体和B 总体平均数的差异,可以用什么方法来检验? 2.如果想要分析A 、B 、C 三个总体平均数的差异,又该用什么方法来证明? 如果是两个总体,用Z 和t 检验。 那是不是三个总体A 、B 、C 的比较就是拿A 和B 做比较,然后那A 与C 做比较 然后再拿B 和C 做比较? 一、方差分析的基本原理:综合的F 检验 方差分析主要处理两个以上的平均数之间的差异检查问题,需要检验的虚无 假设就是“任何一对平均数”之间是否有显著性差异,因此虚无假设为,样本 所属的所有总体的平均数都相等。 一般把这个假设称为“综合虚无假设“,表达式为: 3210:μμμ==H 方差分析最关键的步骤就是变异的分解。 看一个例子9-1:不同噪音强度下解数学题犯错频次 图9-1 数据变异示意图 (一)数据变异文字层面上的分解 从数据可知:不仅组与组之间数据存在不同,而且同一组被试内部也存在着不同。 1.前者称组间变异,因听了不同的噪音而不同。 2.后者称组内变异,因个案本身的不同而造成的不同。 3.而每个数据之间的差异叫做总变异。 2 5 13 3 6 10 2 5 12 2 5 1 4 n=4 1 4 16 无(C ) 中(50)(B ) 强(100(A) K=3 噪音

可以知道:总变异=组间变异+组内变异 一般而言: 1.组间变异是我们想要的结果,即实验条件产生了作用才会令各组之间的数值存在差异。它越大越好! 2.组内变异不是我们研究的目的,但是需要分解它,借助它分析实验是否成功。组内变异其实是实验的误差。它越小越好! 3.问题来了:组间差异多大,组内差异多小才好? (二)数据变异的数学层面的分解 1.数学上如何表示变异? 总变异的数学意义是每一原始分数( )与总平均数( )的离差,记为: 组间变异的数学意义是每一组的平均数( )与总平均数的离差,记为: 组内变异的数学意义是每一组内部的原始分数与其组平均数( )的离差,记为: 2. 先看某一个数据的情况 分析可知,任一个数据( )与总平均数的差异等于他与本组平均数( )之差加上小组平均数与总平均数( )的差。即: 例如: 3.再看总变异的分解及计算 根据变异的可加性,任何一个原始分数都有: 2 67 .6=

第9章方差分析思考与练习-带答案

第九章方差分析 【思考与练习】 一、思考题 1. 方差分析的基本思想及其应用条件是什么? 2. 在完全随机设计方差分析中SS SS SS 、、各表示什么含义? 总组间组内 3. 什么是交互效应?请举例说明。 4. 重复测量资料具有何种特点? 5. 为什么总的方差分析的结果为拒绝原假设时,若想进一步了解两两之间的差别需要进行多重比较? 二、最佳选择题 1. 方差分析的基本思想为 A. 组间均方大于组内均方 B. 误差均方必然小于组间均方 C. 总变异及其自由度按设计可以分解成几种不同来源 D. 组内方差显著大于组间方差时,该因素对所考察指标的影响显著 E. 组间方差显著大于组内方差时,该因素对所考察指标的影响显著

3. 完全随机设计的方差分析中,下列式子正确的是 4. 总的方差分析结果有P<0.05,则结论应为 A. 各样本均数全相等 B. 各总体均数全相等 C. 各样本均数不全相等 D. 各总体均数全不相等 E. 至少有两个总体均数不等 5. 对有k 个处理组,b 个随机区组的资料进行双因素方差分析,其误差的自由度为 A. kb k b -- B. 1kb k b --- C. 2kb k b --- D. 1kb k b --+ E. 2kb k b --+ 6. 2×2析因设计资料的方差分析中,总变异可分解为 A. MS MS MS =+B A 总 B. MS MS MS =+B 总误差 C. SS SS SS =+B 总误差 D. SS SS SS SS =++B A 总误差 E. SS SS SS SS SS =+++B A AB 总误差 7. 观察6只狗服药后不同时间点(2小时、4小时、8小时和24小时)血药浓度的变化,本试验应选用的统计分析方法是 A. 析因设计的方差分析

第9章方差分析与回归分析习题答案

第九章 方差分析与回归分析习题参考答案 1. 为研究不同品种对某种果树产量的影响,进行试验,得试验结果(产量)如下表,试分析果树品种对产量是否有显著影响. (0.05(2,9) 4.26F =,0.01(2,9) 8.02F =) 34 2 11 1310ij i j x ===∑∑ 【 解 : r=3, 12 444n n 321=++=++=n n , T=120 ,120012 1202 2===n T C 3 4 2 21113101200110(1)1110110T ij T i j SS x C S n s ===-=-==-=?=∑∑或S 322.1112721200724(31)429724A i A A i SS T C S s ==-=-==-=??=∑或S 38 72110=-=-=A T e SS SS SS 计算统计值 722 8.53, 389 A A A e e SS f F SS f = =≈…… 方差分析表 方差来源 、 平方和 自由度 均方 F 值 临界值 显著性 品种A ~ 36 0.050.01(2,9) 4.26(2,9)8.02 F F == ** 误差 ] 总 计 结论:由于0.018.53(2,9)8.02, A F F ≈>=故果树品种对产量有特别显著影响. 品种 试验结果 行和??=i x T i 行均值.i x A 1 10 7 、 13 10 40 10 A 2 12 13 15 12 52 ? 13 A 3 8 4 7 9 28 7

2. ^ ..180x = 43 2 11 2804ij i j x ===∑∑ 解:22..4,3,12,180122700l m n lm C x n ======= 4 3 2 211 28042700104(1)119.45 T ij T i j S x C S n s ===-=-==-=?∑∑或 : 422 .1 12790270090(1)331090 3A i A A i S x C S m l s ==-=-==-≈??=∑或322 .1 12710.5270010.5(1)8 1.312510.5 4B j B B j S x C S l m s ==-=-==-≈?=∑或1049010.5 3.5 e T A B S S S S =--=--= 计算统计值 90310.52 51.43,93.56 3.56 A A B B A B e e e e S f S f F F S f S f = =≈==≈ 方差来源 平方和 自由度 F 值 临界值 显著性 推进器A 【 0.050.01(3,6) 4.76(3,6)9.78F F == 燃料B 0.050.01(2,6) 5.14 (2,6)10.92 F F == · 误差 总 计 结论: 由以上方差分析知,进器对火箭的射程有特别显著影响;燃料对火箭的射程有显著影响. 3.为了研究某商品的需求量Y 与价格x 之间的关系,收集到下列10对数据: . 价格x i 1 2 3 4 4 ] 5 需求量y i 10 8 8 7 6 4 ^ 2 1 31,58,147,112,410.5,i i i i i i x y x y x y =====(1)求需求量Y 与价格x 之间 试验 结果 》 燃料B B 1 B 2 B 3 .i x .i x 推进器 A 《 A 1 14 13 12 39 13 A 2 18 16 ^ 14 48 16 A 3 13 12 11 36 12 A 4 20 18 19 57 19 .j x 65 59 % 56 180 .j x 14 15

第九章 方差分析

第九章方差分析 在生产过程和科学实验中,我们经常遇到这样的问题:影响产品产量、质量的因素很多.例如,在化工生产中,影响结果的因素有:配方、设备、温度、压力、催化剂、操作人员等.我们需要通过观察或试验来判断哪些因素对产品的产量、质量有显著的影响.方差分析(Analysis of variance)就是用来解决这类问题的一种有效方法.它是在20世纪20年代由英国统计学家费舍尔首先使用到农业试验上去的.后来发现这种方法的应用范围十分广阔,可以成功地应用在试验工作的很多方面. 第一节单因素试验的方差分析 在试验中,我们将要考察的指标称为试验指标,影响试验指标的条件称为因素.因素可分为两类,一类是人们可以控制的;一类是人们不能控制的.例如,原料成分、反应温度、溶液浓度等是可以控制的,而测量误差、气象条件等一般是难以控制的.以下我们所说的因素都是可控因素,因素所处的状态称为该因素的水平.如果在一项试验中只有一个因素在改变,这样的试验称为单因素试验,如果多于一个因素在改变,就称为多因素试验. 本节通过实例来讨论单因素试验. 1.数学模型 例9.1某试验室对钢锭模进行选材试验.其方法是将试件加热到700℃后,投入到20℃的水中急冷,这样反复进行到试件断裂为止,试验次数越多,试件质量越好.试验结果如表9-1. 表9-1 试验的目的是确定4种生铁试件的抗热疲劳性能是否有显著差异. 这里,试验的指标是钢锭模的热疲劳值,钢锭模的材质是因素,4种不同的材质表示钢锭模的4个水平,这项试验叫做4水平单因素试验. 例9.2考察一种人造纤维在不同温度的水中浸泡后的缩水率,在40℃,50℃, (90) 的水中分别进行4次试验.得到该种纤维在每次试验中的缩水率如表92.试问浸泡水的温度对缩水率有无显著的影响?

第九章 方差分析

第九章 方差分析 第一节 方差分析的基本原理及步骤 一、方差分析的基本原理 假设从一个实验中抽取了9名被试的学习成绩,如表9-1所示。随后又抽取了9名被试的学习成绩,如表9-2所示。你能从这些数据发现什么问题吗? 首先,从数据可知,不仅组与组之间存在不同,而且同一组内部也存在着不同。前者称组间变异,后者称组内变异。 其次,从组间变异看,表9-1组间变异大于表9-2。 表9-1 第1次抽取结果 表9-2 第2次抽取结果 方法 学生实验成绩 X t X 方法 学生实验成绩 X t X A 6 5 7 6 A 1 7 4 4 B 11 9 10 10 7 B 6 2 8 6 5 C 5 4 6 5 C 3 6 5 5 再次,从看组内变异看,表9-1比 9-2差异小。 综上所述,表10-1组间变异较大而组内变异较小,表10-2组间变异较小而组内变异较大,组间变异大小与组内变异大小并非正比关系。这表明,若组间变异与组内变异的比率越大,各组平均数的差异越大。因此,通过组间变异和组内变异比率大小来推论几个相应平均数差异显著性的思想就是方差分析的逻辑依据或基本原理。所以说,方差分析是将实验中的总变异分解为组间变异和组内变异,并通过组间变异和组内变异比率的比较来确定影响实验结果因素的数学方法,其实质是以方差来表示变异的程度。 总变异 组间变异 实验条件 随机误差 组内变异 个体差异 随机误差 实验误差 图10-1 总变异的分解图 二、方差分析的基本过程 (一)综合虚无假设与部分虚无假设 方差分析主要处理多于两个的平均数之间的差异检验问题,需要检验的虚无假设就是“任何一对平均数”之间是否有显著性差异。 综合虚无假设:样本所归属的所有总体的平均数都相等 备择假设:至少有两个总体的平均数不相等

第九章-方差分析

第9章方差分析 (Analysis of Variance) 方差分析是指把一种数据的总偏差分解为若干种成分的方法。与其中每一种成分相联系的是某一特殊偏差的来源。通过分析有可能确定每一种偏差来源对总偏差的贡献大小,即在众多的影响因素中,有些影响作用大一些,有些则小些。在现实经济生活中常常需要分析哪几种因素的影响显著,方差分析是解决这一问题的唯一有效的方法。在第八章曾经讨论过两个总体的平均数是否相等的显著性检验问题,但对2个以上的多个总体的平均数是否相等的问题,前面介绍的检验方法无法解决。对这些问题我们采用方差分析来解决。 9.1 单因子方差分析

单因子方差分析是分析一个因子的不同水平对总体的影响的方法。 比如某企业为了推销空调,做了四种不同内容的宣传广告。广告1:强调价格便宜。广告2:强调质量可靠。广告3:强调节能。广告4:强调免费安装和保修。在这个问题中广告是所要检验的因素,四个不同内容的广告可看作是该因素的四个不同的水准的试验。如果以上四种广告内容的宣传对空调销售量的影响没有显著性差异,则从四种广告中任选一种比较经济的广告即可。但是,如果这四种广告对空调销售量的影响有显著性差异,则必须选择对空调的销售量更为有利的方案。 9.1.1 单因子方差分析的资料结构

单因子方差分析是只分析一个因子的不同水平对总体影响的单纯的试验计划法。单因子方差分析至少要对两个水平以上的效果进行比较分析,检验的因子可记作A 。前面所述的四种广告为四个水平,可分别记作4 321,,,A A A A 。每个水平的观测值可以用ij Y 表示。在方 差分析中,当涉及到的因子只有一个时,称为单因子方差分析;涉及的因子有两个时称为双因子方差分析;涉及的因子有两个以上的方差分析,称作多因子方差分析。它具有两个特点; ①各水平的观测值个数不一定相等。 ②各组观测数据必须是,从具有相同方差的相互独立的总体中随机抽样的样本。单因子方差分析的资料结构如 表9-11)。 (表9-1)单因子方差分析的资料结 构 1)因为每一个观测值的个数不一定相等,所以其观测值数不能用n 表示。为了便于区别通常用n j 表示。

相关主题
文本预览
相关文档 最新文档