当前位置:文档之家› 第九章 方差分析

第九章 方差分析

第九章 方差分析
第九章 方差分析

第九章 方差分析

第一节 方差分析的基本原理及步骤

一、方差分析的基本原理

假设从一个实验中抽取了9名被试的学习成绩,如表9-1所示。随后又抽取了9名被试的学习成绩,如表9-2所示。你能从这些数据发现什么问题吗?

首先,从数据可知,不仅组与组之间存在不同,而且同一组内部也存在着不同。前者称组间变异,后者称组内变异。

其次,从组间变异看,表9-1组间变异大于表9-2。

表9-1 第1次抽取结果

表9-2 第2次抽取结果 方法 学生实验成绩 X

t X

方法 学生实验成绩 X

t X

A 6 5 7 6

A 1 7 4 4

B 11 9 10 10 7

B 6 2 8 6 5

C

5

4

6

5

C

3

6

5

5

再次,从看组内变异看,表9-1比 9-2差异小。

综上所述,表10-1组间变异较大而组内变异较小,表10-2组间变异较小而组内变异较大,组间变异大小与组内变异大小并非正比关系。这表明,若组间变异与组内变异的比率越大,各组平均数的差异越大。因此,通过组间变异和组内变异比率大小来推论几个相应平均数差异显著性的思想就是方差分析的逻辑依据或基本原理。所以说,方差分析是将实验中的总变异分解为组间变异和组内变异,并通过组间变异和组内变异比率的比较来确定影响实验结果因素的数学方法,其实质是以方差来表示变异的程度。

总变异

组间变异

实验条件

随机误差

组内变异

个体差异

随机误差

实验误差

图10-1 总变异的分解图

二、方差分析的基本过程

(一)综合虚无假设与部分虚无假设

方差分析主要处理多于两个的平均数之间的差异检验问题,需要检验的虚无假设就是“任何一对平均数”之间是否有显著性差异。

综合虚无假设:样本所归属的所有总体的平均数都相等 备择假设:至少有两个总体的平均数不相等

(二)方差的可分解性

总变异 = 组间变异 + 组内变异

变异(V ariance ,用V 表示)即方差(S 2),又称均方差或均方(M ean S quare ,MS ),其公式为

()

df SS n X X MS V S =

--=

∑1

),(2

2或或

其中,分子为离均差平方和,简称平方和,记为SS ;分母为自由度,记为df ,所以总变异及各变异源记为

w b t MS MS MS +=

总变异的数学意义是每一原始分数(X )与总平均数(t X )的离差,记为

()t

X X -

组间变异的数学意义是每一组的平均数(i X )与总平均数的离差,记为

()t i

X X

-

组内变异的数学意义是每一组内部的原始分数与其组平均数(i X )的离差,记为

()i

X X -

(二)总变异的分解及各部分的计算 1.平方和的分解与计算 1)平方和的定义式

根据变异的可加性,任何一个原始分数都有 ()()()i t i

t

X X X X

X X -+-=-

对容量为n 的某一小组而言,则有

()()()[]∑∑-+-=-i t i

t X X X X

X X

为了使平方和不为0,须做代数的处理,即有

()()()[]2

2∑∑-+-=-i t i

t

X X X X

X X

对k 组页言,则有

()()()[]∑∑∑∑-+-=-2

2i

t

i

t

X X X X X X

()()()()

∑∑∑∑∑∑-+--+-=2

2

2i

i t i t i X X X X X X X X ∵

()()0=--∑∑i t i

X X X X

∴ ()∑∑

-2t

X X ()()∑∑∑∑-+-=2

2

i t i

X X X X

即 总平方和 = 组间平方和 + 组内平方和

或 w b t SS SS SS += 2)平方和的计算式

()()n

X X

X X 2

2

2∑∑∑-

=-

总平方和:

()()∑∑∑∑∑∑∑-

=-=n

X X X X SS t t 2

2

2

组间平方和:

()()()∑∑∑∑

∑∑∑-=-=n X n X X X SS t i

b

2

2

2

组内平方和:()∑∑-=2

i

w

X X SS ()∑∑-=2

i

w

X X SS b

t SS SS -=

例9-1:要探讨噪音对解决数学问题的影响。噪音是自变量,划分为三个强度水平:强、中、无。因变量是解决数学问题时产生的错误频数。随机抽取12名被试,分到三个组中。每组被试在接受数学测验时戴上耳机。强噪音组的被试通过耳机接受100分贝的噪音,中度噪音组接受50分贝的噪音,无噪音组则没有任何噪音。数学测验完毕后,计算每位被试的错误频数。如表9-3所示。

表9-3 不同学习方法的方差分析计算表

噪音强度

错误频数(X

∑X

2

∑X

强 16 14 12 10 52 696 中

4 5 5 6 20 102 无

1

2 2

3 8 17 ∑

80

715

总平方和: ()67.28212

807152

2

2

=-=-

=

∑∑∑∑∑n

X X

SS t

组间平方和:67.25812

80486522

22=-++=

b SS 组内平方和: 2467.25867.282=-=-=b t w SS SS SS 2.自由度的分解

总自由度为总容量减去1。本例有12个数据,所以

11112=-=t df

组间自由度为组数(k )减1,本例有3个组,所以

213=-=b df

组内自由度为总容量减组数或用总自由度减去组间自由度,即有 9211=-=w df 3.变异的分解

变异同样分解为总变异、组间变异和组内变异。

()()t

t

t

t

t

t df SS

n X X MS V S =

--=∑∑1

,22

或或 ()()w

w

i

w

w

w

df SS

k

n X X MS V S =

--=∑∑22,或或 本例各变异为

34.1292

67

.258===b b b df SS MS

67.29

24

===

w w w df SS MS

三、变异率与F 分布 (一)变异率

根据方差分析的原理,比较组间变异和组内变异,其比值称变异率。

组内变异组间变异变异率=

)(F

F 检验是就F 值中分子大于分母的一种检验方法,属于单尾检验方式。因此只要计算出的F 值小于1,无需再查表,可直接做出差异不显著的结论。

F 值需查F 临界值表。根据组间自由度(即分子自由度)和组内自由度(即分母自由

度)及选定的显著性水平确定,记为

()αw b df df F ,或()α分母分子df df F ,

因为在实际研究中,研究者对许多研究的方向并不确定,因此常采用双尾检验的方法。若采用双侧检验则需查附表5,记为

()2/,αw b df df F

本例,()02.89,201.0=F 。因为F = 48.44 >8.02,P <0.01差异极显著。 方差分析后,需将分析步骤和结果列一方差分析表。

表9-4 三种学习方法的方差分析表

变异来源

平方和

SS

自由度

df 均方

MS F

值 P

组间 组内 总的

300 28 328

2 15 17

150 1.87

80.21

0.01

三、方差分析的基本假设 (一)总体正态分布 (二)变异的相互独立性

(三)各实验处理内方差要一致

四、方差分析中的方差齐性检验

方差齐性检验就是检验各总体方差是否一致的统计方法。其虚无假设是假设各个总体的方差相等(即无显著差异)或是各个样本方差来自相同的总体,其表达方式记为

Ho :2

2

32

22

1k σσσσ====

二、方差齐性检验的方法——哈特莱(Hartley )检验法。 哈特莱检验法借助于F 最大值来检验。

()()2min 12max 1max --=

n n S S F

44.4867

.234

.129===

w b MS MS F

1max -=n df

对例9-1的数据进行方差齐性检验的过程与方法如下。 1.建立假设

Ho :2

32

22

1σσσ==,即三个总体的个体差异无显著差异 Ha :至少有两个总体的方差存在显著差异。 2.计算统计量

1)求各样本的方差:

()12

22--=

∑∑n n

X X S 51

44/526962

2

=--=A S 66.0144/2010222=--=

B S 66.01

44/81822

=--=C S

2)求F 最大值

5.766

.05

==

F

3.比较与决策

当组数3=k ,自由度314=-=df 时,()5.1505.0max =F 。F < F max (0.05),p >0.05,差异不显著,接受虚无假设,拒绝研究假设,说明三个总体的方差一致。

第二节 完全随机设计的方差分析

一、完全随机设计

完全随机设计(Complete randomized design):把被试随机分成若干组,每个组分别接受一种实验处理。完全随机分组后,各实验组的被试之间是相互独立的,因而这种设计又称“独立组设计” 或被试间设计。

该设计的不足之处:误差项既包括实验本身的误差又包括个体差异引起的误差,因而它的检验效率往往不高。

二、完全随机设计的方差分析 (一)样本容量相等的方差分析

各个样本容量相等时意味着对于每一种实验处理它们的被重复次数相同,如例9-1,每一种学习方法均重复了4次。

例:9-1 解:原始数据与计算的中间结果如下表:

积极反馈组

消极反馈组

控制组

X

X

2

X X 2

X X 2

8 64 5 25 2 4

7

49 6

36 4

16

9 81 7 49 5 25 10 100 4 16 3 9 6 36 3 9 6 36 ∑

40 330 25 135 20 90 )(2

X ∑

1600

625

400

解:设虚无假设和备择假设分别如下:

:0

H μμμ

C

N

P

==

:1

H μμμ

C

N

P

≠≠(P 、N 、C 分别表示积极反馈组、消极反馈组和控制反馈组)

00

.5255

400

625160067

.48115

85202540555901353302

2

2

2

85)(=++=

===++==++=∑∑∑∑∑∑∑n

N X X X X

① 计算平方和

()(

)

(

)

()30

33.4333.7330

00.52555533

.4367.48100.52567

.4815552

2

2

2

2

2

--=-==-=∑-

==-=∑∑

-

=-=∑∑-

=∑∑∑∑∑∑SS SS

SS X X

SS

X X SS X X

SS B W W

B

T

T

n

nk

n

nk

或者

② 计算自由度

12

)15(3)1(21311151=-?=-==-=-=-=-=n k k N df

df df W

B T

③ 计算均方

50.212

00

.3067.21233

.43==

====df SS MS df SS

MS

w

w w

b b

b

④ 计算F 比值,进行F 检验,做出决断 67.850

.267

.21==

=

MS

MS w

b F 查F 表,

88.3)

12,2(05.0=F

,算得的F 值大于临界值,p<0.05,可以拒绝虚无假设,下结论

认为在反馈类型与自尊之间存在着某种关系。

⑤列出方差分析表

总结上面的计算结果,列出下面的方差分析表。

变异来源平方和自由度均方 F p

组间效应43.33 2 21.67 8.67 <0.05

组内效应30.00 12 2.50

总变异73.33 14

例9-2:有人研究自尊与对个人表现的反馈类型之间的关系。让15名被试参加一项知识测验,每组各5个被试。在积极反馈组,不管被试在测验中实际表现如何,都告诉他们水平很高。对消极反馈组的被试,告诉他们表现很差。对控制组的被试,不管测验分数如何,都不提供任何反馈信息。最后让所有的被试都参加一个自尊测验,测验总分为10分,得到的分数越高,表示自尊心越强。实验结果如下表所示,试检验不同反馈类型与自尊之间的关系如何?

表9-5 不同反馈类型的自尊得分

∑X∑2X 反馈类型n自尊得分(X)

积极反馈 5 8 7 9 10 6 83 1777

消极反馈 5 5 6 7 4 3 138 3232

无反馈 5 2 4 5 3 6 133 3575

8584

15 354

(二)样本容量不相等的方差分析

例9-3:用不同强度的光做视觉反应时(毫秒)实验,光照强度分别为1、2、3三个等级,被试随机分成三组,随机分配分别做某一种光强的反应时实验。由于某些原因,各组人数没能相同。下表是不同光强被试视反应时测试结果。试问从表中结果能否得出不同强度光的反应时有显著不同?

下表是原始数据及计算的中间结果:

光强等级1 光强等级2 光强等级3

X X2X X2X X2

150 22500 190 36100 200 40000

220 48400 230 52900 240 57600

190 36100 170 28900 260 67600

170 28900 260 67600 180 32400

240 57600 250 62500 190 36100

200 40000 170 28900 280 78400

180 32400 280 78400

190 36100

220 48400 ∑

1350 265900 19600 439800 1350 312100 n

7

9

6

()∑X 2

1822500 3841600 1822500

解:设虚无假设和备择假设分别如下:

)

321(::3

2

1

1

32

1

实验处理组代表三种光强条件下的、、下标μ

μμμμμ≠≠==H H

(1)计算平方和

10178003121004398002659002

=++=∑∑X

4660135019601350=++=∑∑X

()73.98707222

4660

2

2

==∑∑N X

()58

.99095130375044.42684414.2603576

1822500

93841600718225002

=++=++=

n

X i

()27.3072773.98707210178002

2

=-=∑∑-

=∑∑N

X X SS t

()()85.387873.98707258.9909512

2

=-=∑∑-∑=∑N

X n

X SS

i

b

()42.2684858.99095110178002

2

=-=∑-=∑

∑∑n

X X SS i

w

(2)计算自由度

21122=-=df t

213=-=df b

19221=-=-=df df df

b

t

w

(3)计算均方

43.18392

85

.3878==

=

df

SS

MS b

b b

08.141319

42

.26848==

=

df

SS MS w

w w

(4)计算F 值

37.108

.141343

.1939==

=

MS

MS w

b F

(5)统计决策 查F 值表,52.3)

19,2(05.0=F

,计算得到的F 值小于0.05水平的临界值,p>0.05,方差分析

表如下: 变异来源 平方和 自由度 均方 F p 组间效应 3878.8 2 1939.4 1.37 >0.05 组内效应 26848.5 19 1413.1 总变异

30727.3

21

答:三种光强下的视觉反应时没有显著差异。

例9-4:研究人员采用四种不同的心理治疗方案,对每个志愿参加治疗的患者进行心理治疗,他们用录音机记录了每个被试在一段时间中所讲的词数。由于录音的困难,每种方案记录的人数各不相同。原始数据见下表,问这几种方案是否有差异?

原始数据与中间数据的计算

治疗方案

1

2 3 4 30 50 18 88 74 38 56 78 46 66 34 60 58 62 24 76 62 44 66 38 58 52

80 n i

6 7 6 4 23 ∑X

308

398

250

302

1258

所有观测的平方和

764442

=∑X

解:建立虚无假设和备择假设

4

3211

43210::μμμμμμμμ≠≠≠===H

H

(1)计算平方和

()9.763623

76444)

1258(2

2

2

=-=∑∑-

=∑∑N X X SS t

(

)(

)N

X n

X

SS i

b ∑∑-∑=∑

2

2

()()()()()23

4676

12583022503983082

2

2

2

2

-+++=

4.28501.68807

5.71657=-=

5.47864.28509.7636=-=-=SS

SS SS b

t

w

(2)计算自由度

314=-=df b

19423=-=df

w

(3)计算均方

1.95034

.28501

==

-=k SS

MS b

b 9.25119

5

.4786==

-=

k

N SS

MS w

w (4)计算F 值

77.39

.2511

.950==

=

MS

MS w

b F (5)进行统计决策

,可以拒绝虚无假设。,因此,查表得),(),(F F 19305.019305.0F 13.3>=

方差分析表如下: 变异来源 平方和 自由度 均方 F p 组间效应 2850.4 3 950.1 3.77 <0.05 组内效应 4786.5 19 251.9 总变异

7673.9

22

答:四种心理治疗方案之间有显著差异。

例9-5:在一项记忆实验中,研究者将实验对象分为三组分别用不同的记忆方式记忆英语单词,实验结果如表9-6所示。试问三种记忆方法有无显著不同?

表9-6 英文单词不同复习方式的实验结果

记忆方法

n

英语单词记忆量(X )

∑X

∑2

X

A 4 26 19 16 22

83 1777 B

6 25 2

7 25 20 1

8 23

138 3232 C

5

23

25

28

31

26

133 3575 ∑

15

354

8584

1.建立假设

Ho :4321μμμμ===

Ho :至少有两种记忆方式所代表的总体平均成绩存在显著差异。 2.计算统计量 1)求平方和

总平方和:

()∑∑∑∑∑-

=n

X X SS t 2

2

6

.2291535485842

=-= 处理平方和:

()()∑∑∑∑∑-=n

X n X SS b 2

2

65.7915354513361384832

222=-???? ??++= 误差平方和: b t w

SS SS SS -=95.14965.7968.229=-=

2)求自由度 总自由度: ∑=-=-=141151n df t

处理自由度: 2131=-=-=k df b

误差自由度: ∑=-=-=12

315k n df w

3)求均方

处理均方:

825.39265

.79===

b b b df SS MS 误差均方:

50.121295

.149===

w w w df SS MS

4)求F 比率

19.350.12825

.39===

w b MS MS F

3.比较与决策

当处理自由度为2,误差自由度为12时,()10.52/05.012,2=F 。因为,19.3=F <

()10.52/05.012,2=F ,p >0.05,差异不显著,接受虚无假设,拒绝研究假设。

4.方差分析摘要表

变异源 SS

df

MS

F

p

处理

79.65 2

39.825 3.19

>0.05

误差 149.95 12 12.500

总的

229.60

14

(三)利用样本统计量进行方差分析

例9-7:把20名被试随机分成A ,B ,C ,D 四个组,每组(5人)接受一种教学方法。教学效果评估后,每组平均数依次为5,5.4,8,7.2;方差依次为1.99,1.04,1.20,1.76。问四种教法是否有显著差异?

1、建立假设

H 0:4321μμμμ=== H 1:54321μμμμ≠≠≠ 2、计算统计量 1)求平方和

4.64

2

.784.55=+++=

t X

[]

2222)4.62.7()4.68()4.64.5()4.65(5-+-+-+-?=b SS =30.8 ()76.120.104.199.15+++?=w SS = 30 2)求自由度

314=-=b df ()16154=-?=w df

故五种教学方法存在显著差异。

4、方差分析表

变异来源 平方和 自由度 均方 F 值 组间 30.8 3 10.267 5.48** 组内 30 16 1875 总计

60.8

19

(),

01.0,F ,29.5,348.51.87510.267

F F 4 875.116

30

,267.1038.30MS 301.016,301.0b <>===

====p F F F MS w

分布表查、比较与决策检验))均方

**表示p <0.01

第三节 随机区组设计的方差分析

一、随机区组设计

完全随机设计的使用前提是各个处理组(如实验组与控制组)之间必须保持个体水平的一致,然而,在实际工作中我们却经常会碰到班或组的水平无法保持一致的情况,完全随机区组设计方差分析则是专门解决此类问题。

例9-5:为了比较三种不同的单词加工处理方法A 、B 、C 、的效果,从四种不同类型的学校各抽取一名被试(1、2、3、4),让他们在一定时限内均按照三种加工处理方法进行单词加工处理速度的实验成绩,结果如表9-5所示。试问不同的加工处理有无显著不同?被试间的个体差异是否显著?

表9-7 实验成绩

处理

∑X

2

∑X

I II III IV A 31 4 10 27 72 1806 B

52 11 24 41 128 5082 C

49 45 32 46 172 7566 ∑R

132 60 66 114 372

14454 2

∑R

6066

2162

1700

4526

14454

(一)完全随机区组设计方差分析的原则与原理

在例9-5中,有三种实验处理,4名被试(代表每类学校,称区组),且每名被试都需在三种处理上做一遍实验。所以,完全随机区组设计是指每个区组均随机地实施或接受全部实验处理组合或因素水平的实验设计类型,又称相关组设计或被试者设计。

区组设计的原则有二,一是同一区组内的被试尽可能“同质”,即在与实验有关的某些素质方面要相同,如同一年级被试要求水平相当;二是区组之间要求“异质性”,即各区组间可以有差异,如各年级间允许存在差异。

区组内被试数目的分配有三种情况。一是每一区组只有一名被试,二是每一区组个体数目是实验处理数的整倍数,三是每一区组的人数为团体单元,如一个班级、一所学校、一个年龄组等。

完全随机区设计的思想要求将个体差异从中再分离出来形成区组,而剩余的误差则成为一种较纯的随机误差,于是有

组内变异= 区组变异(r MS ) + 误差变异(e MS ) 由此,总变异的构成由原来的两个部分演变为三个部分,即

总变异= 组间(或处理)变异 + 区组变异 + 误差变异

e r b t MS MS MS MS ++=

(二)完全随机区组设计的方差分析过程 1.建立假设

0H :各处理效应相等,即E D C B A μμμμμ====

各区组效应相等,即4321μμμμ===

a H :处理效应不全为0,区组效应不全为0。

2.计算统计量

表9-8 区组设计的方差分析表

变 异

平方和

SS

自由度

df

均方

MS

变异率

F

处 理

()()

nk

X n

X SS b 2

2

∑∑∑

∑-

=

1-=k df b

b b b df SS MS =

e b b MS MS F =

区 组

()()

nk

X k R SS r 2

2

∑∑∑

∑-

=

1-=n df r

r

r r df SS MS =

e

r r MS MS F =

误 差

r b t e SS SS SS SS --= r b t e df df df df --=

e

e e d

f SS MS =

总 的

()nk

X X SS t 2

2

∑∑∑∑-

=

1-=nk df t

注:式中n 为区组数,k 为处理数

总平方和:

()2922

11532144543

4372

14454

2

=-=?-=t

SS

处理平方和:

()12561153212788343724172128722

2

22=-=?-???? ??++=b SS

区组平方和:()1260115321279234372311466601322

2222=-=?-???? ??+++=r SS

误差平方和:406126012562922=--=e SS

表9-9 方差分析计算表

变异

SS

df

MS

F

处理

1256=b SS

213=-

62821256

= 92.1311.45628

=

区组

1260=r SS

314=-

42031260

= 31.911.45420

=

误差

r e SS 406=

9334=-?

11.459406

=

总的

2922=t SS

11134=-?

3.比较与决策

对于处理间来说,当分子自由度为2,分母自由度为9时,()11.10201.09,2=F 。因为

92.13=F >()11.10201.09,2=F ,P <0.01,差异极显著,拒绝Ho ,接受Ha 。说明在三种加

工处理方式下单词加工速度之间存在极显著差别。

对于区组间来说,当分子自由度为3,分母自由度为9时,()72.8201.09,3=F 。因为

31.9=F >()72.8201.09,3=F ,P <0.01,差异极显著,拒绝Ho ,接受Ha ,表示四个类学校

之间确实存在着显著差异,说明该研究采用区组设计是恰当的。也就是说,排除学校的差异以后,不同的加工处理方法仍有不同的效应。

4.列方差分析摘要表

表9- 10 方差分析表

变异源 SS

df

MS

F

p

处理 区组 误差 总的

1256 1260 406 2922

2 3 9 11

628 420 45.11

13.92 9.31

<0.01 <0.01

例9-9:为了测查刺激呈现的时间长短在记忆过程中的作用,一名认知心理学家把10个无意义音节以不同长度的时间呈现给被试。每种情况下这组音节呈现30秒,中间间隔10分钟,要求被试完成一些简单的数学题,以避免被试练习记忆无意义音节,然后要求被试在60秒内尽可能多的回忆他记住的音节。下表是7个被试的实验结果,问呈现时间长短是否显著影响无意义音节的回忆量。

解:原始数据与中间的计算结果如下表所示:

被试

呈现刺激的时间长度 ∑R

()

∑R 2

时间1

时间2 时间3

时间4

X

X

2

X

X

2

X

X

2

X

X

2

1

5 25

6 36 6 36 5 25 22 484 2

7 49 6 36 7 49

8 64 28 784 3 8 64

9 81 9 81 10 100 36 1296 4 3 9 4 16 4 16 6 36 17 289 5 9 81 8 64 9 81 7 49 33 1089 6 5 25 4 16 6 36 6 36 21 441 7 7 49

10 100 8 64

9 81 34 1156 44 302 47 349 49 363 51 391 191 5539

1936

2209

2401

2601

设:()9147

2601240122091936191

5149474410453913633493024

321::2

2`

14

3

2

1

=+++=∑=+++==+++====∑∑∑∑∑≠≠≠X X u u u u H u u u u H X

① 求平方和

()

()()()()

(

)

(

)

()

43

.1686.8182.311.10243

.1675.138471.130689.1302140586.8189.130275.13844

74553982

.389.130271.13064

77

914711

.10289.130214054

714051

1

2

2

2

2

2

2

1

2

2

1

2

22

2

2

191191191=--=--==--+=∑-∑

-∑∑

+

==-=?-=∑∑

-∑==-=?-=∑∑-∑==-=?-=∑∑

-

=∑∑∑

∑∑SS SS SS SS R X X X SS X R SS

X X SS X X

SS r b t e k

n

e n

r

k

b

t

k

n nk nk

k

nk

n

nk

或者

②自由度

()()()()18

1714116

1713

141271281=-?-=--==-=-==-=-==-=-=n k n k N df

df df df e

r b t

③ 均方

913.018

43

.1664.136

86

.8127.13

82

.3==

=======

df SS MS df SS MS df SS

MS e

e e

r r r b b b ④ F 检验

值。

计算得到的值小于临界表,查)

,(,16.3F 39.1913

.027

.118305.0===

=

F

MS MS e

b F

因此,呈现刺激的时间长短对无意义音节的回忆量影响不显著,不能够拒绝虚无假设。

也就是说无意义音节以四个不同长度时间呈现后,测试过程表明对它的回忆量没有明显差别。 ⑤ 方差分析表

变异来源 平方和 自由度 均方 F F 05.0 组间

3.82 3

1.27 1.38 3.16 区组

误差 81.86 16.43 6 18 13.64 0.913 14.94 2.66 总变异

102.11

27

例9-10:五名被试在四种不同的环境条件下参加某一心理测验,结果如下。问不同的测验环境是否对这一测验成绩有显著影响。

被试 测验环境

∑R Ⅰ

1 30 28 16 34 108

2 14 18 10 22 64

3 2

4 20 18 30 92 4 38 34 20 44 136 5

26 28 14 30 98 ∑X

132 128 78 160 498 ∑

X

2

3792

3448

1276

5376

所有观测的总和

∑∑X =498,平方和∑∑X 2

=13892

解:

(

)

()()()()()()()()()()()()()()80.68020

4444420.69820

555

580

.14912013892498981369264108498160781281324982

2

2

2

2

2

2

1

2

2

2

2

2

1

2

2

2

2

2

2

=-++++=∑∑-∑==-+++=

∑∑-

∑==-

=∑∑

-=∑

∑∑∑nk

k nk

n

N X R SS

X X SS X X

SS n

r

k b

t

()()()()11.1840.920.17076

.2440.973.23240

.91280.11290

.170480.68073

.232320

.69812

1514114

151314119120180.11280.68020.69880.1491t

t ================-?-=--==-=-==-=-==-=-==--=--=++=+=

MS

MS F MS

MS F df SS MS df

SS MS df SS MS df df df df SS SS SS SS SS SS SS SS SS SS e

r

r

e

b b

e e

e

r r

r

b b

b

e

r b t r

b

e

e

r

b

w b

n k n k N 所以,因为,

()()()()方差分析表如下:

分组是完全有必要的。非常显著,对被试进行表明区组效应验的结果有显著影响。为不同的测验环境对测可以拒绝虚无假设,认值大于临界值,计算的组间效应。因此,,得,查附表,,F ,41.595.5412,401.0r 12,301.0b 12,401.012301.0F F F F F F >>== 变异来源 平方和 自由度 均方 F 值 处理 698.20 3 232.73 24.76** 区组 680.80 4 170.20 18.11** 误差 112.80 12 9.40 总计

1491.80

19

**表示P<0.01

第五节 多重比较

多重比较是进一步分析成对平均数的差异。 一、Newman-keuls 检验法

(一)N-K 检验的原理

N-K 检验是找出每对平均数之间存在的随机变异,即各对平均数差异的标准误。然后该标准误比较两均数之间的差异,其统计量称为q 值。

准误任意两均数间差异的标任意两均数间的差异=

q

n MS X X q e j i -=

注意:q 与t 有相同之处。统计逻辑相同,标准误不同。t 值直接使用两均数差的标准误,q 值运用方差分析中的误差标准误。

(二)N-K 检验的简化法

n MS q

X X e j i =- n MS q D e α

α=

式中,n 为样本容量,当各处理组样本容量不等时,以平均样本容量代入,即

)111(

21k n n n k

n +++=

但因可能违反检验的基本假设,所以在使用这一公式时,除非样本容量的差异相对较小,否则需格外谨慎。

例9-10:为研究不同科目的教师当班主任对学生某一学科的学习是否有影响,把40名学生随机分派到5名教不同科目的班主任管理的班级中,过一段时间后让40名学生参加一项数学考试。方差分析结果表明,在不同班主任负责的班级中,学生的数学成绩显著不同。各组的数学平均分为74,

67,

5.69,

5.71,

5.74=====X

X

X

X

X

E

D

C

B

A

(其中A 表示

班主任教数学,B 表示班主任教语文,C 表示班主任教生物,D 表示班主任教地理,E 表示班主任教物理),方差分析结果35,17.24==df MS w

w 。

试对五组平均数进行多重比较。 解:①把5个平均数由低到高进行等级排列 等级 1

2

3

4

5

平均数 X D

X C

X B

X E

X A

67

69.5

71.5

74

74.5

② 计算比较等级r ,查附表6,35=df

w

表中没有,可用

最接近的代替,查

30=df

w

以上的就不查了。

,最大为个平均数,所以由于只有55r 510

.4484.3449.3389.2205

.005.005.005

.0=→==→==→==→=q

q q q r r r r

③ 求X 的标准误

12

.7738.110.4,567.6738.184.3,406.6738.149.3,302

.5738.189.2,2738.18

17

.248

05

.005

.005.005

.0=?=?==?=?==?=?==?=?===

=

SE q SE q

SE q SE q MS

SE

X X X X w

X

r r r r 当

④ 把5个平均数两两之间的差异与相应的()

SE q

X ?05

.0比较

X D

X C

X B

X E

X A

(67)

(69.5) (71.5) (74) (74.5) X C

2.5 X B

4.5 2.0 X E

7.0* 4.5 2.5 X A

7.5*

5.0

3.0

0.5

*表示p<0.05

答:X D 与X E 和X D 与X A 两对差数之间差异是显著的。即数学老师当班主任与地理老师当班主任对学生教学成绩有不同的影响,物理老师当班主任与地理老师当班主任对学生教学成绩也有不同的影响。

第九章 方差分析

第九章 方差分析(讲义) 第一节 方差分析的基本原理和步骤 思考: 1.如果想要分析A 总体和B 总体平均数的差异,可以用什么方法来检验? 2.如果想要分析A 、B 、C 三个总体平均数的差异,又该用什么方法来证明? 如果是两个总体,用Z 和t 检验。 那是不是三个总体A 、B 、C 的比较就是拿A 和B 做比较,然后那A 与C 做比较 然后再拿B 和C 做比较? 一、方差分析的基本原理:综合的F 检验 方差分析主要处理两个以上的平均数之间的差异检查问题,需要检验的虚无 假设就是“任何一对平均数”之间是否有显著性差异,因此虚无假设为,样本 所属的所有总体的平均数都相等。 一般把这个假设称为“综合虚无假设“,表达式为: 3210:μμμ==H 方差分析最关键的步骤就是变异的分解。 看一个例子9-1:不同噪音强度下解数学题犯错频次 图9-1 数据变异示意图 (一)数据变异文字层面上的分解 从数据可知:不仅组与组之间数据存在不同,而且同一组被试内部也存在着不同。 1.前者称组间变异,因听了不同的噪音而不同。 2.后者称组内变异,因个案本身的不同而造成的不同。 3.而每个数据之间的差异叫做总变异。 2 5 13 3 6 10 2 5 12 2 5 1 4 n=4 1 4 16 无(C ) 中(50)(B ) 强(100(A) K=3 噪音

可以知道:总变异=组间变异+组内变异 一般而言: 1.组间变异是我们想要的结果,即实验条件产生了作用才会令各组之间的数值存在差异。它越大越好! 2.组内变异不是我们研究的目的,但是需要分解它,借助它分析实验是否成功。组内变异其实是实验的误差。它越小越好! 3.问题来了:组间差异多大,组内差异多小才好? (二)数据变异的数学层面的分解 1.数学上如何表示变异? 总变异的数学意义是每一原始分数( )与总平均数( )的离差,记为: 组间变异的数学意义是每一组的平均数( )与总平均数的离差,记为: 组内变异的数学意义是每一组内部的原始分数与其组平均数( )的离差,记为: 2. 先看某一个数据的情况 分析可知,任一个数据( )与总平均数的差异等于他与本组平均数( )之差加上小组平均数与总平均数( )的差。即: 例如: 3.再看总变异的分解及计算 根据变异的可加性,任何一个原始分数都有: 2 67 .6=

第9章方差分析思考与练习-带答案

第九章方差分析 【思考与练习】 一、思考题 1. 方差分析的基本思想及其应用条件是什么? 2. 在完全随机设计方差分析中SS SS SS 、、各表示什么含义? 总组间组内 3. 什么是交互效应?请举例说明。 4. 重复测量资料具有何种特点? 5. 为什么总的方差分析的结果为拒绝原假设时,若想进一步了解两两之间的差别需要进行多重比较? 二、最佳选择题 1. 方差分析的基本思想为 A. 组间均方大于组内均方 B. 误差均方必然小于组间均方 C. 总变异及其自由度按设计可以分解成几种不同来源 D. 组内方差显著大于组间方差时,该因素对所考察指标的影响显著 E. 组间方差显著大于组内方差时,该因素对所考察指标的影响显著

3. 完全随机设计的方差分析中,下列式子正确的是 4. 总的方差分析结果有P<0.05,则结论应为 A. 各样本均数全相等 B. 各总体均数全相等 C. 各样本均数不全相等 D. 各总体均数全不相等 E. 至少有两个总体均数不等 5. 对有k 个处理组,b 个随机区组的资料进行双因素方差分析,其误差的自由度为 A. kb k b -- B. 1kb k b --- C. 2kb k b --- D. 1kb k b --+ E. 2kb k b --+ 6. 2×2析因设计资料的方差分析中,总变异可分解为 A. MS MS MS =+B A 总 B. MS MS MS =+B 总误差 C. SS SS SS =+B 总误差 D. SS SS SS SS =++B A 总误差 E. SS SS SS SS SS =+++B A AB 总误差 7. 观察6只狗服药后不同时间点(2小时、4小时、8小时和24小时)血药浓度的变化,本试验应选用的统计分析方法是 A. 析因设计的方差分析

第9章方差分析与回归分析习题答案

第九章 方差分析与回归分析习题参考答案 1. 为研究不同品种对某种果树产量的影响,进行试验,得试验结果(产量)如下表,试分析果树品种对产量是否有显著影响. (0.05(2,9) 4.26F =,0.01(2,9) 8.02F =) 34 2 11 1310ij i j x ===∑∑ 【 解 : r=3, 12 444n n 321=++=++=n n , T=120 ,120012 1202 2===n T C 3 4 2 21113101200110(1)1110110T ij T i j SS x C S n s ===-=-==-=?=∑∑或S 322.1112721200724(31)429724A i A A i SS T C S s ==-=-==-=??=∑或S 38 72110=-=-=A T e SS SS SS 计算统计值 722 8.53, 389 A A A e e SS f F SS f = =≈…… 方差分析表 方差来源 、 平方和 自由度 均方 F 值 临界值 显著性 品种A ~ 36 0.050.01(2,9) 4.26(2,9)8.02 F F == ** 误差 ] 总 计 结论:由于0.018.53(2,9)8.02, A F F ≈>=故果树品种对产量有特别显著影响. 品种 试验结果 行和??=i x T i 行均值.i x A 1 10 7 、 13 10 40 10 A 2 12 13 15 12 52 ? 13 A 3 8 4 7 9 28 7

2. ^ ..180x = 43 2 11 2804ij i j x ===∑∑ 解:22..4,3,12,180122700l m n lm C x n ======= 4 3 2 211 28042700104(1)119.45 T ij T i j S x C S n s ===-=-==-=?∑∑或 : 422 .1 12790270090(1)331090 3A i A A i S x C S m l s ==-=-==-≈??=∑或322 .1 12710.5270010.5(1)8 1.312510.5 4B j B B j S x C S l m s ==-=-==-≈?=∑或1049010.5 3.5 e T A B S S S S =--=--= 计算统计值 90310.52 51.43,93.56 3.56 A A B B A B e e e e S f S f F F S f S f = =≈==≈ 方差来源 平方和 自由度 F 值 临界值 显著性 推进器A 【 0.050.01(3,6) 4.76(3,6)9.78F F == 燃料B 0.050.01(2,6) 5.14 (2,6)10.92 F F == · 误差 总 计 结论: 由以上方差分析知,进器对火箭的射程有特别显著影响;燃料对火箭的射程有显著影响. 3.为了研究某商品的需求量Y 与价格x 之间的关系,收集到下列10对数据: . 价格x i 1 2 3 4 4 ] 5 需求量y i 10 8 8 7 6 4 ^ 2 1 31,58,147,112,410.5,i i i i i i x y x y x y =====(1)求需求量Y 与价格x 之间 试验 结果 》 燃料B B 1 B 2 B 3 .i x .i x 推进器 A 《 A 1 14 13 12 39 13 A 2 18 16 ^ 14 48 16 A 3 13 12 11 36 12 A 4 20 18 19 57 19 .j x 65 59 % 56 180 .j x 14 15

第九章 方差分析

第九章方差分析 在生产过程和科学实验中,我们经常遇到这样的问题:影响产品产量、质量的因素很多.例如,在化工生产中,影响结果的因素有:配方、设备、温度、压力、催化剂、操作人员等.我们需要通过观察或试验来判断哪些因素对产品的产量、质量有显著的影响.方差分析(Analysis of variance)就是用来解决这类问题的一种有效方法.它是在20世纪20年代由英国统计学家费舍尔首先使用到农业试验上去的.后来发现这种方法的应用范围十分广阔,可以成功地应用在试验工作的很多方面. 第一节单因素试验的方差分析 在试验中,我们将要考察的指标称为试验指标,影响试验指标的条件称为因素.因素可分为两类,一类是人们可以控制的;一类是人们不能控制的.例如,原料成分、反应温度、溶液浓度等是可以控制的,而测量误差、气象条件等一般是难以控制的.以下我们所说的因素都是可控因素,因素所处的状态称为该因素的水平.如果在一项试验中只有一个因素在改变,这样的试验称为单因素试验,如果多于一个因素在改变,就称为多因素试验. 本节通过实例来讨论单因素试验. 1.数学模型 例9.1某试验室对钢锭模进行选材试验.其方法是将试件加热到700℃后,投入到20℃的水中急冷,这样反复进行到试件断裂为止,试验次数越多,试件质量越好.试验结果如表9-1. 表9-1 试验的目的是确定4种生铁试件的抗热疲劳性能是否有显著差异. 这里,试验的指标是钢锭模的热疲劳值,钢锭模的材质是因素,4种不同的材质表示钢锭模的4个水平,这项试验叫做4水平单因素试验. 例9.2考察一种人造纤维在不同温度的水中浸泡后的缩水率,在40℃,50℃, (90) 的水中分别进行4次试验.得到该种纤维在每次试验中的缩水率如表92.试问浸泡水的温度对缩水率有无显著的影响?

第九章 方差分析

第九章 方差分析 第一节 方差分析的基本原理及步骤 一、方差分析的基本原理 假设从一个实验中抽取了9名被试的学习成绩,如表9-1所示。随后又抽取了9名被试的学习成绩,如表9-2所示。你能从这些数据发现什么问题吗? 首先,从数据可知,不仅组与组之间存在不同,而且同一组内部也存在着不同。前者称组间变异,后者称组内变异。 其次,从组间变异看,表9-1组间变异大于表9-2。 表9-1 第1次抽取结果 表9-2 第2次抽取结果 方法 学生实验成绩 X t X 方法 学生实验成绩 X t X A 6 5 7 6 A 1 7 4 4 B 11 9 10 10 7 B 6 2 8 6 5 C 5 4 6 5 C 3 6 5 5 再次,从看组内变异看,表9-1比 9-2差异小。 综上所述,表10-1组间变异较大而组内变异较小,表10-2组间变异较小而组内变异较大,组间变异大小与组内变异大小并非正比关系。这表明,若组间变异与组内变异的比率越大,各组平均数的差异越大。因此,通过组间变异和组内变异比率大小来推论几个相应平均数差异显著性的思想就是方差分析的逻辑依据或基本原理。所以说,方差分析是将实验中的总变异分解为组间变异和组内变异,并通过组间变异和组内变异比率的比较来确定影响实验结果因素的数学方法,其实质是以方差来表示变异的程度。 总变异 组间变异 实验条件 随机误差 组内变异 个体差异 随机误差 实验误差 图10-1 总变异的分解图 二、方差分析的基本过程 (一)综合虚无假设与部分虚无假设 方差分析主要处理多于两个的平均数之间的差异检验问题,需要检验的虚无假设就是“任何一对平均数”之间是否有显著性差异。 综合虚无假设:样本所归属的所有总体的平均数都相等 备择假设:至少有两个总体的平均数不相等

第九章-方差分析

第9章方差分析 (Analysis of Variance) 方差分析是指把一种数据的总偏差分解为若干种成分的方法。与其中每一种成分相联系的是某一特殊偏差的来源。通过分析有可能确定每一种偏差来源对总偏差的贡献大小,即在众多的影响因素中,有些影响作用大一些,有些则小些。在现实经济生活中常常需要分析哪几种因素的影响显著,方差分析是解决这一问题的唯一有效的方法。在第八章曾经讨论过两个总体的平均数是否相等的显著性检验问题,但对2个以上的多个总体的平均数是否相等的问题,前面介绍的检验方法无法解决。对这些问题我们采用方差分析来解决。 9.1 单因子方差分析

单因子方差分析是分析一个因子的不同水平对总体的影响的方法。 比如某企业为了推销空调,做了四种不同内容的宣传广告。广告1:强调价格便宜。广告2:强调质量可靠。广告3:强调节能。广告4:强调免费安装和保修。在这个问题中广告是所要检验的因素,四个不同内容的广告可看作是该因素的四个不同的水准的试验。如果以上四种广告内容的宣传对空调销售量的影响没有显著性差异,则从四种广告中任选一种比较经济的广告即可。但是,如果这四种广告对空调销售量的影响有显著性差异,则必须选择对空调的销售量更为有利的方案。 9.1.1 单因子方差分析的资料结构

单因子方差分析是只分析一个因子的不同水平对总体影响的单纯的试验计划法。单因子方差分析至少要对两个水平以上的效果进行比较分析,检验的因子可记作A 。前面所述的四种广告为四个水平,可分别记作4 321,,,A A A A 。每个水平的观测值可以用ij Y 表示。在方 差分析中,当涉及到的因子只有一个时,称为单因子方差分析;涉及的因子有两个时称为双因子方差分析;涉及的因子有两个以上的方差分析,称作多因子方差分析。它具有两个特点; ①各水平的观测值个数不一定相等。 ②各组观测数据必须是,从具有相同方差的相互独立的总体中随机抽样的样本。单因子方差分析的资料结构如 表9-11)。 (表9-1)单因子方差分析的资料结 构 1)因为每一个观测值的个数不一定相等,所以其观测值数不能用n 表示。为了便于区别通常用n j 表示。

相关主题
文本预览
相关文档 最新文档