双因子方差分析例子
- 格式:doc
- 大小:49.00 KB
- 文档页数:3
2 双因子方差分析2.1 双因子试验当试验条件中涉及到两个因子时,就称为双因子试验。
设A 为一个因子,有I 个水平:A i , I i ,,1L =;B 为另一个因子,有J 个水平:B j , J j ,,1L =。
在设计试验方案时,一个重要问题是如何将两个因子的水平搭配起来。
首先,可以考虑每个因子(A 或B )的不同水平对试验结果分别会有影响。
其次,两个因子不同的水平组合会有特殊的影响(并不是两个因子水平分别影响的简单叠加)。
在这种情况下,为对各种可能的结果作全面考察,应该对两个因子所有可能的水平组合作试验。
这样的试验就是双因子交叉分组试验。
交叉分组试验是最常见的一种双因子试验。
将A 因子的任一水平A i 与B 因子的任一水平B j 搭配,则总共有I J 种组合:(A i ,B j ), I i ,,1L =; J j ,,1L =.在所有这I J 种组合上至少各作一次试验。
例如,假定要在一些试验小区内试验三个小麦品种(分别记为A1、A2和A3)和两种肥料(分别记为B1、B2),在同一个小区上只种一个品种,同时只施一种肥料。
这样,“品种”和“肥料”就构成两个因子,前者有三个水平,后者有两个水平。
这两个因子的所有可能的水平组合共有623=×种:(A1,B1), (A1,B2), (A2,B1), (A2,B2), (A3,B1), (A3,B2)。
如果在每种水平组合上作相同次数的试验(run ),则整个试验方案称为是“均衡的”。
与单因子试验的情况不同,在双因子交叉分组试验中,若试验方案不均衡,则方差分析会变得比较困难,我们在以后的章节中再来讨论这个问题。
对于均衡的试验,为保证能分析随机误差,在每个水平组合上应作多于一次的试验,称为“有重复”的。
如果在每个水平组合上只作一次的试验,则称为“无重复”的。
对于无重复的交叉分组试验,只有在模型简化之后,才能留有“自由度”来分析误差。
另一种双因子试验的水平组合方式是“嵌套分组”,有时也会遇到。
收稿日期: 2007- 11-02 作者简介: 叶红卫( 1979- ) , 男, 广东龙川人, 广东省河源职业技术学院教育系. 应用SPSS 进行双因子方差分析叶红卫, 朱蓝辉( 河源职业技术学院教育系, 广东河源517000) 摘要: 通过用统计软件SPSS 对两个实例进行双因子方差分析, 一个是不考虑交互作用的双因子方差分析, 另一个是考虑交互作用的双因子方差分析. 给出了用统计软件SPSS 进行双因子方差分析的详细步骤和对得到的结果进行了分析, 并指出了用SPSS 进行双因子方差分析时应注意的问题. 关键词: 显著水平; 变量; 方差分析中图分类号: O 2121 6 文献标识码: A 文章编号: 1673-1492 ( 2008) 02-0063-03 Using SPSS to Make Double Factor Variance Analysis YE H ong-wei, ZHU Lan-hui( Depar tment of Education, Heyuan Polytechnical College, Heyuan 517000, Guangdong, China) Abstract: This paper shows t he det ailed process of the double f act or var iance analysis in two examples using SPSS. Bet ween t he t wo examples, one is analyzed in no regarding of the int eract ion of t he double fact or variance; t he ot her is analyzed in regarding of t he int eraction of the double f act or variance. It also point s out t he aspect s t hat should be paid at tention t o when using SPSS t o make t he double f act or variance analysis. Key words: remarkable level; variable;variance analysis 1 引言方差分析广泛用在各种论文的数据分析和处理中, 那么, 如何进行方差分析呢, 下面通过两个具体的实例来介绍应用统计软件SPSS 进行双因子方差分析, 为了方便起见, 称在试验中变化的因素为因子, 用A, B, C ,表示, 因子在试验中所取的不同状态称为水平, 因子A 的r 个水平用A1 , A2 , ,, Ar 表示. 2 用SPSS 进行双因子方差分析 21 1 不考虑交互作用的双因子方差分析例1 为了考察蒸馏水的pH 值和硫酸铜溶液浓度对化验血清中白蛋白与球蛋白的影响, 对蒸馏水的pH 值( A) 取了4 个不同水平, 对硫酸铜的浓度( B) 取了3 个不同水平, 在不同水平组合( Ai , Bj ) 下各测一次白蛋白与球蛋白之比, 其结果列于下表中, 试在A= 01 05 显著性水平下检验两个因子对化验结果有无显著差异. [ 1] 表1 在不同水平组合测得的白蛋白与球蛋白之比数据A1 A2 A3 A4 B1 31 5 21 6 21 0 11 4 B2 21 3 21 0 11 5 01 8 B3 21 0 11 9 11 2 01 3 # 63 # 第24 卷第2 期2008 年4 月河北北方学院学报( 自然科学版) Jour nal of Hebei North University ( Nat ur al Science Edition) Vol 1 24 No1 2 Apr1 2008 第一步: 定义一个分组变量为group2 ( 即在Var iable View 中/ name0列中的第一行输入group2, 并设置/ Decimals0 的值为0) , 该变量表示因子B 的3 个不同水平, 其值1, 2, 3 分别表示B1 , B2 , B3 . 定义一个变量为dat a ( 即在Variable View中/ name0 列中的第二行输入data) , 定义另一个分组变量为group1 ( 即在Variable View 中/ name0 列的第三行输入group1, 并设置/ Decimals0 的值为0) , 该变量表示因子A 的四个不同水平, 其值1, 2, 3, 4 分别表示A1 , A2 , A3 , A4 . 按照列的顺序( 即先输入A1 列的数据, 然后输入A2 例的数据, 依此类推) 依次输入SPSS ( 在Data View 中的/ dat a0 列中输入表中的12 个数据. 输入后的数据如图1 中的( 1) 所示) . 第二步: 在菜单上选择Analyze yGeneral Linear Models yUnivariat e 单击, 出现Univariat e 框, 将dat a 选入Dependent Variable 框, 将group1, group2 选入Fixed Fact or ( s) 框. 单击/ Model0 按钮, 选择Cust om, 将gr oup1, group2 选入Model, 在Build Term ( s) 中选择Main ef fect s, 单击/ Cont inue0 按钮. 第三步: 单击/ OK0 按钮, 得出如下结果. 表2 SPSS 得到的双因子方差分析结果数据( 不考虑交互作用) Source Type I II Sum of Squares df Mean Square F Sig. Cor rected Model 71 511 ( a) 5 11 502 341 889 01 000 Intercept 381 521 1 381 521 8941 677 01 000 Group2 21 222 2 11 111 251 800 01 001 Group1 51 289 3 11 763 401 948 01 000 Er ror 01 258 6 01 043 T otal 461 290 12 Cor rected Total 71 769 11 注: a. R Squared = 01 967 ( Adjust ed R Squared = 01 939) 第四步: 结果分析: 从上表可知, group1 和group2 的p 值均小于01 05, 所以, A= 01 05 在显著性水平下, 因子 A 的不同水平及因子B 的不同水平都对化验结果有显著影响. 21 2 考虑交互作用的双因子方差分析例2 在某化工生产中为了提高收率. 选了3 种不同浓度, 4 种不同温度做试验, 在同一浓度与温度组合下各做两次试验,其收率数据如下表所列( 数据均减去75) , A= 01 05 试在显著性水平下检验不同浓度、不同温度以及它们间的交互作用对收率有无显著影响. [ 1] 表3 两次实验的收率数据表B ( 温度) A ( 浓度) B1 B2 B3 B4 A1 141 10 111 11 131 90 101 12 ( 24) ( 22) ( 22) ( 22) A2 91 70 101 80 71 11 61 10 ( 16) ( 18) ( 18) ( 16) A3 51 11 131 14 121 13 141 10 ( 16) ( 27) ( 26) ( 24) 第一步: 定义一个分组变量为group1 ( 即在Var iable View 中/ name0 列中的第一行输入group1, 并设置/ Decimals0 的值为0) , 该变量表示因子 A 的 3 个不同水平, 其值1, 2, 3 分别表示A1 , A2 , A3 . 定义一个变量为data ( 即在Variable View 中/ name0 列中的第二行输入dat a) , 定义另一个分组变量为group2 ( 即在Variable View 中/ name0 列中的第三行输入group2, 并设置/ Decimals0 的值为0) , 该变量表示因子 B 的四个不同水平, 其值1, 2, 3, 4 分别表示B1 , B2 , B3 , B4 . 按照行的顺序( 即先输入A1 行的数据, 然后输入A2 行的数据, 依此类推) 依次输入SPSS ( 在Dat a View 中的/data0 列中输入表中的24 个数据, 输入后的数据如图1 中的( 2) 所示) . 第二步: 在菜单上选择Analyze yGeneral Linear Models yUnivariat e 单击, 出现Univariat e 框, 将# 64 # 2008 年4 月河北北方学院学报( 自然科学版) 第2 期dat a 选入Dependent Variable 框, 将group1, group2 选入Fixed Fact or ( s) 框. 单击/ Model0 按钮, 选择Ful l f act orial, 单击/ Cont inue0 按钮. 第三步: 单击/ OK0 按钮, 得出如下结果. 表4 SPSS 得到的双因子方差分析结果数据( 考虑交互作用) Source Type III Sum of Squares df Mean Squar e F Sig. Corr ect ed Model 821 833 ( a) 11 71 530 11 390 01 290 Int ercept 2 6041 167 1 2 6041 167 4801 769 01 000 Gr oup1 441 333 2 221 167 41 092 01 044 Gr oup2 111 500 3 31 833 01 708 01 566 Gr oup1* Gr oup2 271 000 6 41 500 01 831 01 568 Error 651 000 12 51 417 Total 2 7521 000 24 Corr ect ed Total 1471 833 23 注: a. R Squared = 01 560 ( Adjust ed R Squared = 01 157) 第四步: 结果分析从上表可知, group2 和group1 * group2 的p 值均大于01 05, 只有group1 的p 值小于01 05 所以, 在A= 01 05 显著性水平下, 因子A 是显著的, 即浓度不同将对收率产生显著影响; 而温度及交互作用的影响都不显著[ 7] . group2 dat a group1 1 31 50 1 2 21 30 1 3 21 00 1 1 21 60 2 2 21 00 2 3 11 90 2 1 21 00 32 11 503 3 11 20 3 1 11 404 2 01 80 4 3 01 30 4 ( 1) group1 dat a group2 1 141 00 1 1 101 00 1 1 111 00 2 1 111 00 2 1 131 00 3 1 91 00 3 1 101 00 4 1 121 00 4 2 91 00 1 2 71 00 1 2 101 00 2 2 81 00 2 2 71 00 3 2 111 00 3 2 61 00 4 2 101 00 4 3 51 00 1 3 111 00 1 3 131 00 2 3 141 00 2 3 121 00 3 3 131 00 3 3 141 00 4 3 101 00 4 ( 2) 图1 输入的数据在SPSS 中的视图 3 结论用SPSS 统计软件进行方差分析是非常简便和快捷的, 但是, 要注意SPSS 进行方差分析时, 对数据的输入的格式是有要求的, 一般来说, 定义的分组变量主要是用来表示因子的不同水平. [ 2] 如果输入的数据的格式不对, 那么将得不到正确的结果.所以, 在用SPSS 进行方差分析时要注意到这一点. 参考文献: [ 1] 魏宗舒. 概率论与数理统计教程[ M] . 北京: 高等教育出版社, 2002. 380-391 [ 2] 余建英, 何旭宏. 数据统计分析与SPSS 应用[ M] . 北京: 人民邮电出版社, 2003. 56-62 [ 3] 李爱军, 刘兵. SPSS 软件在统计辅助教学中的应用[ J] . 滁州学院学报, 2006, 8 ( 03) : 114-116 [ 4] 徐林. 利用SPSS 进行主成分回归分析[ J] . 宁波职业技术学院学报, 2006, 10 ( 02) : 67-69 [ 5] Peugh J L, Ender s C K. Using the SPSS mixed pr ocedure to fit cr oss-sectional and longit udinal multilevel models [ J] . Educat Psych Meas, 2005, 65 ( 05) : 811-835 [ 6] Liu R X, Kuang J, Gong Q, et al. Principal component regression analysis w ith SPSS [ J] . Comp Methods Progr B-i omed, 2003, 71 ( 02) : 141-147 [ 7] Starmer M E, Rice D M. Surveying t he stacks- Collecting data and analyzing results w ith SPSS [ J] . Libr Res Tech Ser v, 2004, 48 ( 04) : 263-272 [ 8] Jeff A. SPSS Reinfor ces Defensive Analytics [ J] . Info Wor ld, 2006, 28 ( 14) : 46-47 [ 责任编辑: 刘守义] # 65 # 2008 年4 月叶红卫等: 应用SPSS 进行双因子方差分析第2 期。
两因子析因设计的方差分析1. 概述本文介绍如何分析多因子方差分析。
先从两因子析因设计开始。
在析因设计方差分析中,一个处理的每个水平出现在另一个处理的所有水平下。
2 x 3 析因设计如下。
2 x 3 因子有6个单元水平 A 1 出现在B 的所有水平下, 水平 A 2 也出现在B 的所有水平下。
本文介绍如何用GLM: Univariate 过程分析这种类型的数据。
2. 数据数据来源于表演的行为研究。
参与者是24只猴子。
它们的任务是完成一个“单数”的问题。
给猴子出示三个物品,例如两个圆环和一个方块,有一个奖励食物放置在单数物品下的小坑里。
因变量(score ) 是猴子选择单数物品和得到奖励的实验总数。
有两个自变量,奖励 (reward ) 有三个水平(1个葡萄, 3个葡萄, 和 5个葡萄),驱赶 (drive ) 有两个水平(剥夺1小时食物和剥夺24小时食物)。
数据保存在文件glm-2way.sav 中。
变量如表1所示。
3. 假设检验全因子受试者间方差分析的假设检验如表2所示。
假设1 (独立性).每个设计单元中有不同的参与者,所以数据是独立的。
假设 2 (测量尺度).得分的测量尺度是比率。
假设 3 (正态性).假设数据在6个设计单元中服从正态分布。
如果分布对称,那么方差分析是稳健的。
这个假设能用探索过程检验每个设计单元的正态性。
然而,探索过程默认的分析是在每个选择因子的主效应上计算所需要的统计量。
对这个数据,当在Factor List框中放置reward和drive时,探索过程将在奖励的三个水平和驱赶的两个水平内分别进行正态性检验。
它不会在6个设计单元内按照假设要求计算所需要的统计量。
所以,为了生成需要的检验,必须使用语法命令改变这一切。
打开探索过程对话框AnalyzeDescriptive StatisticsExplore ...将变量score移到Dependent List窗口,变量drive和reward移到Factor List窗口。
【双因素方差分析例题】
下表数据是在4个地区种植的3种松树的直径.
试对松树的直径数据进行种树与地区的双因素方差分析?
模型识别
树种和地区是对松树的直径都有可能产生影响的两个因子,并且二者之间还有可能产生交互作用,即有可能出现某个地区最适合(不适合)某种松树的生长情况.
地区因子有4个水平,树种因子有三个水平,在每一个水平下分别抽取了5个样本.
我们先利用MATLAB提供的命令anova2()来对本题作双因子方差分析.再用单因子方差分析确定其它问题.
MATLAB数据处理
clear
A=[23 15 26 13 21 25 20 21 16 18 21 17 16 24 27 14 11 19 20 24]; B=[28 22 25 19 26 30 26 26 20 28 19 24 19 25 29 17 21 18 26 23]; C=[18 10 12 22 13 15 21 22 14 12 23 25 19 13 22 18 12 23 22 19]; X=[A',B',C'];
⑴双因子方差分析
reps=5;
[p,Table]=anova2(X,reps,'off')
p =
0.0004 0.3996 0.4156
Table =
'Source' 'SS' 'df' 'MS' 'F' 'Prob>F'
'Columns' [ 352.5333] [ 2] [176.2667] [9.1369] [4.3408e-004] 'Rows' [ 58.0500] [ 3] [ 19.3500] [1.0030] [ 0.3996]
'Interaction'[ 119.6000] [ 6] [ 19.9333] [1.0333] [ 0.4156]
'Error' [ 926.0000] [48] [ 19.2917] [] []
'Total' [1.4562e+003][59] [] [] []
双因子方差分析结果说明:
我们看到返回向量p有3个元素,分别表示输入矩阵X的列、行及交互作
用的均值相等的最小显著性概率,由于X的列表示树种方面的因素,行表示地
区方面的因素,所以根据这3个概率值我们可以知道:树种因素方面的差异显著,地区之间的差异和交互作用的影响不显著(没有某种树特别适合在某地区
种植).
接下来对树种进一步作单因子方差分析.
⑵单因子方差分析
[p,anovatab,stats]=anova1(X,[],'on')
p =
3.7071e-004
anovatab =
'Source' 'SS' 'df' 'MS' 'F' 'Prob>F' 'Columns' [352.5333] [2] [176.2667] [9.1036] [3.7071e-004] 'Error' [1.1036e+003] [57] [ 19.3623] [] []
'Total' [1.4562e+003] [59] [] [] []
stats =
gnames: [3x1 char]
n: [20 20 20]
source: 'anova1'
means: [19.5500 23.5500 17.7500]
df: 57
s: 4.4003
图三种松树直径的box图
单因子方差分析结果说明:
单因子方差分析进一步确认了树种之间的差异是显著的,由box图可以看出树种B的平均直径最大,故可认为树种B最好.
实际上,作多重比较得出的结论更细腻、丰富一些.。