第六章 方差分析
- 格式:pdf
- 大小:263.38 KB
- 文档页数:16
第六章方差分析第一节方差分析概述一.方差分析的定义[用途]定义:用途方差分析也称为变异数分析,是在教育与心理研究中最常用的变量分析方法,其主要功能在于分析测量或实验数据中不同来源的变异对总变异的贡献大小,从而确定测量或实验中因素对反应变量是否存在显著影响。
即用于置信度不变情况下的多组平均数之间的差异检验。
它既可以比较两个以上的样本平均数的差异检验,也可以应用于一个因素多种水平以及多个因素有多种水平的数据分析。
二.方差分析的作用方差分析主要应用于两种以上实验处理的数据分析,同时匕徽两个以上的样本平均数,推断多组资料的总体均数是否相同,也即检验多组数据之间的均数差异是否有统计意义。
在这个意义,也可以将其理解为平均数差异显著性检验的扩展。
当我们用多个t检验来完成这一过程时,相当于从t分布中随机抽取多个t值,这样落在临界范围之外的可能大大增加,从而增加了I型错误的概率,我们可以把方差分析看作t检验的增强版。
方差分析一次检验多组平均数的差异,降低了多次进行两组平均数检验所带来的误差。
在进行方差分析时,设定的假设是综合虚无假设,即假设样本所归属的所有总体的平均数都相等。
如果检验的结果是存在显著性差异,只能说明多组平均数之间存在显著性差异,但是无法确定究竟哪些组之间存在显著性差异,此时需要运用事后检验的方法来确定。
三.方差分析的相关概念一(一)数据的变异(1)变异:统计中的变异是普遍存在的7一般意义上的变异是指标志(包括品质标志和数量标志)在总体单位之间的不同表现。
可变标志的属性或数值表现在总体各单位之间存在的差异,统计上称之为变异,这是广义上的变异,即包括了品质标志和数量标志,有时仅指品质标志和在总体单位之间的不同表现。
注:随机性,即变异性。
(2)组间变异[组间差异]:组间变异表示处理间变异,主要指由于接受不同的实验处理(实验处理效应)而造成的各组之间的变异,可以用两个平均数之间的离差来表示,可将组间离差平方和记为SS AO组间差异可用组间方差来表征,用符号MS B表示。
第六章方差分析(六)第五节多因素方差分析一、多因素方差分析的定义多因素方差分析是用来研究两个及两个以上控制变量是否会对观测变量产生显著影响。
多因素方差分析不仅能够分析多个因素对观测变量 的独立影响,更能够分析多个控制因素的交互作用是否对观测变量的分布产生显著影响,进而最终找到利于观测变量的最优组合。
多因素 方差分析包括完全随机设出随机区组设计。
二、平均数差异检验、单因素方差分析、多因素方差分析比较当需要比较两个以上平均数的差异时,要使用单因素方差分析,而不进行多次平均数差异检验,这样就可以降低统计误差。
如果单次进行 平均数比较率,即显著性水平是a ,进行两两平均数比较的次数是N ,多次两两平均数差异的错误率:P N =l-(l-a)n o 同理多因素方差由于 同时进行两个因素以上的方差分析,亦能降低统计误差,同时,也能处理交互作用。
第六节事后检验(多个平均数之间的比较)一、事后检验[事后多重比较]事后检验的定义:方差分析所要检验的零假设是所有k 个处理的总体平均数没有显著性差异,相应的备择假设是k 个处理中至少有2个处 理的总体平均数之间存在显著差异。
但方差分析不拒绝零假设时,表明至少有2个处理的总体平均数不等,若方差分析F 检验的结果表明 差异显著就必须对各实验处理组的多对平均数进一步分析,做深入比较,判断究竟哪一对或哪几对的差异显著,确定两变量关系的本质。
事后检验也被称作事后多重比较,在这也叫做多个平均数之间的比较。
事后检验的目的:当方差分析表明一个主效应显著时,它只能提供几个变量之间是否存在显著差异的结果,又因为多重t 检验会使得I 型 错误发生的概率大大增加[吃1-Q :业L 因而我们只能采取事后检验。
二、事后检验的方法[1]N-K 法,也叫q 检验法;[2]HSD 检验(又叫Turkey 真实检验,更敏感,统计检验力更强,要求各组容量相等);[3]Scheffe 检验(匕啜保守,适用于样本容量不等,最大限降低了第一类误差a 水平,可能最安全);⑷费舍的最小显著差异法(LSD);一、协方差分析协方差分析的定义:协方差表示的是交互效应项,将处理引起的变异分解为处理在变量x 上引起的变异、在变量y 上引起的变异和在交互效应项xy 上引起的 变异。
第六章 方差分析(它是用以检验两个或多个均数间差异的假设检验方法。
它是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一种引伸。
) 一、方差分析与t 检验的关系t 检验可以判断两组数据平均数间的差异显著性;方差分析既可以判断两组又可以判断多组数据平均数之间的差异显著性。
二、方差分析的数学模型用线性模型(linear model)来描述每一观测值: X ij =μ+ τi +εij(i=1,2,3…,k ;j=1,2,3…,n)μ-总体平均数 τi -处理效应 εij -试验误差 x ij -是在第i 次处理下的第j 次观测值三、方差分析所需用到的各计算分析值以及F 检验 变异来源 平方和 自由度 均方MS F 值 F 0.05 F 0.01 组间 SS t 组间 df t =k-1SS 组间/df 组间MS t /MS e组内 SS e 组内 df e =k(n-1) SS 组内/df 组内 总变异 SS T 总df T =nk-1计算步骤:计算矫正数C =T 2kn (nk x C /2..=)C x SS ij T -∑∑=2;C x nSS i t -=∑2.1;t T e SS SS SS -= 1-=nk df T ;1-=k df t ;t T e df df df -=t t t df SS MS /=; e e e df SS MS /=F 值:MS t /MS e例题:【例5-1】以淀粉为原料生产葡萄糖过程中,残留的许多糖蜜可用于酱色生产。
生产酱色之前应尽可能彻底除杂,以保证酱色质量。
今选用5中除杂方法,每种方法做4次试验,试验结果见表5-2,试分析不同除杂方法的除杂效果? 表5-2 不同除杂方法的除杂量 g/kg除杂方法(A i)除杂量(x ij)合计(x i)平均 方差S i2A1 25.6 24.4 25.0 25.9 100.9 25.2 0.442 A2 27.8 27.0 27.0 28.0 109.8 27.5 0.277 A3 27.0 27.7 27.5 25.9 108.1 27.0 0.649 A4 29.0 27.3 27.5 29.9 113.7 28.4 1.543 A5 20.6 21.222.021.285.0 21.3 0.330x..=517.5单因素试验,处理数k =5,重复数n =4。
第六章方差分析第一节Simple Factorial过程6.1.1 主要功能6.1.2 实例操作第二节General Factorial过程6.2.1 主要功能6.2.2 实例操作第三节 Multivarite过程6.3.1 主要功能6.3.2 实例操作方差分析是R.A.Fister发明的,用于两个及两个以上样本均数差别的显著性检验。
由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。
方差分析的基本思想是:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
方差分析主要用于:1、均数差别的显著性检验,2、分离各有关因素并估计其对总变异的作用,3、分析因素间的交互作用,4、方差齐性检验。
第一节 Simple Factorial过程6.1.1 主要功能调用此过程可对资料进行方差分析或协方差分析。
在方差分析中可按用户需要作单因素方差分析(其结果将与第五章第四节相同)或多因素方差分析(包括医学中常用的配伍组方差分析);当观察因素中存在有很难或无法人为控制的因素时,则可对之加以指定以便进行协方差分析。
返回目录返回全书目录6.1.2 实例操作[例6-1]下表为运动员与大学生的身高(cm)与肺活量(cm3)的数据,考虑到身高与肺活量有关,而一般运动员的身高高于大学生,为进一步分析肺活量的差异是否由于体育锻炼所致,试作控制身高变量的协方差分析。
6.1.2.1 数据准备激活数据管理窗口,定义变量名:组变量为group(运动员=1,大学生=2),身高为x,肺活量为y,按顺序输入相应数值,建立数据库,结果见图6.1。
图6.1 原始数据的输入6.1.2.2 统计分析激活Statistics 菜单选ANOV A Models中的Simple Factorial...项,弹出Simple Factorial ANOV A对话框(图6.2)。
在变量列表中选变量y,点击 钮使之进入Dependent框;选分组变量group,点击 钮使之进入Factor(s)框中, 并点击Define Range...钮在弹出的Simple Factorial ANOV A:Define Range框中确定分组变量group的起止值(1,2);选协变量x,点击 钮使之进入Covariate(s)框中。
图6.2 协方差分析对话框点击Options...框,弹出Simple Factorial ANOV A:Options对话框。
系统在协方差分析的方法(Method)上有三种选项:1、Unique:同时评价所有的效应;2、Hierarchical:除主效应外,逐一评价各因素的效应;3、Experimental:评价因素干预之前的主效应。
本例选Unique方法,之后点击Continue钮返回Simple Factorial ANOV A对话框,再点击OK钮即可。
6.1.2.3 结果解释在结果输出窗口中可见如下统计数据:先输出肺活量总均数和两组的肺活量均数,总均数为4033.25,运用员组均数为4399.00,大学生组为3667.50。
接着协方差分析表明,混杂因素X(身高)两组间是有差异的(F=10.679,P=0.002),控制其影响后,两组间肺活量的差别依然存在(F=9.220,P=0.004),故可以认为两组间肺活量的均数在消除了身高因素的影响之后仍有差别,运动员的肺活量大于大学生,即体育锻炼会提高肺活量。
最后系统输出公共回归系数,= 36.002,该值可用于求修正均数:= - ( - )本例为= 4399.00 - 36.002×(178.175 - 174.3325)= 4260.6623= 3667.50 - 36.002×(170.49 - 174.3325)= 3805.8377返回目录返回全书目录第二节 General Factorial过程6.2.1 主要功能调用此过程可对完全随机设计资料、配伍设计资料、析因设计资料、正交设计资料等等进行多因素方差分析或协方差分析。
返回目录返回全书目录6.2.2 实例操作[例6-2]下表为三因素析因实验的资料,请用方差分析说明不同基础液与不同血清种类对钩端螺旋体的培养计数的影响。
6.2.2.1 数据准备激活数据管理窗口,定义变量名:基础液为base,血清种类为sero,血清浓度为pct,钩端螺旋体的培养计数为X,按顺序输入相应数值,建立数据库。
6.2.2.2 统计分析激活Statistics菜单选ANOV A Models中的General Factorial...项,弹出General Factorial ANOV A对话框(图6.3)。
在对话框左侧的变量列表中选变量x,点击 钮使之进入Dependent Variable框;选要控制的分组变量base、sero和pct,点 钮使之进入Factor(s)框中,并分别点击Define Range钮,在弹出的General Factorial ANOV A:Define Range对话框中确定各变量的起止值,本例变量base的起止值为1、3,变量sero的起止值为1、2,变量pct的起止值为1、2。
之后点击OK钮即可。
图6.3 析因方差分析对话框6.2.2.3 结果解释在结果输出窗口中,系统显示48个观察值进入统计,三个因素按其各自水平共产生12种组合。
分析表明,模型总效应的F值为10.55,P值< 0.001,说明三因素间存在有交互作用。
单因素效应和交互效应导致的组间差别比较结果是:单因素组间比较:A:基础液(BASE)F = 4.98,P = 0.012,说明三种培养基培养钩体的计数有差别;B:血清种类(SERO)F = 61.265,P < 0.001,说明两种血清培养钩体的计数有差别;C:血清浓度(PCT)F = 3.49,P = 0.070,说明两种血清浓度培养钩体的计数无差别。
两因素构成的一级交互作用:A×B:基础液(BASE)×血清种类(SERO)F = 5.16,P = 0.011,交互作用明显;B×C:血清种类(SERO)×血清浓度(PCT)F = 15.96,P < 0.001,交互作用明显;A×C:基础液(BASE)×血清浓度(PCT)F = 0.78,P = 0.465,交互作用不明显。
三因素构成的二级交互作用:A×B×C:基础液(BASE)×血清种类(SERO)×血清浓度(PCT)F = 6.75,P = 0.003,交互作用明显。
返回目录返回全书目录第三节 Multivarite过程6.3.1 主要功能调用此过程可进行多元方差分析。
此外,对于一元设计,如涉及混合模型的设计、分割设计(又称列区设计)、重复测量设计、嵌套设计、因子与协变量交互效应设计等,此过程均能适用。
返回目录返回全书目录6.3.2 实例操作[例6-3]甲地区为大城市,乙地区为县城,丙地区为农村。
某地分别调查了上述三类地区8岁男生三项身体生长发育指标:身高、体重和胸围,数据见下表,问:三类地区之间男生三项身体生长发育指标的差异有无显著性?6.3.2.1 数据准备激活数据管理窗口,定义变量名:地区为G,身高为X1,体重为X2,胸围为X3,按顺序输入相应数值,变量G的数值是:甲地区为1,乙地区为2,丙地区为3。
6.3.2.2 统计分析激活Statistics菜单选ANOV A Models中的Multivarite...项,弹出Multivarite ANOV A 对话框(图6.8)。
首先指定供分析用的变量x1、x2、x3,故在对话框左侧的变量列表中选变量x1、x2、x3,点击 钮使之进入Dependent Variable框;然后选变量g(分组变量)点击 钮使之进入Factor(s)框中,并点击Define Range钮,确定g的起始值和终止值。
图6.4 多元方差分析对话框点击Options...钮,弹出Multivarite ANOV A:Options对话框,选择需要计算的指标。
在Factor(s)栏内选变量g,点击 钮使之进入Display Means for框,要求计算平均值指标;在Matriced Within Cell栏内选Correlation、Covariance、SSCP项,要求计算单元内的相关矩阵、方差协方差矩阵和离均差平方和交叉乘积矩阵;在Error Matrices栏内也选上述三项,要求计算误差的相关矩阵、方差协方差矩阵和离均差平方和交叉乘积矩阵;在Diagnostics栏内选Homogeneity test项,要求作变量的方差齐性检验。
之后点击Continue钮返回Multivarite ANOV A对话框,最后点击OK钮即可。
6.3.2.3 结果解释在结果输出窗口中将看到如下分析结果:系统首先显示共90个观察值进入统计分析,因分组变量g为三个地区,故分析的单元数为3。
然后输出3个应变量(x1、x2、x3)的方差齐性检验结果,分别输出了Cochran C 检验值及其显著性水平P值、Bartlett-Box F检验值及其显著性水平P值。
其中身高:C = 0.39825,P = 0.540;F = 1.01272,P = 0.363;体重:C = 0.43787,P = 0.227;F = 4.48624, P = 0.011;胸围:C = 0.47239, P = 0.089;F = 2.06585, P = 0.127;可见3项指标的方差基本整齐(P值均大于0.05)。
Cochran C检验和Bartlett-Box F检验对考查协方差矩阵的相等性比较方便,但还不够。
于是系统接着分别输出了三类地区(即各个单元)各生长发育指标的离均差平方和交叉乘积矩阵和方差协方差矩阵。
之后作Box M检验,Box M检验提供矩阵一致性的多元测试,本例Boxs M = 36.93910,在基于方差分析的显著性检验中F = 2.92393;在基于χ2的显著性检验中χ2 = 35.09922, 两者P < 0.001,故认为矩阵一致性不佳。
X2 380.137 230.519X3 215.937 156.559 314.859Variance-Covariance matrixX1 X2 X3X1 29.696X2 13.108 7.949X3 7.446 5.399 10.857Cell Number .. 1 (Cont.)Correlation matrix with Standard Deviations on DiagonalX1 X2 X3X1 5.449X2 .853 2.819X3 .415 .581 3.295Determinant of Covariance matrix of dependent variables = 444.98354LOG(Determinant) = 6.09804Cell Number .. 2Sum of Squares and Cross-Products matrixX1 X2 X3X1 565.368X2 147.222 78.910X3 139.430 79.337 147.967Variance-Covariance matrixX1 X2 X3X1 19.495X2 5.077 2.721X3 4.808 2.736 5.102Correlation matrix with Standard Deviations on DiagonalX1 X2 X3X1 4.415X2 .697 1.650X3 .482 .734 2.259Determinant of C ovariance matrix of de pendent v ariables = 63.90640LOG(Determinant) = 4.15742Cell Number .. 3Sum of Squares and Cross-Products matrix下面系统输出将三类地区看成一个大样本时的离均差平方和交叉乘积矩阵。