第五章方差分析
- 格式:doc
- 大小:583.50 KB
- 文档页数:27
目录1、单因素方差分析1)准备分析数据2)启动分析过程3)设置分析变量4)设置多项式比较5)多重比较6)提交执行7)结果与分析2、多因素方差分析1)准备分析数据2)调用分析过程3)设置分析变量4)选择分析模型5)选择比较方法6)选择均值图7)选择多重比较8)保存运算值9)选择输出项10)提交执行11)结果分析方差分析是用于两个及两个以上样本均数差别的显著性检验。
由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。
方差分析的基本思想是:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
方差分析主要用途:①均数差别的显著性检验,②分离各有关因素并估计其对总变异的作用,③分析因素间的交互作用,④方差齐性检验。
在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。
通常是比较不同实验条件下样本均值间的差异。
例如医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同化学药剂对作物害虫的杀虫效果等,都可以使用方差分析方法去解决。
方差分析原理方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:(1) 随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,记作SS w,组内自由度df w。
(2) 实验条件,实验条件,即不同的处理造成的差异,称为组间差异。
用变量在各组的均值与总均值之偏差平方和表示,记作SS b,组间自由度df b。
总偏差平方和 SS t = SS b + SS w。
组内SS t、组间SS w除以各自的自由度(组内dfw =n-m,组间dfb=m-1,其中n为样本总数,m为组数),得到其均方MS w和MS b,一种情况是处理没有作用,即各组样本均来自同一总体,MS b/MS w≈1。
第五章方差分析•如果要检验两个总体的均值是否相等,我们可以用t检验。
当要检验多个总体的均值是否相等,则需要采用方差分析。
•方差分析是R.A.Fister发明的,它是通过对误差的分析研究来检验两个或多个正态总体均值间差异是否具有统计意义的一种方法。
•由于各种因素的影响,研究所得的数据呈现波动,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果造成影响的可控因素,方差分析认为不同处理组的均值间的差异基本来源有两个:•组内差异:由随机误差造成的差异,用变量在各组的均值与该组内变量值之差平方和的总和表示,记作SSE。
•组间差异:由因素中的不同水平造成的差异,用变量在各组的均值与总均值之差平方和的总和表示,记作SSA。
•方差分析的基本思想是:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
•方差分析的三个条件:•被检验的各总体均服从正态分布;•各总体的方差皆相等;•从每一个总体中所抽出的样本是随机且独立的;方差分析的基本步骤:建立原假设H0:两个或多个总体均值相等。
将各不同水平间的总离差分成两个部分:组间差异SSA组内差异SSE构造检验统计量: F= MSA / MSE判断:在零假设为真时,F~F[(k-l),(n-k)]的F分布。
若各样本平均数的差异很大,则分子组间差异会随之变大,而F值也随之变大,故F检验是右尾检验。
当检验统计量F大于临界值时则拒绝原假设;或者根据 p值来判断,若p<α,则拒绝原假设§5.1 单因素方差分析(One-Way ANOVA过程)One-Way ANOVA过程用于进行两组及多组样本均数的比较,即成组设计的方差分析,如果做了相应选择,还可进行随后的两两比较,甚至于在各组间精确设定哪几组和哪几组进行比较。
5.1.1 界面说明【Dependent List框】选入需要分析的变量,可选入多个结果变量(应变量)。
1方差分析的基本步骤:①建立假设和确定检验水准②计算检验统计量③查表确定P值和作出推断结论2两样本均数比较的t检验与完全随机化设计多个样本均数比较的方差分析之间的关系:①当比较的均数为两组时,F = t2 ,此时方差分析与t检验所得结果是等价的。
②两样本均数比较的t检验只能用于两个样本,而完全随机化设计多个样本均数比较的方差分析还可以用于多个样本。
配对设计的t检验与随机区组设计的方差分析之间的关系:①当比较的均数为两组时,F = t2 ,此时方差分析与t检验所得结果是等价的。
②配对设计的t检验只能用于同一对象或者匹配的两个对象接受两种处理的情况,而随机区组设计的方差分析可以用于两种以上的处理。
③配对设计的t检验只能分析处理因素的作用,随机区组设计的方差分析除了可以分析处理因素外,还可以分析区组因素。
3ν1= 3,ν2 = 21,查表得F0.05,(3,21) = 3.07 < F,得出p<0.05,可以认为这四组结果不等或者不全相等,但并非任两组之间都有差别。
若想进一步知道任两组之间的关系,还需要进行两两比较。
4①建立假设和确定检验水准H0:四组大鼠的血清SOD活性的总体均数相等,即μ1=μ2=μ3=μ4。
H1:四组总体均数不等或不全相等。
α=0.05②计算检验统计量F值SS总=6134.890,SS组间=3166.012,SS组内=2968.869ν组间=k-1=4-1=3,ν组内=N-k=40-4=36MS组间=1055.340,MS组内=82.469,将上述结果列成方差分析表:③确定p值,作出推断结论查表得F0.05,(3,36)=2.87,F> F0.05,(3,36),p<0.05,故拒绝H0,接受H1,差别有统计学意义,可以认为四组大鼠的血清SOD活性的总体均数不等或不全相等。
5①建立假设和确定检验水准H0:三种降糖药降糖效果的总体均数相等,即μ1=μ2=μ3。
第五章方差分析方差分析是通过实验数据对影响产品的质量、产量的多个可控因素作统计分析,以分清因素的主次及水平组合形式,并求出最优组合形式,以提高产品质量、产量的一种数学分析方法。
1单因素方差分析,设影响指标的因素仅有一个,设为A 因素,该因素有a 个水平(状态)A 1,A 2^\A a ,在每个水平下,分别作 ni 次实验,i=1,2,|||a 其样本值X jj 〜N (7d 2), i =1,2,|||a ,2或 X j =斗• ;ij , ;ij 〜N (0,二)。
(1)方差分析主要解决: 1、检验A 因素对指标是否有影响及影响的程度,首先提出假设:H 。
「打=二川=4 (在各水平下的均值相等)H i : " i = " j j = j i, j,二 1 112 a (至少有一对不相等)其检验的思想方法是若组间(各水平间)平方和大,表明 A 因素对指标是有影响的,否则,组间平方和小,表明A 因素对指标没有影响。
又组内(随机误差)平方和小, 用F -检验法即F 值大可拒绝 H 0,表明 A 因素影响显著,否则接受 H 0,表明 A 因素影响不 显著。
2、计总体的均值和方差 7,「2川 叮二2。
(2)方差分析的方法:a1、样本值 X j ,i =1,2,1 Ha ,j =1,2^|n i ,n^n ,共有n个样本值,7a n i设X L = 7、Xij ,表所有样本值之和,总平均值1 j m又X x- X 表示第i 个的水平下样本值之和,i =1,2,1"a , X L =乙 X ijj 亠和=丄:X,表示第i 个的水平下样本均值,'m j± n '',且有:a门)a aa门) _1 1X L = ' n i X i_ =' X i X j = nX ,1 2 1 2X X L , X 2X_,nnyjm i¥i 1 i =1 j :in. ii' (Xj —X [)»X j —n i XT =n i 可—n 区=0, j 4 j 4 ~~ ~2、平方和:a n称S T(X j -X)2为总的离差平方和,其计算公式为i 2 j 二a na gS r =、、(X i j -X)X ij—X 二二(X j-X)i =1 j =1i = 1j 1a m x2ija n=E Z-X" 'X j -X(nX -nX)i4 'j = 1i= 1 = :1a n i =s zx 2ij—2- nXi 4 j 4a niX j-丄X[2i 4 j 4na m称S A■ (X^ -X)2为因素A 的组间平方和,其计算公式为:i二 j 二a m _ _ a ni _S A ' (X^ -X)X T - X! 1 (X T -X)i J j 1-i 4 j ±- ani ___ 2=、'' X i || i士 j 吕a2二、nX j|_i z !a _______ ,=、n X Li妊「丄xl i i 口a m _-X' '、■ X i -X(nX -nX) i 4 j 4 -a-X 二 r )i X ii =1—2—nX -X : n(X ; —- X j =丄人」,),n j 壬n iani称S E —' (X ij -XL 2为第i 个水平下的组内平方和,其计算公式为:i =i j =1a n i__ ______ _____由 S r 一 a a (X jj —X jL X j_ — X)2i :1 j :1…i2 a □ …•二二(X j —X iL )2+、、(瓦 _X )2 + 2'、(X j —X i"* —X)i A j Aa二 S ES A 2、 i丄二 S ES A即有:S^S T -S A ,3统计分析又由 E^) =E 2(n - a)匕 n -a ,有 E (--;「2, n —a 得方差二2的估计量为;「=旦。
单因素方差分析单因素方差分析也称作一维方差分析。
它检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。
还可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析,即进行均值的多重比较。
One-Way ANOVA过程要求因变量属于正态分布总体。
如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程。
如果几个因变量之间彼此不独立,应该用Repeated Measure过程。
[例子]调查不同水稻品种百丛中稻纵卷叶螟幼虫的数量,数据如表5-1所示。
表5-1 不同水稻品种百丛中稻纵卷叶螟幼虫数数据保存在“DATA5-1.SAV”文件中,变量格式如图5-1。
图5-1分析水稻品种对稻纵卷叶螟幼虫抗虫性是否存在显著性差异。
1)准备分析数据在数据编辑窗口中输入数据。
建立因变量“幼虫”和因素水平变量“品种”,然后输入对应的数值,如图5-1所示。
或者打开已存在的数据文件“DATA5-1.SAV”。
2)启动分析过程点击主菜单“Analyze”项,在下拉菜单中点击“Compare Means”项,在右拉式菜单中点击“0ne-Way ANOVA”项,系统打开单因素方差分析设置窗口如图5-2。
图5-2 单因素方差分析窗口3)设置分析变量因变量:选择一个或多个因子变量进入“Dependent List”框中。
本例选择“幼虫”。
因素变量:选择一个因素变量进入“Factor”框中。
本例选择“品种”。
4)设置多项式比较单击“Contrasts”按钮,将打开如图5-3所示的对话框。
该对话框用于设置均值的多项式比较。
图5-3 “Contrasts”对话框定义多项式的步骤为:均值的多项式比较是包括两个或更多个均值的比较。
例如图5-3中显示的是要求计算“1.1×mean1-1×mean2”的值,检验的假设H0:第一组均值的1.1倍与第二组的均值相等。
单因素方差分析的“0ne-Way ANOVA”过程允许进行高达5次的均值多项式比较。
多项式的系数需要由读者自己根据研究的需要输入。
具体的操作步骤如下:① 选中“Polynomial”复选项,该操作激活其右面的“Degree”参数框。
② 单击Degree参数框右面的向下箭头展开阶次菜单,可以选择“Linear”线性、“Quadratic”二次、“Cubic”三次、“4th”四次、“5th”五次多项式。
③ 为多项式指定各组均值的系数。
方法是在“Coefficients”框中输入一个系数,单击Add按钮,“Coefficients”框中的系数进入下面的方框中。
依次输入各组均值的系数,在方形显示框中形成—列数值。
因素变量分为几组,输入几个系数,多出的无意义。
如果多项式中只包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为0值。
如果只包括第一组与第二组的均值,则只需要输入前两个系数,第三、四个系数可以不输入。
可以同时建立多个多项式。
一个多项式的一组系数输入结束,激话“Next”按钮,单击该按钮后“Coefficients”框中清空,准备接受下一组系数数据。
如果认为输入的几组系数中有错误,可以分别单击“Previous”或“Next”按钮前后翻找出错的一组数据。
单击出错的系数,该系数显示在编辑框中,可以在此进行修改,修改后单击“Change”按钮在系数显示框中出现正确的系数值。
当在系数显示框中选中一个系数时,同时激话“Remove”按钮,单击该按钮将选中的系数清除。
④单击“Previous”或“Next”按钮显示输入的各组系数检查无误后,按“Continue”按钮确认输入的系数并返回到主对话框。
要取消刚刚的输入,单击“Cancel”按钮;需要查看系统的帮助信息,单击“Help”按钮。
本例子不做多项式比较的选择,选择缺省值。
5)设置多重比较在主对话框里单击“Post Hoc”按钮,将打开如图5-4所示的多重比较对话框。
该对话框用于设置多重比较和配对比较。
方差分析一旦确定各组均值间存在差异显著,多重比较检测可以求出均值相等的组;配对比较可找出和其它组均值有差异的组,并输出显著性水平为0.95的均值比较矩阵,在矩阵中用星号表示有差异的组。
图5-4 “Post Hoc Multiple Comparisons”对话框(1)多重比较的选择项:①方差具有齐次性时(Equal Variances Assumed),该矩形框中有如下方法供选择:LSD (Least-significant difference) 最小显著差数法,用t检验完成各组均值间的配对比较。
对多重比较误差率不进行调整。
Bonferroni (LSDMOD) 用t检验完成各组间均值的配对比较,但通过设置每个检验的误差率来控制整个误差率。
Sidak 计算t统计量进行多重配对比较。
可以调整显著性水平,比Bofferroni方法的界限要小。
Scheffe对所有可能的组合进行同步进入的配对比较。
这些选择项可以同时选择若干个。
以便比较各种均值比较方法的结果。
R-E-G-WF (Ryan-Einot-Gabriel-Welsch F) 用F检验进行多重比较检验。
R-E-G-WQ (Ryan-Einot-Gabriel-Welsch range test) 正态分布范围进行多重配对比较。
S-N-K (Student-Newmnan-Keuls) 用Student Range分布进行所有各组均值间的配对比较。
如果各组样本含量相等或者选择了“Harmonic average of all groups”即用所有各组样本含量的调和平均数进行样本量估计时还用逐步过程进行齐次子集(差异较小的子集)的均值配对比较。
在该比较过程中,各组均值从大到小按顺序排列,最先比较最末端的差异。
Tukey(Tukey's,honestly signicant difference) 用Student-Range统计量进行所有组间均值的配对比较,用所有配对比较误差率作为实验误差率。
Tukey's-b用“stndent Range”分布进行组间均值的配对比较。
其精确值为前两种检验相应值的平均值。
Duncan (Duncan's multiple range test) 新复极差法(SSR),指定一系列的“Range”值,逐步进行计算比较得出结论。
Hochberg's GT2用正态最大系数进行多重比较。
Gabriel用正态标准系数进行配对比较,在单元数较大时,这种方法较自由。
Waller-Dunca用t统计量进行多重比较检验,使用贝叶斯逼近。
Dunnett指定此选择项,进行各组与对照组的均值比较。
默认的对照组是最后一组。
选择了该项就激活下面的“ControlCategory”参数框。
展开下拉列表,可以重新选择对照组。
“Test”框中列出了三种区间分别为:∙“2-sides” 双边检验;∙“<Control” 左边检验“>Conbo1”“右边检验。
②方差不具有齐次性时(Equal Varance not assumed),检验各均数间是否有差异的方祛有四种可供选择:Tamhane's T2, t检验进行配对比较。
Dunnett's T3,采用基于学生氏最大模的成对比较法。
Games-Howell,Games-Howell比较,该方法较灵活。
Dunnett's C,采用基于学生氏极值的成对比较法。
③ Significance 选择项,各种检验的显著性概率临界值,默认值为0.05,可由用户重新设定。
本例选择“LSD”和“Duncan”比较,检验的显著性概率临界值0.05。
6) 设置输出统计量单击“Options”按钮,打开“Options”对话框,如图5-5所示。
选择要求输出的统计量。
并按要求的方式显示这些统计量。
在该对话框中还可以选择对缺失值的处理要求。
各组选择项的含义如下:图5-5输出统计量的设置“Statistics”栏中选择输出统计量:Descriptive,要求输出描述统计量。
选择此项输出观测量数目、均值、标准差、标准误、最小值、最大值、各组中每个因变量的95%置信区间。
Fixed and random effects, 固定和随机描述统计量Homogeneity-of-variance,要求进行方差齐次性检验,并输出检验结果。
用“Levene lest ”检验,即计算每个观测量与其组均值之差,然后对这些差值进行一维方差分析。
Brown-Forsythe 布朗检验Welch,韦尔奇检验Means plot,即均数分布图,根据各组均数描绘出因变量的分布情况。
“Missing Values”栏中,选择缺失值处理方法。
Exclude cases analysis by analysis选项,被选择参与分析的变量含缺失值的观测量,从分析中剔除。
Exclude cases listwise选项,对含有缺失值的观测量,从所有分析中剔除。
以上选择项选择完成后,按“Continue”按钮确认选择并返回上一级对话框;单击“Cancel”按钮作废本次选择;单击“Help”按钮,显示有关的帮助信息。
本例子选择要求输出描述统计量和进行方差齐次性检验,缺失值处理方法选系统缺省设置。
6)提交执行设置完成后,在单因素方差分析窗口框中点击“OK”按钮,SPSS就会根据设置进行运算,并将结算结果输出到SPSS结果输出窗口中。
7) 结果与分析输出结果:表5-2描述统计量,给出了水稻品种分组的样本含量N、平均数Mean、标准差Std.Deviation、标准误Std.Error、95%的置信区间、最小值和最大值。
表5-3为方差齐次性检验结果,从显著性慨率看,p>0.05,说明各组的方差在a=0.05水平上没有显著性差异,即方差具有齐次性。
这个结论在选择多重比较方法时作为一个条件。
表5-4方差分析表:第1栏是方差来源,包括组间变差“Between Groups”;组内变差“Within Groups”和总变差“Total”。
第2栏是离差平方和“Sum of Squares”,组间离差平方和87.600,组内离差平方和为24.000,总离差平方和为111.600,是组间离差平方和与组内离差平方和相加之和。
第3栏是自由度df,组间自由度为4,组内自由度为10;总自由度为14。
第4栏是均方“Mean Square”,是第2栏与第3栏之比;组间均方为21.900,组内均方为2.400。
第5栏是F值9.125(组间均方与组内均方之比)。
第6栏:F值对应的概率值,针对假设H0:组间均值无显著性差异(即5种品种虫数的平均值无显著性差异)。