当前位置:文档之家› 方差分析

方差分析

方差分析
方差分析

第六章 方差分析

在上一章的假设检验中,我们研究了一个样本的平均数或比例与假设的总体均值或比例的差异是否显著的问题。我们也研究了两个样本的平均值和比例差异是否显著的问题。但是如果需要检验两个以上总体的均值是否相等,上一章所介绍的方法就不再适用了。这需要用方差分析的方法来解决。 例如:对于大学新生的入学成绩,可以通过t 检验来考察男女学生间的入学成绩是否有差异。但是想知道来自四川、江苏、上海、北京等省份的学生,其入学成绩是否有显著差异,该如何检验?

方差分析主要用来检验两个以上样本的平均值差异的显著程度,由此判断样本究竟是否抽自具有同一均值的总体。方差分析对于比较不同生产工艺或设备条件下产量、质量的差异,分析不同计划方案效果的好坏和比较不同地区、不同人员有关的数量指标差异是否显著时,是非常有用的。

单因素方差分析:解决的是一个因素(factors )之下的多个不同水平(Level )之间的关系问题。一般而言,这个因素应该是名义尺度。 一、问题的提出

例 为了比较三种不同材料对产品寿命的影响,试验人员分别对三种不同材料所制造的一组产品的寿命进行了测试,所得结果如表5-1所示 (为简化计算,以各取4个样本为例)。

表5-1:某种材料使用寿命的抽样统计表

材料种类 实验1 实验2 实验3 实验4 A 115 116 98 83 B 103 107 118 116 C 73 89 85 97

现要求根据上述试验结果,显著性水平为α的条件下,检验所选用的材料对最终产品的使用寿命的影响是否显著。从统计的角度看,就是要检验三种不同的材料所生产的最终产品的使用寿命的均值是否一致。

通常,在方差分析中,我们把对试验结果发生影响和起作用的自变量称为因素。如果方差分析研究的是一个因素对于试验结果的影响和作用,就称为单因素方差分析。在本例中,因素就是可能影响产品使用寿命的材料。因素的不同选择方案称之为因素的水平。上例中材料有三种不同的选择就说因素有三个水平。因素的水平实际上就是因素的取值或者是因素的分组。 一般地,我们假定所检验的结果受某一因素A 的影响,它可以取K 个不同的水平:1,2,3,…K 。对于因素的每一个水平i 都进行n 次试验,结果分别为X X X i i in 12,, ,我们把这一组样本记作X i ,假定()

X N i i ~,μσ2,即对于因素的每一个水平,所得到的结果都服从正态分布,且方差相等。

用统计的语言来表达,要检验的假设就是: H k 012::,μμμ===

H 1:不是所有的μi 都相等(i k =12,,...,).

方差分析的基本思路是一方面确定因素的不同水平下均值之间的方差,把它作为对由所有试验数据所组成的全部总体的方差的一个估计值。另一方面,再考虑在同一水平下不同试验数据对于这一水平的均值的方差。由此,计算出对由所有试验数据所组成的全部数据的总体方差的第二个估计值;最后,比较上述两个估计值。如果这两个方差的估计值比较接近就说明因素的不同水平下的均值间的差异并不大,就接受零假设。否则,就说明因素的不同水平下的均值间的差异比较大,就接受备择假设。

根据上述思路我们可以得到方差分析的方法和步骤。

1、提出假设 H k 012::,μμμ=== 即因素的不同水平对试验结果无显著影响,

H 1:不是所有的μi 都相等(i k =12,,...,),即因素的不同水平对试验结果有显著影响。

2、方差分解

我们先定义总离差平方和为各样本观察值与总均值的离差平方和。 记作 SST=

()

X

X

i j

j n

i k -==∑∑2

1

1

其中:X 是样本总均值,即

X =

X N

i j j n i k ==∑∑?? ??

?11

N n k =为样本观察值总数。

将总离差平方和分解为两部分: SST=

()

X

X

i j

j n

i k -==∑∑2

11

=

()

()[]

X

X X X i j

i i j n

i k

-+-==∑∑2

11

=

()

X

X i j

i

j n

i k

-==∑∑2

1

1+

()

n X

X

i

i k

?-=∑2

1

其中:X i 是第I 个样本的平均值,即 X i =

X n

i j j n =∑?? ??

?1

记 SSE=

()

X

X i j

i

j n

i k -==∑∑2

1

1

表示同一样本组内,由于随机因素影响所产生的离差平方和,简称为组内平方和。

SSR=

()

n X

X

i

i k

?-=∑2

1

表示不同的样本组之间,由于变异因素的不同水平影响所产生的离差平方和,简称为组间平方和。

由此可以得到 SST=SSR+SSE .

总离差平方和=组间平方和+组内平方和 对应于SST ,SSR 和SSE 的自由度分别为: N-1, K-1, N-K .

相应的自由度之间的关系也有: N-1=(K-1)+(N-K). 3、F 检验

将SSR 和SSE 分别除以其自由度,即得各自的均方差: 组间均方差 MSR=SSR/(K-1) 组内的均方差 MSE=SSE/(N-K ) 统计上可以证明 E(MSE)=σ2

E(MSR)=σ2

+

1

1

k -()

n i k

i

?-=∑1

2

μ

μ

由此可见,如果原假设H k 012::,μμμ=== 成立,则E(MSE)= E(MSR)=σ2

;否则 E(MSR)>σ2

根据F 分布,如果原假设H k 012::,μμμ=== 成立,那么MSR 和MSE 均是σ2

的无偏估计,因而MSR/MSE 就服从自由度为(K-1)和(N-K )的F 分布。 检验统计量 F M S R M S E

=

如上所述,当原假设H k 012::,μμμ=== 成立时,E(MSE)= E(MSR)=σ2

。此时MSR 较小,F 值也较小。反之H 0不成立时,MSR 较大,F 值也较大。对于给定的显著性水平α查F 分布表得到()F k N k 11---α,。如果()F F k N k >---11α,,则原假设不成立,即K 个组的总体均值之间有显著的差异,就拒绝H 0。若()F F k N k ≤---11α,,则原假设成立,即K 个组的总体均值之间没有显著的差异,就接受H 0。

4、方差分析表

上述方差分析的方法可以用一张标准形式的表格来实现,这种表格称为方差分析表。它将

方差分析的计算方法以简洁的形式进行总结。表格分为五列,第一列表示方差的来源,第二列表示方差的离差的平方和,第三列表示自由度,第四列为均方差,第五列为统计检验量F。表格又分为三行。第一行是组间的方差SSR和均方差MSR,表示因素的不同水平的影响所产生的方差,其值作为计算统计检验量F时的分子;第二行是组内方差SSE和均方差MSE,表示随机误差所引起的方差,其值作为计算统计检验量F的分母,第三行是检验行,表示总的方差SST。

由于方差分析表概括了方差分析的中统计量之间的关系,我们在进行方差分析时就可以直接按照方差分析表来逐行,逐列地计算出有关的统计量,最后得到检验量F的值,并把这一F 值与查表所得到的一定显著性水平下的F检验的临界值进行比较,以得出接受或拒绝原假设的结论。

单因素方差分析表

方差来源离差平方和自由度均方差统计检验量F

组间SSR K-1 MSR F MSR

MSE

组内SSE N-K MSE

总方差SST N-1

单因素方差分析的基本应用条件

1 观察对象是来自于所研究因素的各个水平之下的独立随机抽样

2 每个水平下的因变量应该服从正态分布

3 各水平下的总体具有相同的方差

双因素方差分析

前面所研究的是试验结果仅受一个因素影响的情形。要求检验的是当因素取不同水平时对结果所产生的影响是否显著。但在实践中,某种试验结果往往受到两个或两个以上因素的影响。例如,产品的合格率可能与所用的设备以及操作人员有关,企业的利润可能与市场的潜力、产品的式样和所投入的广告费用有关等等有关。如果我们研究的是两个因素的不同水平对试验结果的影响是否显著的问题就称作双因素方差分析。双因素方差分析中两个因素的影响既可能是相互联系、相互影响的,也可能是相互独立的。因此,在分析的方法和步骤上要比单因素时来得复杂一些。

双因素方差分析的基本思想与单因素方差分析基本相同。首先分别计算出总变差、各个因素的变差以及随机误差的变差。其次根据各变差相应的自由度求出均方差,最后计算出F值并作F检验。

双因素方差分析根据两个因素相互之间是否有交互影响而分为无交互影响的和有交互影响的两种情形。我们首先研究两因素无交互影响时的情形。

一、无交互影响的双因素方差分析

如果某一试验结果受到A和B两个因素的影响。这两个因素分别可取K和M个水

平,则双因素方差分析实际上就是要比较因素A的K个水平的均值之间是否存在显著

差异,因素B的M个水平的均值之间是否存在显著差异。目的是要检验试验中这两个

因素所起的作用有多大,是仅仅一个因素在起作用,还是两个因素起作用或者是两个

因素的作用都不显著。

在假定两个因素无交互影响的情形,通常采用不重复试验,即对于两个因素每一

种水平的组合只进行一次试验,这样总共就进行K*M次试验

由此可见,方差分析是研究一个或多个可分组的变量(称为自变量)与一个连续变量(因变量)之间的统计关系,并测定自变量在取各种不同水平时对因变量的影响和作用的一种统计分析方法。方差分析通过比较和检验在因素的不同水平下均值之间是否存在显著的统计差异的方法来测定因素的不同水平对因变量的影响和作用的差异。

二、有交互作用的两因素方差分析

前面假定因素A与因素B之间相互独立,不存在相互影响,但有时两个因素会产生交互作用,从而使因素A的某些水平与因素B的另一些水平相结合时对结果产生更大的影响。

对于有交互作用的两因素之间方差分析的步骤几乎与前一种情形一样,不同的是当两因素之间存在交互作用时情形,先要剔除交互作用的影响,因此比较复杂。同时在有交互作用的影响时对于每一种试验条件要进行多次重复试验以便将因素间交互作用的平方和从误差平方和中分离出来。由于重复试验数据量就大大增加了。

有交互作用的两因素方差分析的方法和步骤同前面一样,关键是对总离差平方和进行分解时必须考虑两因素的交互作用。

方差分析主要用于:1、均数差别的显著性检验,2、分离各有关因素并估计其对总变异

的作用,3、分析因素间的交互作用,4、方差齐性检验。

第一节单因素方差模型

5.4.1 主要功能

在实际研究中,经常需要比较两组以上样本均数的差别,这时不能使用t检验方法作两

两间的比较(如有人对四组均数的比较,作6次两两间的t检验),这势必增加两类错误的

可能性(如原先α定为0.05,这样作多次的t检验将使最终推断时的α>0.05)。故对于两

组以上的均数比较,必须使用方差分析的方法,当然方差分析方法亦适用于两组均数的比较。方差分析可调用此过程可完成。

本过程只能进行单因素方差分析,即完全随机设计资料的方差分析。

使用该功能,可以进行单因素方差分析、均值多重比较和相对比较

方差分析的假设检验:

零假设H0:m组样本均值都相同,即μ1= μ2=....= μm

如果经过计算结果组间均方远远大于组内均方(MS b>>MS w),F>F0.05(dfb,dfw),

p<0.05,拒绝零假设,说明样本来自不同的正态总体,说明处理造成均值的差异有统计意义;否则, F0.05不能拒绝零假设,说明样本来自相同的正态总体,处理间无差异。

单因素方差分析的SPSS操作详解

(1)打开主菜单

选择主菜单中的【Analyze】→【Compare Means】→【One-Way ANOV A】命令,弹出【One-Way ANOV A】对话框,如图5-1所示,这是单因素方差分析的主操作窗口。

图5-1 【One-Sample T Test】对话框

(2)选择因变量

在【One-Way ANOV A】对话框的候选变量中选择一个或几个变量将其添加至【Dependent List】列表框中,选择的变量就是要进行方差分析的观测变量(因变量)。

(3)选择因素变量

在【One-Way ANOV A】对话框的候选变量中选择一个变量将其添加至【Factor】列表框中,选择的变量就是要进行方差分析的因素变量。

(4)均值精细比较

单击5-2所示的【Contrasts】对话框,该对话框用于设置均值的精细比较。例如图5-2中显示的是要求计算“mean1+mean2-mean3-mean4”的值,检验的零假设H0:第一组均值与第二组的均值之和等于第三组均值与第四组的均值之和。均值线性组合中的组合系数需要由读者自己根据研究的需要输入。具体的操作步骤如下:

①勾选【Polynomial】复选项,该操作激活其右面的【Degree】参数框。

②单击【Degree】参数框右面的向下箭头展开其下拉菜单,可以选择“Linear”(线性多项式)、“Quadratic”(二次多项式)、“Cubic”(三次多项式)、“4th”(四次多项式)和“5th”(五次多项式)。

③指定各组均值的组合系数。方法是在【Coefficients】文本框中输入一个系数,单击Add按钮,则输入的系数进入下面的文本框中。依次输入各组均值的组合系数,在文本框中形成一列数值。如果多项式中只包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为0值。如果只包括第一组与第二组的均值,则只需要输入前两个系数,第三、四个系数可以不输入。

可以同时建立多个多项式。一个多项式的一组系数输入结束,激活

按钮后【Coefficients】文本框中清空,准备接受下一组系数数据。

④单击【Previous】或【Next】按钮显示输入的各组系数检查无误后,单击

按钮确认输入的系数并返回到主对话框。

图5-2 【One-Way ANOV A:Contrasts】对话框

(5)均值多重比较

5-3所示的【Post Hoc Multiple Comparisons】对话框,该对话框用于设置均值的多重比较检验。此对话框提供了多种多重比较检验的方法。

图5-3 【One-Way ANOV A:Post Hoc Multiple Comparisons】对话框

①方差齐性时(Equal Variances Assumed),该复选框中有如下方法供选择:

● LSD(Least-significant difference):最小显著差数法,用t检验完成各组均值间的配对比较。对多重比较误差率不进行调整。

●Bonferroni(LSDMOD):用t检验完成各组间均值的配对比较,但通过设置每个检验的误差率来控制整个误差率。

●Sidak:计算t统计量进行多重配对比较。可以调整显著性水平,比Bofferroni方法的界限要小。

● Scheffe:用F分布对所有可能的组合进行同时进入的配对比较。此法可用于检查组均值的所有线性组合,但不是公正的配对比较。

● R-E-G-W F:基于F检验的Ryan-Einot-Gabriel-Welsch多重比较检验。

●R-E-G-W Q:基于Student Range分布的Ryan-Einot-Gabriel-Welsch range test多重配对比较。

● S-N-K:用Student Range分布进行所有各组均值间的配对比较。

● Tukey:用Student-Range统计量进行所有组间均值的配对比较,用所有配对比较

误差率作为实验误差率。

● Tukey's-b:用stndent Range分布进行组间均值的配对比较,其精确值为前两种检验相应值的平均值。

●Duncan:指定一系列的Range值,逐步进行计算比较得出结论。

● Hochberg's GT2:用正态最大系数进行多重比较。

● Gabriel:用正态标准系数进行配对比较,在单元数较大时,这种方法较自由。

●Waller-Dunca:用t统计量进行多重比较检验,使用贝叶斯逼近的多重比较检验法。

● Dunnett:多重配对比较的t检验法,用于一组处理对一个控制类均值的比较。默认的控制类是最后一组。

选择了Dunnett项时,就激活下面的【Test】参数框。展开下拉列表,可以重新选择对照组。【Test】框中列出了三种区间分别为:“2-sides”双边检验;“Conbo1”“右边检验。

②方差不具有齐性时(Equal Varance not assumed),该复选框中有如下方法供选择:

● Tamhane's T2:基于t检验进行配对比较。

●Dunnett's T3:基于Student最大模的成对比较法。

● Games-Howell:Games-Howell比较,该方法较灵活。

●Dunnett's C:基于Student极值的成对比较法。

③Significance 选择项,确定各种检验的显著性水平,系统默认值为0.05,可由用户重新设定。

(6)其他选项输出

5-4所示的【Options】对话框,该对话框可以选择要求输出的统计量,同时还可以选择对缺失值的处理要求。各组选择项的含义如下:

①【Statistics】复选框中选择输出统计量:

●Descriptive:要求输出描述统计量。选择此项输出观测值容量、均值、标准差、标准误、最小值、最大值、各组中每个因变量的95%置信区间。

● Fixed and random effects:显示固定和随机描述统计量。

●Homogeneity-of-variance:计算Levene统计量进行方差齐性检验。

●Brown-Forsythe:计算检验组均值相等假设的布朗检验。在方差齐性假设不成立时,这个统计量比F统计量更优越。

●Welch:计算检验组均值相等假设的Welch统计量,在不具备方差齐性假设时,也是一个比F统计量更优越的统计量。

②Means plot:均值折线图。根据各组均值变化描绘出因变量的分布情况。

③【Missing Values】复选项提供缺失值处理方法,该选项和均值比较过程中缺失值选项意义相同。

图5-4 【One-Way ANOV A :Options 】对话框

(7)单击

SPSS 软件自动输出结果。

5.4.2 实例操作

[例5.4]某单位研究两种不同制剂治疗钩虫的效果,用大白鼠作试验。11只大白鼠随机分配于3组:一组为对照组、另外二组分别为使用甲、乙制剂的实验组。试验方法是:用药前每鼠人工感染500条钩蚴,感染后第8天实验组分别给予甲、乙制剂,对照组不给药,第10天全部解剖检查鼠体内活虫数,结果如下,问两制剂是否有效?

5.4.2.1 数据准备

激活数据管理窗口,定义变量名:实际观察值定义为x ,组别用变量range 表示:其中对照组的值为、甲制剂实验组的值为、乙制剂实验组的值为,输入后的结果如图5.7所示。

图5.7 单因素方差分析的原始数据

5.4.2.2 统计分析

激活Statistics菜单选Compare Means中的One-Way ANOV A...项,弹出One-Way ANOV A 对话框(如图5.8示)。从对话框左侧的变量列表中选x,点击 钮使之进入Dependent List 框,选range 点击 钮使之进入Factor框,点确定

图5.8 One-Way ANOVA 对话框

5.4.2.3 结果解释

在结果输出窗口中将看到如下统计数据:

上述结果显示组间、组内(实际上本例应称之为“剩余”)和合计的自由度(D.F.)、离均差平方和(Sum of Squares,即SS)、均方(Means Squares,即SS)、F值(F Ratio)和P 值(F Prob.),本例F=12.680,P=0.003,表明有显著性差异,甲、乙两种制剂中必有一种制剂治疗钩虫是有效的。

方差分析表只能说明各组之间存在差异,但并不能说明各组之间的关系。需要利用多重比较初步分析各组之间的关系。

下面分析“均数间的多重比较”

目的:例如上例,还要知道三者之间究竟存在那些差异

增加选项:

其中:LSD方法:最小显著差法,是最简单的比较方法之一。它其实是t检验的一个简单变形,并未对检验水准做出任何校正,只是在标准误的计算上充分利用了样本信息,为所有组的均数统一估计除了一个更为稳健的标准误,因此它一般用于计划好的多重比较。

增加结果:

由于这些多重比较方法都需要有一个对照组,分析结果中就将所有组依次作为对照组,让其余组和它进行比较。表格打*表示均数差别有统计学意义。

练习:

比较四种饲料对猪体重增加的作用有无不同:data09-01

第二节单因变量两因素方差模型

6.1.1 主要功能

调用此过程可对资料进行方差分析或协方差分析。在方差分析中可按用户需要作单因素方差分析或多因素方差分析;当观察因素中存在有很难或无法人为控制的因素时,则可对之加以指定以便进行协方差分析。我们在这里只是讲解其中一种功能。

1、概述

是对一个独立变量是否受多个因素或变量影响而进行的方差分析。

SPSS调用UNIANOVA过程,检验不同水平组合之间因(分析)变量均值由于受不同因素影响是否有差异的问题。

UNIANOVA过程可以分析每一个因素的作用(主效应),也可以分析因素之间的交互作用(交互效应)。可以进行协方差分析,以及各因素变量与协变量之间的交互作用。

UNIANOVA过程要求因变量是从多元正态总体随机采样得来,且总体中各单元的方差相同,也可以通过方差齐次性检验选择均值比较结果。

因变量和协变量必须是数值型变量,协变量与因变量彼此不独立。因素变量是分类变量,可以是数值型和字符型。

固定因素变量(Fixed Factor)是反应处理的因素。随机因素是随机设置的因素,是在确定模型时需要考虑会对实验有影响的因素,对实验结果影响的大小可以通过方差成分分析确定。

2、关于模型:GLM Univariate功能很强,可以建立包括各种主效应、交互效应的模型。必须认真分析因素变量的具体情况,来确定自己的模型,否则会产生不可解释的输出结果。

菜单:Analyze->General Linear Model-> Univariate

选项:

?选择分析模型Model:

?默认全模型Full Factorial:包括所有因素变量的主效应、所有协

变量的主效应、所有因素与因素的交互效应,不包括协变量与其他

因素的交互效应。

?自定义模型Custom:主效应(Main effects及其因素变量)、交互

变量(有交互效应维数之分)

?选择分解平方和的方法(默认为TYPE III)

?Include Intercept in model:系统默认截距包括在回归模型中。

?选择对照方法Contrasts

?选择分布图形Plots

?选择多重比较分析Post Hoc

?保存运算结果的选择项Save

?选择输出项Options

多因素方差分析的SPSS操作详解

SPSS调用“Univariate”过程来实现多因素方差分析。在这个过程中可以分析每一个因素的作用,也可以分析因素之间的交互作用,以及分析协方差,以及各因素变量与协变量之间的交互作用。该过程要求因变量来自多元正态总体,且总体中各单元的方差相同。

(1)打开主对话框

选择主菜单中的【Analyze】→【General Linear Model】→【Univariate】命令,弹出【Univariate】对话框,如图5-6所示,这是多因素方差分析的主操作窗口。

图5-6 【Univariate】对话框

(2)选择分析变量

在【Univariate】对话框的候选变量中,选择相应变量进行右侧的列表框中,其目的是设置分析变量。

●选择观测变量(因变量):添加至【Dependent Variable】列表框中;

●选择因素变量:添加至【Fixed Variable(s)】列表框中;

●选择随机变量:添加至【Random Variable(s)】列表框中;

●选择协变量:添加至【Covariate(s)】列表框中;

●选择权重变量:添加至【WLS Weight】列表框中。

(3)模型选择

单击5-7所示的【Model】对话框,该对话框用于选择分析模型的。

图5-7 【Univariate:Model】对话框

①Full Factorial选项

系统默认选项。该项选择建立全因素模型,包括所有因素变量的主效应和所有的交互效应。例如有三个因素变量,全模型包括三个因素变量的主效应、两两的交互效应和三个

因素的交互效应。选择该项后无需进行进一步的操作,即可单击

框。

②Custom选项

建立用户自定义的方差分析模型。点择了【Custom】后,原被屏蔽的【Factors & Covariates】、【Model】和【Build Term(s)】栏被激活。在【Factors & Covariates】列表框中自动列出可以作为因素变量的变量名。

在【Build Term(s)】栏中的下拉按钮中,可以选择模型的形式:

●Interaction:选中此项可以指定任意的交互效应;

●Main effects:选中此项可以指定主效应;

●All 2-way:指定所有2维交互效应;

●All 3-way:指定所有3维交互效应;

●All 4-way:指定所有4维交互效应

●All 5-way:指定所有5维交互效应。

图5-6中【Sum of squares】用于指定平方和的分解方式。

●Type I项:一般适用于平衡的ANOV A模型。

●Type II项:一般适用于平衡的ANOV A模型、主因子效应模型、回归模型和嵌套设计。

●Type III项:系统默认的平方和分解法。适用于平衡的ANOV A模型和非平衡的ANOV A模型。凡适用Type I和Type II的模型均可以用该法。

●Type IV顶:一般适用于Type I和Type lI方法的模型、有缺失值的平衡或不平衡模型。

③【Include intercept in model】复选项

系统默认选项。通常截距包括在模型中。如果能假设数据通过原点,可以不包括截距,即不选择此项。

(4)选择比较方法

5-8所示的【Contrasts】对话框。在【Factors】列表框中显示出所有在主对话框中选中的因素变量。因素变量名后的括号中是当前的比较方法。在该

框中选择想要改变比较方法的因子,即鼠标单击选中的因子。这一操作使【Change Contrast】复选栏中的各项被激活。

图5-8 【Univariate:Contrasts】对话框

展开【Contrast】参数框的下拉菜单,可得各类比较方法:

●None:不进行均数比较。

●Deviation:偏差比较法。除被忽略的水平外,比较预测变量或因素变量的每个水平的效应。可以点选【Last】(最后一个水平)或【First】(第一个水平)作为忽略的水平。

●Simple:简单比较法。除去作为参考的水平外,对预测变量或因素变量的每一水平都与参考水平进行比较。选择【Last】或【First】作为参考水平。

●Difference:差值比较法。对预测变量或因素每一水平的效应,除第一水平以外,都与其前面各水平的平均效应进行比较。与Helmert比较法相反。

●Helmert:Helmert法。对预测变量或因素的效应,除最后一个水平以外,都与后面的各水平的平均效应相比较。

●Repeated:重复比较法。对预测变量或因素的效应,除第一水平以外,对每一水平都与它前面的水平进行比较。

●Polynomial:多项式比较。比较线性、二次、三次等效应,常用于估计多项式趋势。

(5)选择轮廓图

5-9所示的【Profile Plots】对话框。在该对话框中设置均值轮廓图。

均值轮廓图用于比较边际均值。轮廓图是一种线图,图中每个点表明因变量在因素变量每个水平上的边际均值的估计值。如果指定了协变量,该均值则是经过协变量调整的均值。做单因素方差分析时时,轮廓图表明该因素各水平的因变量均值。而双因素方差分析时,指定一个因素做横轴变量,另一个因素变量的每个水平产生不同的线。如果是三因素方差分析,可以指定第三个因素变量,该因素每个水平产生一个轮廓图。双因素或多因素轮廓图中的相互平行的线表明在因素间无交互效应;不平行的线表明有交互效应。

从【Factors】列表框中选择一个因素变量移入【Horlzontal Axis】框(水平轴)定义轮廓图的横坐标。选择另一个因素变量移入【Separate Lines】框定义轮廓图的区分线。如果需要的话再从【Factors】框中选择一个因素变量移入【Separate Plots】框定义轮廓图的区分图

以上选择确定以后,单击需要对加入图清单框的选择结果进行修正,

可单击

图5-9 【Univariate:Profile Plots】对话框

(6)选择多重比较

弹出如图5-10所示的【Post Hoc Multiple Comparisons for Observed Means】对话框。该对话框用于对均值作Post Hoc多重比较检验。从【Factor(s)】框选择相关变量使被选变量进入【Post Hoc test for】框。不难发现,这个对话框与单因素方差分析模型的Post Hoc多重比较检验对话框(图5-3)大致相同,各选项意义也一致。

图5-10 【Univariate:Post Hoc】对话框

(7)预测值保存

单击5-11所示的【Save】对话框。通过在对话框中的选择,可以将所计算的预测值、残差和检测值作为新的变量保存在编辑数据文件中。以便于在其他统计分析中使用这些值。

①Predicted V alues 预测值

●Unstsndardized:非标准化预测值。

●Weighted:加权预测值。如果在主对话框中选择了WLS变量,选中该复选项,将保存加权非标准化预测值。

●Standard error:预测值标准误。

②Diagnostics 诊断值

●Cook’s distance:Cook 距离。

●Leverage values:非中心化Leverage 值。

③Residuals 残差

●Unstsndardized:非标准化残差值,即观测值与预测值之差。

●Weighted:加权非标准化残差。如果在主对话框中选择了WLS变量,选中该复选项,将保存加权非标准化残差。

●Standardized:标准化残差,又称Pearson残差。

●Studentized:学生氏残差。

●Deleted:剔除自变量值与校正预测值之差。

最后可以选中【Coefficient statistics】复选项,将参数协方差矩阵保存到一个新文件中。

单击

图5-11 【Univariate:Save】对话框

(8)其他选项选择

5-12所示的【Options】对话框。各选项含义如下。

①【Estimated Marginal Means 】估测边际均值设置

在【Factor(s) and Factor Interactions】框中列出【Model】对话框中指定的效应项,在该框中选定因素变量的各种效应项。可以将其移入到【Display Means for】框中。

在【Display Means for】框中有主效应时,点选激活此框下面的【Compare main effects】复选项,对主效应的边际均值进行组间的配对比较。

在【Confidence interval adjustment】参数框中,可以进行多重组间比较。打开下拉菜单,共有三个选项:LSD(none)、Bonferroni和Sidak方法。

②在【Display】列表栏中指定要求输出的统计量

● Descriptive statistics:输出描述统计量。

● Estimates of effect size:效应量的估计。

● Observed power:功效检验或势检验。

●Parameter estimates:各因素变量的模型参数估计、标准误、t检验的t值、显著性概率和95%的置信区间。

● Contrast coefficient matrix:显示对照系数矩阵。

● Homogeneity test:方差齐次性检验。

● Spread vs.level plot:绘制观测量均值对标准差和方差的图形。

●Residual plot:绘制因变量的观察值对于预测值和标准化残差的散点图。

●Lack of fit:拟合度不足检验。检查独立变量和非独立变量间的关系是否被充分描述。

● General estimable function:可以根据一般估计函数自定义假设检验。

③【Significance level 】文本框设置:改变【Confidence intervals】框内多重比较的显著性水平。

图5-12 【Univariate:Options】对话框

(9SPSS软件自动输出结果。

例子:现希望考察对超市中销售的某种商品而言,是否会受到货架上摆放位置的影响,甚或两者是否会存在交互作用。现按照超市的大小(三水平)、摆放位置(四水平)各随机选

本例中关心的变量是销售量,有两个影响因素:超市规模和货物摆放位置。采用方差分析模型,相应的模型表达式为:

ijk i j ij ijk Y μαβγε=++++

其中,i j αβ分别表示超市规模i 水平和货物摆放位置j 水平的附加效应。而ij γ为两者的交互作用项。

数据见twoway.sav

第一行的Corrected Model 是对所用方差分析模型的检验,其原假设为模型中所用的影

响因素均无作用,即超市规模、摆放位置等对销售都无影响。该检验p 值远小于0.05,因此所用模型有统计学意义。

spss实验报告---方差分析

实验报告 ——(方差分析) 一、实验目的 熟练使用SPSS软件进行方差分析。学会通过方差分析分析不同水平的控制变量是否对结果产生显著影响。 二、实验内容 1、某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,问三组石棉矿工的用力肺活量有无差别?(自建数据集) 石棉肺患者可疑患者非患者 1.8 2.3 2.9 1.4 2.1 3.2 1.5 2.1 2.7 2.1 2.1 2.8 1.9 2.6 2.7 1.7 2.5 3.0 1.8 2.3 3.4 1.9 2.4 3.0 1.8 2.4 3.4 1.8 3.3 2.0 3.5 SPSS计算结果: 在建立数据集时定义group1为石棉肺患者,group2为可疑患者,group3为非患者。 零假设:各水平下总体方差没有显著差异。 相伴概率为0.075,大于0.05,可以认为各个组的方差是相等的,可以进行方差检验。

从上表可以看出3个组之间的相伴概率都小于显著性水平0.05,拒绝零假设,说明3个组之间都存在显著差别。 2、某汽车经销商在不同城市进行调查汽车的销售量数据分析工作,每个城市分别处于不同的区域:东部、西部和中部,而且汽车经销商在不同城市投放不同类型的广告,调查数据放置于附件中数据文件“汽车销量调查.sav”。 (1)试分析不同区域与不同广告类型是否对汽车的销量产生显著性的影响?(2)如果考虑到不同城市人均收入具有差异度时,再思考不同区域和不同广告类型对汽车销量产生的影响差异是否改变,这说明什么问题? SPSS计算结果: (1)此为多因素方差分析 相伴概率为0.054大于0.05,可以认为各个组总体方差相等可以进行方差检验。

方差分析习题与答案

统计学方差分析练习题与答案一、单项选择题 1.在方差分析中,()反映的是样本数据与其组平均值的差异 A 总离差 B 组间误差 C 抽样误差 D 组内误差 2.是() A 组内平方和 B 组间平方和 C 总离差平方和 D 因素B的离差平方和 3.是() A 组内平方和 B 组间平方和 C 总离差平方和 D 总方差 4.单因素方差分析中,计算F统计量,其分子与分母的自由度各为() A r,n B r-n,n-r C r-1.n-r D n-r,r-1 二、多项选择题 1.应用方差分析的前提条件是() A 各个总体报从正态分布 B 各个总体均值相等 C 各个总体具有相同的方差 D 各个总体均值不等 E 各个总体相互独立 2.若检验统计量F= 近似等于1,说明() A 组间方差中不包含系统因素的影响 B 组内方差中不包含系统因素的影响 C 组间方差中包含系统因素的影响 D 方差分析中应拒绝原假设 E方差分析中应接受原假设 3.对于单因素方差分析的组内误差,下面哪种说法是对的?() A 其自由度为r-1 B 反映的是随机因素的影响 C 反映的是随机因素和系统因素的影响 D 组内误差一定小于组间误差 E 其自由度为n-r 4.为研究溶液温度对液体植物的影响,将水温控制在三个水平上,则称这种方差分析是() A 单因素方差分析 B 双因素方差分析 C 三因素方差分析 D 单因素三水平方差分析 E 双因素三水平方差分析 三、填空题 1.方差分析的目的是检验因变量y与自变量x是否,而实现这个目的的手段是通过

的比较。 2.总变差平方和、组间变差平方和、组内变差平方和三者之间的关系是。3.方差分析中的因变量是,自变量可以是,也可以是。4.方差分析是通过对组间均值变异的分析研究判断多个是否相等的一种统计方法。 5.在试验设计中,把要考虑的那些可以控制的条件称为,把因素变化的多个等级状态称为。 6.在单因子方差分析中,计算F统计量的分子是方差,分母是方差。 7.在单因子方差分析中,分子的自由度是,分母的自由度是。 四、计算题 1.有三台机器生产规格相同的铝合金薄板,为检验三台机器生产薄板的厚度是否相同,随机从每台机器生产的薄板中各抽取了5个样品,测得结果如下: 机器1:0.236,0.238,0.248,0.245,0.243 机器2:0.257,0.253,0.255,0.254,0.261 机器3:0.258,0.264,0.259,0.267,0.262 问:三台机器生产薄板的厚度是否有显著差异? 2.养鸡场要检验四种饲料配方对小鸡增重是否相同,用每一种饲料分别喂养了6只同一品种同时孵出的小鸡,共饲养了8周,每只鸡增重数据如下:(克) 配方:370,420,450,490,500,450 配方:490,380,400,390,500,410 配方:330,340,400,380,470,360 配方:410,480,400,420,380,410 问:四种不同配方的饲料对小鸡增重是否相同? 3.今有某种型号的电池三批,它们分别为一厂、二厂、三厂三个工厂所生产的。为评比其质量,各随机抽取5只电池为样品,经试验测得其寿命(小时)如下: 一厂:40,48,38,42,45 二厂:26,34,30,28,32 三厂:39,40,43,50,50 试在显著性水平下检验电池的平均寿命有无显著的差异。 4.一个年级有三个小班,他们进行了一次数学考试。现从各个班级随机抽取了一些学生,记录其成绩如下: 1班:73,89,82,43,80,73,66,60,45,93,36,77 2班:88,78,48,91,51,85,74,56,77,31,78,62,76,96,80 3班:68,79,56,91,71,71,87,41,59,68,53,79,15

方差分析简介

方差分析简介(一) 方差分析是我们从心理统计这门课就提到一个基本的统计方法。但或许很多人到做研究生毕业论文的时候,还没搞清楚到底方差分析是怎么一回事。我们的老师对很多基本的地方也是含糊不清。我就我几年学习和应用的理解,粗略讲一下方差分析是怎么回事。 什么是方差分析?就是对方差的分析。有人说你这不废话么?这还真不是废话。t检验就不是对方差的分析。独立样本t检验是对两个样本均值的差异进行检验,而相关样本t检验是对两个样本差异的均值进行检验。而方差分析就是对引起样本数据出现差异的若干因素影响孰强孰弱的分析。换句话说,当样本数据差异较小的时候,t检验会认为不存在差异,但方差分析可以从这较小的差异中分析出实验处理和随机误差谁对这个差异贡献更大。所以说在控制水平一定的情况下,方差分析更容易得到显著性水平高,但power较低的结果。(因为虽然差异贡献大,但本身差异不大。翻译为人话就是这个研究结果虽然显著但没什么意义。) 既然是对方差的分析,那么研究者对数据就有一定的要求。不是什么样的数据都适合做方差分析。这其中最重要最重要的,违反了就无从可谈的就是至少要等距数据(interval data)。因为至少等距数据才能做参数检验。称名数据(nominal data)和顺序数据(ordinal data)只能做非参数检验。既然要分析方差,就得有均值,有方差。 第二重要的是要正态分布的数据。为什么要强调数据正态分布呢?这要从平均数说起,平均数,从定义上来说,是一组数据中唯一对其离均差之和为0的数值。如果数据呈正态分布,平均数就是一组数据中最具有代表性的那个值。好比说一次考试全班的平均分为81.6分,我们大概可以知道有两个事实:1)多数同学考试分数是七八十分,2)如果你高于82分说明你考的还算不错,低于81分就说明考得不够理想。这个高低差距越大,这个结论的信心就越强。这两个结论是基于考试分数是基本上的正态分布推断出来的。如果不是正态分布怎么样呢?拿工资说话,以我所在的圣安东尼奥市为例,这个城市适合工作年龄的人,大约有55%的“蓝领”,30%的“白领”,14%学生或自由职业者,和1%的绝对高收入者。这个差别有多大呢?“蓝领”的税后工资大约是年收入25,000~45,000,白领大约是50,000~80,000,而超高收入者,例如蒂姆邓肯同学,他的税后收入大约是20,000,000。如果算个平均数,统计局说圣安东尼奥市人民平均收入高达50,000,大家过着幸福美满的生活。那55%的蓝领和14%的学生肯定想抽这个发

SPSS学习系列2方差分析报告

22. 方差分析 一、方差分析原理 1. 方差分析概述 方差分析可用来研究多个分组的均值有无差异,其中分组是按影响因素的不同水平值组合进行划分的。 方差分析是对总变异进行分析。看总变异是由哪些部分组成的,这些部分间的关系如何。 方差分析,是用来检验两个或两个以上均值间差别显著性(影响观察结果的因素:原因变量(列变量)的个数大于2,或分组变量(行变量)的个数大于1)。一元时常用F检验(也称一元方差分析),多元时用多元方差分析(最常用Wilks’∧检验)。 方差分析可用于: (1)完全随机设计(单因素)、随机区组设计(双因素)、析因设计、拉丁方设计和正交设计等资料; (2)可对两因素间交互作用差异进行显著性检验; (3)进行方差齐性检验。 要比较几组均值时,理论上抽得的几个样本,都假定来自正态总体,且有一个相同的方差,仅仅均值可以不相同。还需假定每一个观察值都由若干部分累加而成,也即总的效果可分成若干部分,而每一部分都有一个特定的含义,称之谓效应的可加性。所谓的方差是离均差平方和除以自由度,在方差分析中常简称为均方(Mean Square)。

2. 基本思想 基本思想是,将所有测量值上的总变异按照其变异的来源分解为多个部份,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。 根据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都与某一种效应相对应,总自由度也被分成相应的各个部分,各部分的离均差平方除以各自的自由度得出各部分的均方,然后列出方差分析表算出F检验值,作出统计推断。 方差分析的关键是总离均差平方和的分解,分解越细致,各部分的含义就越明确,对各种效应的作用就越了解,统计推断就越准确。 效应项与试验设计或统计分析的目的有关,一般有:主效应(包括各种因素),交互影响项(因素间的多级交互影响),协变量(来自回归的变异项),等等。 当分析和确定了各个效应项S后,根据原始观察资料可计算出各个离均差平方和SS,再根据相应的自由度df,由公式MS=SS/df,求出均方MS,最后由相应的均方,求出各个变异项的F值,F值实际上是两个均方之比值,通常情况下,分母的均方是误差项的均方。

生物统计学答案 第八章 单因素方差分析

第八章单因素方差分析 8.1黄花蒿中所含的青蒿素是当前抗疟首选药物,研究不同播期对黄花蒿种子产量的影响,试验采用完全随机化设计,得到以下结果(kg/小区)[47]: 重复2月19日3月9 3月28日4月13日 日 1 0.26 0.14 0.1 2 0.03 2 0.49 0.24 0.11 0.02 3 0.36 0.21 0.15 0.04 对上述结果做方差分析。 答:所用程序及结果如下: options linesize=76 nodate; data mugwort; do date=1 to 4; do repetit=1 to 3; input yield @@; output; end; end; cards; 0.26 0.49 0.36 0.14 0.24 0.21 0.12 0.11 0.15 0.03 0.02 0.04 ; run; proc anova; class date; model yield=date; means date/duncan; run; One-Way ANOVA Analysis of Variance Procedure Class Level Information Class Levels Values DATE 4 1 2 3 4 Number of observations in data set = 12 One-Way ANOVA Analysis of Variance Procedure Dependent Variable: YIELD Sum of Mean Source DF Squares Square F Value Pr > F Model 3 0.18515833 0.06171944 14.99 0.0012 Error 8 0.03293333 0.00411667 Corrected Total 11 0.21809167

SPSS——单因素方差分析详解

SPSS——单因素方差分析 来源:李大伟的日志 单因素方差分析 单因素方差分析也称作一维方差分析。它检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。还可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析,即进行均值的多重比较。One-Way ANOVA过程要求因变量属于正态分布总体。如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程。如果几个因变量之间彼此不独立,应该用Repeated Measure 过程。 [例子] 调查不同水稻品种百丛中稻纵卷叶螟幼虫的数量,数据如表1-1所示。 表1-1 不同水稻品种百丛中稻纵卷叶螟幼虫数 数据保存在“data1.sav”文件中,变量格式如图1-1。 图1-1 分析水稻品种对稻纵卷叶螟幼虫抗虫性是否存在显著性差异。

1)准备分析数据 在数据编辑窗口中输入数据。建立因变量“幼虫”和因素水平变量“品种”,然后输入对应的数值,如图1-1所示。或者打开已存在的数据文件“data1.sav”。 2)启动分析过程 点击主菜单“Analyze”项,在下拉菜单中点击“Compare Means”项,在右拉式菜单中点击“0ne-Way ANOVA”项,系统 打开单因素方差分析设置窗口如图1-2。 图1-2 单因素方差分析窗口 3)设置分析变量 因变量:选择一个或多个因子变量进入“Dependent List”框中。本例选择“幼虫”。 因素变量:选择一个因素变量进入“Factor”框中。本例选择“品种”。 4)设置多项式比较 单击“Contrasts”按钮,将打开如图1-3所示的对话框。该对话框用于设置均值的多项式比较。

应用统计学习题:方差分析

第五章方差分析 序号:5-004 题型:名词解释题 章节:方差分析 题目:方差分析的任务 答案:①求参数μ、μj 、α 1、α 2 ……αm的估计值(参数估计) ②分析观测值的偏差 ③检验各水平效应α 1、α 2 ……αm(等价μ 1 、μ 2 ……μm)有无显著差异 难度:高 评分标准:每题2分,少一条扣去1分。 序号:5-002 题型: 判断题 章节:方差分析 题目:方差分析是一种比较总体方差差异的统计方法。() 答案:错误 难度:中 评分标准:1分 序号:5-003 题型:综合题 章节:方差分析 题目:设有三个车间以不同的工艺生产同一种产品,为考察不同工艺对产品产量的影响,现对每个车间各纪录5天的日产量,如表所示,问三个车间的日产量是否有显著差异? (取α=0.05)。 将最终的计算结果填入下表:

F >)12,2(05.0F 存在显著差异。 解:(1)计算各水平均值和总平均值,465 46 484745441=++++= X , 同理46,5232==X X ,483 46 5246=++=X (2’分) (2)计算总离差平方和S T ,组内平方和S E ,组间平方和S A 。 S T =(44-48)2+(46-48)2+……(45-48)2=172 (1’分) S A =Σ120)4846(5)4852(5)4846(5)(2222j =-+-?+-=-X X (1’分) S E =S T -S A =172-120=52(1’分) (3)计算方差 MS A = 601 3120 =- MS E = 33.43 1552 =-(1’分) (4)作F 检验 85.1333 .460 === E A MS MS F (1’分) 89.3)21,2(),1(05.02==--F m n m F (1’分) 难度:中 评分标准: 每题8分 序号:5-004 题型:综合题 章节:方差分析 题目: 有重复双因素方差分析,A 因素有3个水平,B 因素有3个水平,在A i 、B j 所有可能组合条件下,重复观测2次。试用观测值X ijk 、均值??i X 、??j X ……, i =1、2……n , j =1、2……m , k =1、2…… l 制表。并指定Excel 单元格对应。 有重复双因素方差分析数据表

SPSS处理多元方差分析报告例子

实验三多元方差分析 一、实验目的 用多元方差分析说明民族和城乡对人均收入和文化程度的影响。 二、实验要求 调查24个社区,得到民族与城乡有关数据如下表所示,其中人均收入为年 均,单位百元。文化程度指15岁以上小学毕业文化程度者所占百分比。试依此 数据通过方差分析说明民族和城乡对人均收入和文化程度的影响。 三、实验内容 1.依次点击“分析”---- “常规线性模型”----“多变量”,将“人均收入”和“文化程 度”加到“因变量”中,将“民族”和“居民”加到“固定因子”中,如下图一所示。 民族农村城市 人均收入文化程度人均收入文化程度 1 46,50,60,68 70,78,90,93 52,58,72,75 82,85,96,98 2 52,53,63,71 71,75,86,88 59,60,73,77 76,82,92,93 3 54,57,68,69 65,70,77,81 63,64,76,78 71,76,86,90

【图一】 2.点击“选项”,将“输出”中的相关选项选中,如下图二所示: 【图二】 3.点击“继续”,“确定”得到如下表一的输出:

【表一】 常规线性模型 主体间因子 值标签N 民族 1.00 1 8 2.00 2 8 3.00 3 8 居民 1.00 农村12 2.00 城市12 描述性统计量 民族居民均值标准差N 人均收入1 农村56.0000 9.93311 4 城市64.2500 11.02648 4 总计60.1250 10.66955 8 2 农村59.7500 8.99537 4 城市67.2500 9.10586 4 总计63.5000 9.28901 8 3 农村62.0000 7.61577 4 城市70.2500 7.84750 4 总计66.1250 8.40812 8 总计农村59.2500 8.45442 12 城市67.2500 8.89458 12 总计63.2500 9.41899 24 文化程度1 农村82.7500 10.68878 4 城市90.2500 7.93200 4 总计86.5000 9.59166 8

方差分析与回归分析习题答案

第九章 方差分析与回归分析习题参考答案 1. 为研究不同品种对某种果树产量的影响,进行试验,得试验结果(产量)如下表,试分析果树品种对产量是否有显著影响. (0.05(2,9) 4.26F =,0.01(2,9) 8.02F =) 解 : r=3, 12 444n n 321=++=++=n n , T=120 ,120012 1202 2===n T C 计 算 统 计 值 722 8.53, 389 A A A e e SS f F SS f = =≈…… 方差分析表 方差来源 平方和 自由度 均方 F 值 临界值 显著性 品种A 72 2 36 8.53 误差 38 9 4.22 总 计 110 11 结论:由于0.018.53(2,9)8.02, A F F ≈>=故果树品种对产量有特别显著影响. 2. 解 : 22..4,3,12,180122700 l m n lm C x n ======= 计算 统 计 值 90310.52 51.43,3.56 3.56 A A B B A B e e e e S f S f F F S f S f = =≈==≈ 方差来源 平方和 自由度 F 值 临界值 显著性 品种 试验结果 行和??=i x T i 行均值.i x A 1 10 7 13 10 40 10 A 2 12 13 15 12 52 13 A 3 8 4 7 9 28 7 试验 结果 燃料B B 1 B 2 B 3 推进器 A A 1 14 13 12 39 13 A 2 18 16 14 48 16 A 3 13 12 11 36 12 A 4 20 18 19 57 19 65 59 56 180 16.25 14.75 14 15

方差分析的基本思想

第一节方差分析的基本思想 1、方差分析的意义 前述的t检验和u检验适用于两个样本均数的比较,对于k个样本均数的比较,如果仍用t检验或u检验, 需比较次,如四个样本均数需比较次。假设每次比较所确定的 检验水准=0.05,则每次检验拒绝H0不犯第一类错误的概率为1-0.05=0.95;那么6次检验都不犯第一类错误的概率为(1-0.05)6=0.7351,而犯第一类错误的概率为0.2649,因而t检验和u检验不适用于多个样本均数的比较。用方差分析比较多个样本均数,可有效地控制第一类错误。方差分析(analysis of variance,ANOVA)由英国统计学家R.A.Fisher首先提出,以F命名其统计量,故方差分析又称F检验。 2、方差分析的基本思想 下面通过表5.1资料介绍方差分析的基本思想。 例如,有4组进食高脂饮食的家兔,接受不同处理后,测定其血清肾素血管紧张素转化酶(ACE)浓度(表5.1),试比较四组家兔的血清ACE浓度。 表5.1对照组及各实验组家兔血清ACE浓度(u/ml) (

由表5.1可见,26只家兔的血清ACE浓度各不相同,称为总变异;四组家兔的血清ACE浓度均数也各不相同,称为组间变异;即使同一组内部的家兔血清ACE 浓度相互间也不相同,称为组内变异。该例的总变异包括组间变异和组内变异两部分,或者说可把总变异分解为组间变异和组内变异。组内变异是由于家兔间的个体差异所致。组间变异可能由两种原因所致,一是抽样误差;二是由于各组家兔所接受的处理不同。正如第四章所述,在抽样研究中抽样误差是不可避免的,故导致组间变异的第一种原因肯定存在;第二种原因是否存在,需通过假设检验作出推断。假设检验的方法很多,由于该例为多个样本均数的比较,应选用方差分析。 方差分析的检验假设H0为各样本来自均数相等的总体,H1为各总体均数不等或不全相等。若不拒绝H0时,可认为各样本均数间的差异是由于抽样误差所致,而不是由于处理因素的作用所致。理论上,此时的组间变异与组内变异应相等,两者的比值即统计量F为1;由于存在抽样误差,两者往往不恰好相等,但相差不会太大,统计量F应接近于1。若拒绝H0,接受H1时,可认为各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。此时的组间变异远大于组内变异,两者的比值即统计量F明显大于1。在实际应用中,当统计量F值远大于1且大于某界值时,拒绝H0,接受H1,即意味着各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。 (5.1) 方差分析的基本思想是根据研究目的和设计类型,将总变异中的离均差平方和SS及其自由度分别分解成相应的若干部分,然后求各相应部分的变异;再用各部分的变异与组内(或误差)变异进行比较,得出统计量F值;最后根据F值的大小确定P值,作出统计推断。 例如,完全随机设计的方差分析,是将总变异中的离均差平方和SS及其自由度 分别分解成组间和组内两部分,SS组间/组间和SS组内/组内分别为组间变异(MS组间)和组内变异(MS组内),两者之比即为统计量F(MS组间/MS组内)。 又如,随机区组设计的方差分析,是将总变异中的离均差平方和SS及其自由度 分别分解成处理间、区组间和误差3部分,然后分别求得以上各部分的变异(MS 处理、MS 区组和MS误差),进而得出统计量F值(MS处理/MS误差、MS区组/MS误差)。 3、方差分析的计算方法 下面以完全随机设计资料为例,说明各部分变异的计算方法。将N个受试对象随机分为k组,分别接受不同的处理。归纳整理数据的格式、符号见下表:

方差分析--SPSS应用

实习三方差分析(analysis of variance--- ANOV A ) 一、目的要求 1、掌握方差分析的应用条件 2、掌握方差分析的基本思想 3、掌握方差分析的用途 4、掌握常用方差分析的方法(完全随机设计、随机区组设计方差分析) 5、掌握多个样本均数间的两两比较方法 (a. 两两比较:SNK法(q检验);b.对照组与各处理组比较:LSD法)。 二、完全随机设计的方差分析(One-Way ANOVA) One-Way ANOVA过程用于进行两组及多组样本均数的比较,即完全随机设计(成组设计)的方差分析,如果做了相应选择,还可进行随后的两两比较。 P432第8题:某职业病防治院对某石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,结果如下表所示。问三组石棉矿工的用力肺活量有无差别? 三组石棉矿工的用力肺活量(L) 石棉肺患者可疑患者非患者 1.8 2.3 2.9 1.4 2.1 3.2 1.5 2.1 2.7 2.1 2.1 2.8 1.9 2.6 2.7 1.7 2.5 3 1.8 2.3 3.4 1.9 2.4 3

1.8 2.4 3.4 1.8 3.3 2.0 3.5 建库: 1、点击Variable View: 定义分类变量(组别)和应变量(用力肺活量) 2、点击Data View,输入数据: 3、分析过程

界面说明: 【Dependent List框】(选入应变量) 选入需要分析的变量,可选入多个结果变量(应变量)。 【Factor框】(因素,即选入一个分类变量) 选入需要比较的分组因素,只能选入一个。 【Contrasts钮】(线性组合比较,如检验均数之间差异大小的关系,均数间的线性趋势等) 【Post Hoc钮】(各组均数的多重比较) 弹出Post Hoc Multiple Comparisons(多重比较)对话框,用于选择进行各组间两两比较的方法,有: Equal Variances Assumed复选框组一组当各组方差齐时可用的两两比较方法,共有14中种这里不一一列出了,其中最常用的为LSD和S-N-K法。Equal Variances Not Assumed复选框组一组当各组方差不齐时可用的两两比较方法,共有4种,其中以Games-Howell法较好。 Significance Level框定义两两比较时的显著性水平,默认为0.05。【Options钮】 弹出Options对话框,用于定义相关的选项,有:

方差分析选择题及答案

第10章 方差分析与试验设计 三、选择题 1.方差分析的主要目的是判断 ( )。 A. 各总体是否存在方差 B. 各样本数据之间是否有显著差异 C. 分类型自变量对数值型因变量的影响是否显著 D. 分类型因变量对数值型自变量的影响是否显著 2.在方差分析中,检验统计量F是 ( )。 A. 组间平方和除以组内平方和 B. 组间均方除以组内均方 C. 组间平方除以总平方和 D. 组间均方除以总均方 3.在方差分析中,某一水平下样本数据之间的误差称为 ( )。 A. 随机误差 B. 非随机误差 C. 系统误差 D. 非系统误差 4.在方差分析中,衡量不同水平下样本数据之间的误差称为 ( )。 A. 组内误差 B. 组间误差 C. 组内平方 D. 组间平方 5.组间误差是衡量不同水平下各样本数据之间的误差,它 ( )。 A. 只包括随机误差 B. 只包括系统误差 C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差 6.组内误差是衡量某一水平下样本数据之间的误差,它 ( )。 A. 只包括随机误差 B. 只包括系统误差 C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差 7.在下面的假定中,哪一个不属于方差分析中的假定 ( )。 A. 每个总体都服从正态分布 B. 各总体的方差相等 C. 观测值是独立的 D. 各总体的方差等于0 8.在方差分析中,所提出的原假设是210:μμ=H = ···=k μ,备择假设是( ) A. ≠≠H 211:μμ···k μ≠ B. >>H 211:μμ···k μ> C. <

Excel在方差分析中的应用

Excel在方差分析中的应用 摘要:方差分析是一种重要和常用的统计分析方法, 使用常规方法进行方差分析是相当复杂的,而利用Excel 进行方差分析则可以轻松、快速地得出分析结果,使得我们可以把主要精力投入到实验设计和数据处理上,在教学时则可以腾出时间多讲授一些实验设计方面的内容而不必为复杂的计算伤脑筋。 关键词:方差分析;Excel;实验教学 The application of Excel in variance analysis Yin Dezhong Beijing normal university, Beijing, 100875, China Abstract: Anova is a kind of important and common statistical analysis method, and using a conventional methods for analysis of variance is very complicated, but using Excel can easily and quickly conclude the results of analysis, so than we can focus the experimental design and data collation and make more time for teaching the content of experimental design, not necessary to take the trouble doing the complex calculations. Key words: Anova; Excel; experimental teaching 方差分析在推断统计分析中是很常用也很重要的一种 统计分析方法,20 世纪20 年代由英国的统计学家R.A.Fisher 首先提出,并以其姓的第一个字母F命名其统计量,故方差

SPSS多因素方差分析报告

体育统计与SPSS读书笔记(八)—多因素方差分析(1) 具有两个或两个以上因素的方差分析称为多因素方差分析。 多因素是我们在试验中会经常遇到的,比如我们前面说的单因素方差分析的时候,如果做试验的不是一个年级,而是多个年纪,那就成了双因素了:不同教学方法的班级,不同年级。如果再加上性别上的因素,那就成了三因素了。如果我们把实验前和试验后的数据用一个时间的变量来表示,那又多了一个时间的因素。如果每个年级都是不同的老师来上,那又多了一个老师的因素,等等等等,所以我们在设计试验的时候都要进行充分考虑,并确定自己只研究哪些因素。 下面用例子的形式来说说多因素方差分析的运用。还是用前面说单因素的例子,前面的例子说了只在五年级抽三个班进行不同教学方法的试验,现在我们还要在初二和高二各抽三个班进行不同教学方法的试验。形成年级和不同教学法班级双因素。 分析: 1.根据实验方案我们划出双因素分析的表格,可以看出每个单元格都是有重复数据(也就是不只一个数据), 年级 不同教学方法的班级 定性班 定量班 定性定量班 五年级 (班级每个人) (班级每个人) (班级每个人) 初中二年级 (班级每个人) (班级每个人) (班级每个人) 高中二年级 (班级每个人) (班级每个人) (班级每个人) 2.因为有重复数据,所以存在在数据交互效应的可能。我们来看看交效应的含义:如果在A因素的不同水平上,B因素对因变量的影响不同,则说明A、B两因素间存在交互作用。交互作用是多因素实验分析的一个非常重要的内容。如因素间存在交互作用而又被忽视,则常会掩盖因素的主效应的显著性,另一方面,如果对因变量Y,因素A与B之间存在交互作用,则已说明这两个因素都Y对有影响,而不管其主效应是否具有显著性。在统计模型中考虑交互作用,是系统论思想在统计方法中的反映。在大多数场合,交互作用的信息比主效应的信息更为有用。根据上面的判断。根据上面的说法,我也无法判断是否有交互作用,不像身高和体重那么直接。这里假设他们之间有交互作用。

SPSS17.0在生物统计学中的应用-实验五、方差分析报告 六、简单相关与回归分析报告

SPSS在生物统计学中的应用 ——实验指导手册 实验五:方差分析 一、实验目标与要求 1.帮助学生深入了解方差及方差分析的基本概念,掌握方差分析的基本思想和原理 2.掌握方差分析的过程。 3.增强学生的实践能力,使学生能够利用SPSS统计软件,熟练进行单因素方差分析、两因素方差分析等操作,激发学生的学习兴趣,增强自我学习和研究的能力。 二、实验原理 在现实的生产和经营管理过程中,影响产品质量、数量或销量的因素往往很多。例如,农作物的产量受作物的品种、施肥的多少及种类等的影响;某种商品的销量受商品价格、质量、广告等的影响。为此引入方差分析的方法。 方差分析也是一种假设检验,它是对全部样本观测值的变动进行分解,将某种控制因素下各组样本观测值之间可能存在的由该因素导致的系统性误差与随即误差加以比较,据以推断各组样本之间是否存在显著差异。若存在显著差异,则说明该因素对各总体的影响是显著的。 方差分析有3个基本的概念:观测变量、因素和水平。 ●观测变量是进行方差分析所研究的对象; ●因素是影响观测变量变化的客观或人为条件; ●因素的不同类别或不通取值则称为因素的不同水平。在上面的例子中,农作物的产量和商品的销 量就是观测变量,作物的品种、施肥种类、商品价格、广告等就是因素。在方差分析中,因素常常是某一个或多个离散型的分类变量。 ?根据观测变量的个数,可将方差分析分为单变量方差分析和多变量方差分析; ?根据因素个数,可分为单因素方差分析和多因素方差分析。 在SPSS中,有One-way ANOV A(单变量-单因素方差分析)、GLM Univariate(单变量多因素方差分析);GLM Multivariate (多变量多因素方差分析),不同的方差分析方法适用于不同的实际情况。本节仅练习最为常用的单变量方差分析。 三、实验演示内容与步骤 ㈠单变量-单因素方差分析 单因素方差分析也称一维方差分析,对两组以上的均值加以比较。检验由单一因素影响的一个分析变量由因素各水平分组的均值之间的差异是否有统计意义。并可以进行两两组间均值的比较,称作组间均值的多重比较。主要采用One-way ANOV A过程。 采用One-way ANOV A过程要求:因变量属于正态分布总体,若因变量的分布明显是非正态,应该用非参数分析过程。若对被观测对象的实验不是随机分组的,而是进行的重复测量形成几个彼此不独立的变量,应该用Repeated Measure菜单项,进行重复测量方差分析,条件满足时,还可以进行趋势分析。 【例6.1】欲比较四种饲料对仔猪增重效果的优劣,随机选取了性别、年龄、体重相同,无亲缘关系的20头猪,随机分为4组,每组5头,分别饲喂一种饲料所得增重数据如下在。试利用这些数据对4种饲料对仔猪

spss多因素方差分析报告例子.doc

作业8:多因素方差分析 1,data0806-height是从三个样方中测量的八种草的高度,问高度在三个取样地点,以及八种草之间有无差异?具体怎么差异的? 打开spss软件,打开data0806-height数据,点击Analyze->General Linear Model->Univariate打开: 把plot和species送入Fixed Factor(s),把height送入Dependent Variable,点击Model打开:

选择Full factorial,Type III Sum of squares,Include intercept in model(即全部默认选项),点击Continue回到Univariate主对话框,对其他选项卡不做任何选择, 结果输出:

因无法计算MM M rror,即无法分开MM intercept 和MM error,无法检测interaction 的影响,无法进行方差分析, 重新Analyze->General Linear Model->Univariate打开:

选择好Dependent Variable和Fixed Factor(s),点击Model打开: 点击Custom,把主效应变量species和plot送入Model框,点击Continue回到Univariate 主对话框,点击Plots:

把date送入Horizontal Axis,把depth送入Separate Lines,点击Add,点击Continue 回到Univariate对话框,点击Options: 把OVERALL,species, plot送入Display Means for框,选择Compare main effects,Bonferroni,点击Continue回到Univariate对话框, 输出结果:

第9章方差分析思考与练习-带答案

第九章方差分析 【思考与练习】 一、思考题 1. 方差分析的基本思想及其应用条件是什么? 2. 在完全随机设计方差分析中SS SS SS 、、各表示什么含义? 总组间组内 3. 什么是交互效应?请举例说明。 4. 重复测量资料具有何种特点? 5. 为什么总的方差分析的结果为拒绝原假设时,若想进一步了解两两之间的差别需要进行多重比较? 二、最佳选择题 1. 方差分析的基本思想为 A. 组间均方大于组内均方 B. 误差均方必然小于组间均方 C. 总变异及其自由度按设计可以分解成几种不同来源 D. 组内方差显著大于组间方差时,该因素对所考察指标的影响显著 E. 组间方差显著大于组内方差时,该因素对所考察指标的影响显著

3. 完全随机设计的方差分析中,下列式子正确的是 4. 总的方差分析结果有P<0.05,则结论应为 A. 各样本均数全相等 B. 各总体均数全相等 C. 各样本均数不全相等 D. 各总体均数全不相等 E. 至少有两个总体均数不等 5. 对有k 个处理组,b 个随机区组的资料进行双因素方差分析,其误差的自由度为 A. kb k b -- B. 1kb k b --- C. 2kb k b --- D. 1kb k b --+ E. 2kb k b --+ 6. 2×2析因设计资料的方差分析中,总变异可分解为 A. MS MS MS =+B A 总 B. MS MS MS =+B 总误差 C. SS SS SS =+B 总误差 D. SS SS SS SS =++B A 总误差 E. SS SS SS SS SS =+++B A AB 总误差 7. 观察6只狗服药后不同时间点(2小时、4小时、8小时和24小时)血药浓度的变化,本试验应选用的统计分析方法是 A. 析因设计的方差分析

单因素方差分析在数理统计中的应用

单因素方差分析在数理统计中的应用 摘要:在详细阐述单因素方差分析原理的基础上,通过两个具体的数学建模案例,说明单因素方差分系的应用及与假设检验的关系,并利用Matlab 实现了两个案例的求解。在数理统计的授课过程中,这种结合不仅能激发学生的学习兴趣,而且能培养学生自己动手、解决问题的能力。 关键词:单因素方差分析;数理统计;数学建模;应用;假设检验 0 引言 方差分析又称“变异数分析”或“F 检验”,是由R. A. Fisher 发明的,用于对两个及两个以上样本均数差别的显著性检验。单因素方差分析是检验在一种因素影响下,两个以上总体的均值彼此是否相等的一种统计方法。由于单因素方差分析的原理抽象、计算繁琐、导致教学枯燥无味。基于此,文中详细阐述了单因素方差分析的原理,通过两个具体的数学建模案例,说明单因素方差分系的应用及与假设检验的关系,并利用Matlab 实现了两个案例的求解。在数理统计的授课过程中,这种从理论到应用,再从应用到上机实现的过程,让学生体会到“学以致用”的真正含义,激发了学生的学习兴趣,同时也提高了学生的动手能力。 1 单因素方差分析原理 设单因素A 具有r 个水平,分别记为A 1,A 2,…,A r ,在每个水平A i (i =1,2,…,r )下,要考察的指标可以看成一个总体X i (i =1,2,…,r )且X i ~ N (μi ,σ2 ),水平A i (i =1,2,…,r )下,进行n i 次独立试验,样本记为X ij ,i =1,2,…,r ,j =1,2,…,n i ,X ij ~ N (μi ,σ2)且相互独立。1. 1 建立假设 假设检验为H 0:μ1 = μ2 = …… = μr . ,备择假设为H 1:μ1,μ2,…,μr 不全相等。 由于X ij - μi = εij ,记μ= n 1Σn i μi ,n = n 1 Σn i . ,αi = μi - μ,i =1,2,…,r ,则 数学模型为: X ij = μ+ αi + εij ,i =1,2,…,r ,j =1,2,…,n i Σn i αi =0 εij ~ N (0,σ2),各个εij 相互独立,μi 和σ2 未知 故原假设改写为: H 0:α1 = α2 = …… = αr =0 (1) 1. 2 构造统计量 为了构造检验假设(1)的统计量,首先,需要找到引起X ij 波动的原因。从X ij = μ+ αi + εij 中可以看出,若检验假设(1)为真,则X ij 的波动纯粹是随机性引起的;若检验假设(1)为假,则X ij 的波动是由第i 个水平和随机性共同引起的。因而,需要构造一个量来刻画X ij 之间的波动,并把引起波动的上述两个原因用另外两个量表示,这就是方差分析中的平方和分解法。 记X i ?. = n 1ΣX ij ,x = n 1 ΣΣX ij 引入S T = ΣΣ(X ij -X )= ΣΣ(X ij -X i ?)+ ΣΣ(X i ?-X )= S E + S A 又因为S A = Σ(X -i ?-X )= Σ(αi + εi ?-ε) S E = ΣΣ=(X ij -X i. )= ΣΣ(εij - εi ?)。 若H 0 成立,S A 只反映随机波动,若H 0 不成立,S A 还反映了A 的不同水平效应αi 。单从数值上看,当H 0成立时,S A / (r -1) S E / (n - r )≈1,而当H 0 不成立时,这个比值将远大于1。可以证明:S T / σ2 ~ χ2 (n -1);S E / σ2 ~ χ2 (n - r );S A / σ2 ~ χ2(r -1),且S E 与S A 相互独立。

相关主题
文本预览
相关文档 最新文档