当前位置:文档之家› 方差分析2

方差分析2

方差分析2
方差分析2

方差分析是用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析的基本思想是:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。

方差分析主要用途:①均数差别的显著性检验,②分离各有关因素并估计其对总变异的作用,③分析因素间的交互作用,④方差齐性检验。

在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。通常是比较不同实验条件下样本均值间的差异。例如医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同化学药剂对作物害虫的杀虫效果等,都可以使用方差分析方法去解决。

方差分析原理

方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:

(1) 随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,记作SS w,组内自由度df w。

(2) 实验条件,实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和表示,记作SS b,组间自由度df b。

总偏差平方和 SS t = SS b + SS w。

组内SS t、组间SS w除以各自的自由度(组内dfw =n-m,组间dfb=m-1,其中n为样本总数,m为组数),得到其均方MS w和MS b,一种情况是处理没有作用,即各组样本均来自同一总体,MS b/MS w≈1。另一种情况是处理确实有作用,组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。那么,MS b>>MS w(远远大于)。

MS b/MS w比值构成F分布。用F值与其临界值比较,推断各样本是否来自相同的总体。

方差分析的假设检验

假设有m个样本,如果原假设H0:样本均数都相同即μ1=μ2=μ3=…=μm=μ,m个样本有共同的方差。则m个样本来自具有共同的方差和相同的均数u的总体。

零假设H0:m组样本均值都相同,即μ1= μ2=....= μm

如果,计算结果的组间均方远远大于组内均方(MS b>>MS w),F>F0.05(dfb,dfw), p<0.05,拒绝零假设,说明样本来自不同的正态总体,说明处理造成均值的差异有统计意义;否则, F0.05不能拒绝零假设,说明样本来自相同的正态总体,处理间无差异。

SPSS中方差分析过程

1)One-Way ANOVA过程

One-Way过程是单因素简单方差分析过程。它在Analyze菜单中的Compare Means过程组中。用0ne-Way ANOVA菜单项调用,可以进行单因素方差分析、均值多重比较和相对比较。

2)General Linear Model 过程组

在SPSS主菜单“Analyze”项调用。这些过程可以完成简单的多因素方差分析和协方差分析,不但可以分析各因素的主效应,还可以分析各因素间的交互效应。该过程允许指定最高阶次的交互效应,建立包括所有效应的模型。如果想建立包括某些特定的交互效应的模型也可以通过过程中的“Method”对话框中的选择项实现。

在General Linear Model菜单项的下一级菜单中有四项过程,每个菜单项分别完成不同类型的方差分析任务。这些过程的主要功能分别是:

① Univariate 过程

Univariate过程完成一般的单因变量、多因素方差分析。可以指定协变量,即进行协

方差分析。在指定模型方面有较大的灵活性并可以提供大量的统计输出。

② Multivar iate过程

Multivariate过程进行多因变量的多因素分析。当研究的问题具有两个或两个以上相

关的因变量时,要研究一个或几个因素变量与因变量集之间的关系时,才可以选用

Multivariate过程。例如,当你研究数学、物理的考试成绩是否与教学方法、学生性别、

以及方法与性别的交互作用有关时,使用此菜单项。如果只有几个不相关的因变量或只有一

个因变量,应该使用Univariate过程。

③ Repeated Measure过程

Repeated Measure过程进行重复测量方差分析。当一个因变量在不只一种条件下进行

测度,要检验有关因变量均值的假设应该使用该过程。

④ Variance Component 过程

Variance Component过程进行方差估计分析。通过计算方差估计值,可以帮助我们分

析如何减小方差。

单因素方差分析

单因素方差分析也称作一维方差分析。它检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差有统计意义。还可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析,即进行均值的多重比较。One-A过程要求因变量属于正态分布总体。如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程。如果几之间彼此不独立,应该用Repeated Measure过程。

[例子]

调查不同水稻品种百丛中稻纵卷叶螟幼虫的数量,数据如表5-1所示。

表5-1 不同水稻品种百丛中稻纵卷叶螟幼虫数

数据保存在“DATA5-1.SAV”文件中,变量格式如图5-1。

图5-1

分析水稻品种对稻纵卷叶螟幼虫抗虫性是否存在显著性差异。

1)准备分析数据

在数据编辑窗口中输入数据。建立因变量“幼虫”和因素水平变量“品种”,然后输入对应的数值,如图5-1所示。或者打开已存文件“DATA5-1.SAV”。

2)启动分析过程

点击主菜单“Analyze”项,在下拉菜单中点击“Compare Means”项,在右拉式菜单中点击“0ne-Way ANOVA”项,系统

单因素方差分析设置窗口如图5-2。

图5-2 单因素方差分析窗口

3)设置分析变量

因变量:选择一个或多个因子变量进入“Dependent List”框中。本例选择“幼虫”。

因素变量:选择一个因素变量进入“Factor”框中。本例选择“品种”。

4)设置多项式比较

单击“Contrasts”按钮,将打开如图5-3所示的对话框。该对话框用于设置均值的多项式比较。

图5-3 “Contrasts”对话框

定义多项式的步骤为:

均值的多项式比较是包括两个或更多个均值的比较。例如图5-3中显示的是要求计算“1.1×mean1-1×mean2”的值,检验的假设组均值的1.1倍与第二组的均值相等。单因素方差分析的“0ne-Way ANOVA”过程允许进行高达5次的均值多项式比较。多项式的系由读者自己根据研究的需要输入。具体的操作步骤如下:

① 选中“Polynomial”复选项,该操作激活其右面的“Degree”参数框。

② 单击Degree参数框右面的向下箭头展开阶次菜单,可以选择“Linear”线性、“Quadratic”二次、“Cubic”三次、“4th”四h”五次多项式。

③ 为多项式指定各组均值的系数。方法是在“Coefficients”框中输入一个系数,单击Add按钮,“Coefficients”框中的系数进的方框中。依次输入各组均值的系数,在方形显示框中形成—列数值。因素变量分为几组,输入几个系数,多出的无意义。如果多包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为0值。如果只包括第一组与第二组的均值,则只需要输入前,第三、四个系数可以不输入。

可以同时建立多个多项式。一个多项式的一组系数输入结束,激话“Next”按钮,单击该按钮后“Coefficients”框中清空,准备组系数数据。

如果认为输入的几组系数中有错误,可以分别单击“Previous”或“Next”按钮前后翻找出错的一组数据。单击出错的系数,该系编辑框中,可以在此进行修改,修改后单击“Change”按钮在系数显示框中出现正确的系数值。当在系数显示框中选中一个系数时话“Remove”按钮,单击该按钮将选中的系数清除。

④单击“Previous”或“Next”按钮显示输入的各组系数检查无误后,按“Continue”按钮确认输入的系数并返回到主对话框。要的输入,单击“Cancel”按钮;需要查看系统的帮助信息,单击“Help”按钮。

子不做多项式比较的选择,选择缺省值。

5)设置多重比较

在主对话框里单击“Post Hoc”按钮,将打开如图5-4所示的多重比较对话框。该对话框用于设置多重比较和配对比较。方差分析各组均值间存在差异显著,多重比较检测可以求出均值相等的组;配对比较可找出和其它组均值有差异的组,并输出显著性水平为

值比较矩阵,在矩阵中用星号表示有差异的组。

图5-4 “Post Hoc Multiple Comparisons”对话框

(1)多重比较的选择项:

①方差具有齐次性时(Equal Variances Assumed),该矩形框中有如下方法供选择:

LSD (Least-significant difference) 最小显著差数法,用t检验完成各组均值间的配对比较。对多重比较误差率不进行调整

Bonferroni (LSDMOD) 用t检验完成各组间均值的配对比较,但通过设置每个检验的误差率来控制整个误差率。

Sidak 计算t统计量进行多重配对比较。可以调整显著性水平,比Bofferroni方法的界限要小。

Scheffe对所有可能的组合进行同步进入的配对比较。这些选择项可以同时选择若干个。以便比较各种均值比较方法的结果。

R-E-G-WF (Ryan-Einot-Gabriel-Welsch F) 用F检验进行多重比较检验。

R-E-G-WQ (Ryan-Einot-Gabriel-Welsch range test) 正态分布范围进行多重配对比较。

S-N-K (Student-Newmnan-Keuls) 用Student Range分布进行所有各组均值间的配对比较。如果各组样本含量相等或者选择了“Harmonic average of all groups”即用所有各组样本含量的调和平均数进行样本量估计时还用逐步过程进行齐次子集(差异小的子集)的均值配对比较。在该比较过程中,各组均值从大到小按顺序排列,最先比较最末端的差异。

Tukey (Tukey's,honestly signicant difference) 用Student-Range统计量进行所有组间均值的配对比较,用所有配对比较差率作为实验误差率。

Tukey's-b用“stndent Range”分布进行组间均值的配对比较。其精确值为前两种检验相应值的平均值。

Duncan (Duncan's multiple range test) 新复极差法(SSR),指定一系列的“Range”值,逐步进行计算比较得出结论。

Hochberg's GT2用正态最大系数进行多重比较。

Gabriel用正态标准系数进行配对比较,在单元数较大时,这种方法较自由。

Waller-Dunca用t统计量进行多重比较检验,使用贝叶斯逼近。

Dunnett指定此选择项,进行各组与对照组的均值比较。默认的对照组是最后一组。选择了该项就激活下面的“Control Category”参数框。展开下拉列表,可以重新选择对照组。

“Test”框中列出了三种区间分别为:

?“2-sides” 双边检验;

?“

?“>Conbo1”“右边检验。

②方差不具有齐次性时(Equal Varance not assumed),检验各均数间是否有差异的方祛有四种可供选择:

Tamhane's T2, t检验进行配对比较。

Dunnett's T3,采用基于学生氏最大模的成对比较法。

Games-Howell,Games-Howell比较,该方法较灵活。

Dunnett's C,采用基于学生氏极值的成对比较法。

③ Significance 选择项,各种检验的显著性概率临界值,默认值为0.05,可由用户重新设定。

本例选择“LSD”和“Duncan”比较,检验的显著性概率临界值0.05。

6) 设置输出统计量

单击“Options”按钮,打开“Options”对话框,如图5-5所示。选择要求输出的统计量。并按要求的方式显示这些统计量。在该还可以选择对缺失值的处理要求。各组选择项的含义如下:

图5-5输出统计量的设置

“Statistics”栏中选择输出统计量:

Descriptive,要求输出描述统计量。选择此项输出观测量数目、均值、标准差、标准误、最小值、最大值、各组中每个因变的95%置信区间。

Fixed and random effects, 固定和随机描述统计量

Homogeneity-of-variance,要求进行方差齐次性检验,并输出检验结果。用“Levene lest ”检验,即计算每个观测量与其组值之差,然后对这些差值进行一维方差分析。

Brown-Forsythe 布朗检验

Welch,韦尔奇检验

Means plot,即均数分布图,根据各组均数描绘出因变量的分布情况。

“Missing Values”栏中,选择缺失值处理方法。

Exclude cases analysis by analysis选项,被选择参与分析的变量含缺失值的观测量,从分析中剔除。

Exclude cases listwise选项,对含有缺失值的观测量,从所有分析中剔除。

以上选择项选择完成后,按“Continue”按钮确认选择并返回上一级对话框;单击“Cancel”按钮作废本次选择;单击“Help”按有关的帮助信息。

本例子选择要求输出描述统计量和进行方差齐次性检验,缺失值处理方法选系统缺省设置。

6)提交执行

设置完成后,在单因素方差分析窗口框中点击“OK”按钮,SPSS就会根据设置进行运算,并将结算结果输出到SPSS结果输出窗口

7) 结果与分析

输出结果:

表5-2描述统计量,给出了水稻品种分组的样本含量N、平均数Mean、标准差Std.Deviation、标准误Std.Error、95%的置信区间和最大值。

表5-3为方差齐次性检验结果,从显著性慨率看,p>0.05,说明各组的方差在a=0.05水平上没有显著性差异,即方差具有齐次性。论在选择多重比较方法时作为一个条件。

表5-4方差分析表:第1栏是方差来源,包括组间变差“Between Groups”;组内变差“Within Groups”和总变差“Total”。第差平方和“Sum of Squares”,组间离差平方和87.600,组内离差平方和为24.000,总离差平方和为111.600,是组间离差平方和

差平方和相加之和。第3栏是自由度df,组间自由度为4,组内自由度为10;总自由度为14。第4栏是均方“Mean Square”,是第3栏之比;组间均方为21.900,组内均方为2.400。第5栏是F值9.125(组间均方与组内均方之比)。第6栏:F值对应的概率假设H0:组间均值无显著性差异(即5种品种虫数的平均值无显著性差异)。计算的F值9.125,对应的概率值为0.002。

表5-5 LSD法进行多重比较表,从表5-4结论已知该例子的方差具有其次性,因此LSD方法适用。第1栏的第1列“[i]品种”为比品种,第2列“[j]品种”是比较品种。第2栏是比较基准品种平均数减去比较品种平均数的差值(Mean Difference),均值之间水平(可图5-4对话框里设置)上有显著性差异,在平均数差值上用“*”号表明。第3栏是差值的标准误。第4栏是差值检验的平。第5栏是差值的95%置信范围的下限和上限。

表5-6 是多重比较的Duncan法进行比较的结果。第1栏为品种,按均数由小到大排列。第2栏列出计算均数用的样本数。第3栏显著水平0.05上的比较结果,表的最后一行是均数方差齐次性检验慨率水平,p>0.05说明各组方差具有齐次性。

多重比较比较表显著性差异差异的判读:在同一列的平均数表示没有显著性差异,反之则具有显著性的差异。

例如,品种3横向看,平均数显示在第3列“2”小列,与它同列显示的有品种2的平均数,说明与品种2差异不显著(0.05水平右看,平均数显示在第3列“3”小列,与它同列显示的有品种4的平均数,说明与品种4差异不显著(0.05水平)。则品种3与品种1具有显著性的差异(0.05水平)。

品种3和品种4都显示有平均数值。

结果分析:

根据方差分析表输出的p值为0.002可以看出,无论临界值取0.05,还是取0.01,p值均小于临界值。因此否定Ho假设,水稻品卷叶螟幼虫抗虫性有显著性意义,结论是稻纵卷叶螟幼虫数量的在不同品种间有明显的不同。根据该结论选择抗稻纵卷叶螟幼虫水犯错误的概率几乎为0.008。

只有在方差分析中F检验存在差异显著性时,才有比较的统计意义。

LSD法多重比较表明:

品种1与品种2、品种3和品种5之间存在显著性差异;

品种2与品种1和品种4之间存在显著性差异;

品种3与品种1和品种5之间存在显著性差异;

品种4与品种2和品种5之间存在显著性差异;

品种5与品种1、品种3和品种4之间存在显著性差异。

Duncan法多重比较表明:

品种5与品种3、品种4和品种1之间存在显著性差异。

品种2与品种4和品种1之间存在显著性差异;

品种3与品种5和品种1之间存在显著性差异;

品种4与品种5和品种2之间存在显著性差异;

品种1与品种5、品种2和品种3之间存在显著性差异;

两种方法比较结果一致。

多因素方差分析

多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。SPSS调用“Univariate”过程,检验不同之间因变量均数,由于受不同因素影响是否有差异的问题。在这个过程中可以分析每一个因素的作用,也可以分析因素之间的交互作分析协方差,以及各因素变量与协变量之间的交互作用。该过程要求因变量是从多元正态总体随机采样得来,且总体中各单元的方差可以通过方差齐次性检验选择均值比较结果。因变量和协变量必须是数值型变量,协变量与因变量不彼此独立。因素变量是分类变量数值型也可以是长度不超过8的字符型变量。固定因素变量(Fixed Factor)是反应处理的因素;随机因素是随机地从总体中抽取的因

[例子]

研究不同温度与不同湿度对粘虫发育历期的影响,得试验数据如表5-7。分析不同温度和湿度对粘虫发育历期的影响是否存在着显著

表5-7 不同温度与不同湿度粘虫发育历期表

数据保存在“DATA5-2.SAV”文件中,变量格式如图5-1。

1)准备分析数据

在数据编辑窗口中输入数据。建立因变量历期“历期”变量,因素变量温度“A”,湿度为“B”变量,重复变量“重复”。然后输入值,如图5-6所示。或者打开已存在的数据文件“DATA5-2.SAV”。

图5-6 数据输入格式

2)启动分析过程

点击主菜单“Analyze”项,在下拉菜单中点击“General Linear Model”项,在右拉式菜单中点击“Univariate”项,系统打开单因素方差分析设置窗口如图5-7。

图5-7 多因素方差分析窗口

3)设置分析变量

设置因变量:在左边变量列表中选“历期”,用向右拉按钮选入到“Dependent Variable:”框中。

设置因素变量:在左边变量列表中选“a”和“b”变量,用向右拉按钮移到“Fixed Factor(s):”框中。可以选择多个因素变量存容量的限制,选择的因素水平组合数(单元数)应该尽量少。

设置随机因素变量:在左边变量列表中选“重复”变量,用向右拉按钮移到“到Random Factor(s)”框中。可以选择多个随机变量设置协变量:如果需要去除某个变量对因素变量的影响,可将这个变量移到“Covariate(s)”框中。

设置权重变量:如果需要分析权重变量的影响,将权重变量移到“WLS Weight”框中。

4)选择分析模型

在主对话框中单击“Model”按钮,打开“Univariate Model”对话框。见图5-8。

图5-8 “Univariate Model” 定义分析模型对话框

在Specify Model栏中,指定分析模型类型。

① Full Factorial选项

此项为系统默认的模型类型。该项选择建立全模型。全模型包括所有因素变量的主效应和所有的交互效应。例如有三个因素变量,全三个因素变量的主效应、两两的交互效应和三个因素的交互效应。选择该项后无需进行进一步的操作,即可单击“Continue”按钮返框。此项是系统缺省项。

② Custom选项

建立自定义的分析模型。选择了“Custom”后,原被屏蔽的“Factors & Covariates”、“Model”和“Build Term(s)”栏被激活。ctors & Covariates”框中自动列出可以作为因素变量的变量名,其变量名后面的括号中标有字母“F”;和可以作为协变量的变量量名后面的括号中标有字母“C”。这些变量都是由用户在主对话框中定义过的。根据表中列出的变量名建立模型,其方法如下:Build Term(s)”栏右面的有一向下箭头按钮(下拉按钮),单击该按钮可以展开一小菜单,在下拉菜单中用鼠标单击某一项,下拉,选中的交互类型占据矩形框。有如下几项选择:

Interaction 选中此项可以指定任意的交互效应;

Main effects 选中此项可以指定主效应;

All 2-way 指定所有2维交互效应;

All 3-way 指定所有3维交互效应;

All 4-way 指定所有4维交互效应

All 5-way 指定所有5维交互效应。

③ 建立分析模型中的主效应:

在“Build Term(s)”栏用下拉按钮选中主效应“Main effects”。

在变量列表栏用鼠标键单击某一个单个的因素变量名,该变量名背景将改变颜色(一般变为蓝色),单击“Build Term(s)”栏中的右钮,该变量出现在“Model”框中。一个变量名占一行称为主效应项。欲在模型中包括几个主效应项,就进行几次如上的操作。也可“F”变量名中标记多个变量同时送到“Model”框中。

本例将“a”和“b”变量作为主效应,按上面的方法选送到“Model”框中。

④ 建立模型中的交互项

要求在分析模型中包括哪些变量的交互效应,可以通过如下的操作建立交互项。

例如,因素变量有“a(F)”和“b(F)”,建立它们之间的相互效应。

连续在“Factors &”框的变量表中单击“a(F)”和“b(F)”变量使其选中。

单击“Build Term(s)”栏内下拉按钮,选中交互效应“Interaction”项。

单击“Build Term(s)”栏内的右拉按钮,“a*b”交互效应就出现在“Model”框中,模型增加了一个交互效应项:a*b

⑤ Sum of squares 栏分解平方和的选择项

Type I项,分层处理平方和。仅对模型主效应之前的每项进行调整。一般适用于:平衡的AN0VA模型,在这个模型中一阶交互效应前指定主效应,二阶交互效应前指定一阶交互效应,依次类推;多项式回归模型。嵌套模型是指第一效应嵌套在第

效应里,第二效应嵌套在第三效应里,嵌套的形式可使用语句指定。

Type II项,对其他所有效应进行调整。一般适用于:平衡的AN0VA模型、主因子效应模型、回归模型、嵌套设计。

Type III项,是系统默认的处理方法。对其他任何效应均进行调整。它的优势是把所估计剩余常量也考虑到单元频数中。对没有缺失单元格的不平衡模型也适用,一般适用于:Type I、Type II所列的模型:没有空单元格的平衡和不平衡模型。

Type IV顶,没有缺失单元的设计使用此方法对任何效应F计算平方和。如果F不包含在其他效应里,Type IV = Type IIIl = TypeII。如果F包含在其他效应里,Type IV只对F的较高水平效应参数作对比。一般适用于:Type I、Type lI所列没有空单元的平衡和不平衡模型。

⑥ Include intercept in model栏选项

系统默认选项。通常截距包括在模型中。如果能假设数据通过原点,可以不包括截距,即不选择此项。

5)选择比较方法

在主对话框中单击“Contrasts”按钮,打开“Contrasts”比较设置对话框,如图5-9所示。

如图5-9 Contrasts对比设置框

在“Factors”框中显示出所有在主对话框中选中的因素变量。因素变量名后的括号中是当前的比较方法。

① 选择因子

在“Factors”框中选择想要改变比较方法的因子,即鼠标单击选中的因子。这一操作使“Change Contrast”栏中的各项被激活。

② 选择比较方法

单击“Contrast”参数框中的向下箭头,展开比较方法表。用鼠标单击选中的对照方法。可供选择的对照方法有:

None,不进行均数比较。

Deviation,除被忽略的水平外,比较预测变量或因素变量的每个水平的效应。可以选择“Last”(最后一个水平)或“First”(第一个水平)作为忽略的水平。

Simple,除了作为参考的水平外,对预测变量或因素变量的每一水平都与参考水平进行比较。选择“Last”或“First”作为参考水平。

Difference,对预测变量或因素每一水平的效应,除第一水平以外,都与其前面各水平的平均效应进行比较。与Helmert对照方法相反。

Helmert,对预测变量或因素的效应,除最后一个以外,都与后续的各水平的平均效应相比较。

Repeated,对相邻的水平进行比较。对预测变量或因素的效应,除第一水平以外,对每一水平都与它前面的水平进行比较。

Polynomial,多项式比较。第一级自由度包括线性效应与预测变量或因素水平的交叉。第二级包括二次效应等。各水平彼此的间隔被假设是均匀的。

③ 修改比较方法

先按步骤①选中因子变量,再选比较方法,然后单击“Change”按钮,选中的(或改变的)比较方法显示在步骤①选中的因子变量后面。

④设置比较的参考类

在“Reference Category”栏比较的参考类有两个,只有选择了“Deviation”或“Simple”方法时才需要选择参考水平。共有两种择,最后一个水平“Last”选项和第一水平“First”项。系统默认的参考水平是“Last”。

6) 选择均值图

在主对话框中单击“Plot”按钮,打开“Profile Plots”对话框,如图5-10所示。在该对话框中设置均值轮廓图。

如图5-10 “Profile Plots”对话框

均值轮廓图(Profile Plots)用于比较边际均值。轮廓图是线图,图中每个点表明因变量在因素变量每个水平上的边际均值的估计值

定了协变量,该均值则是经过协变量调整的均值。因变量做轮廓图的纵轴;一个因素变量做横轴。

做单因素方差分析时,轮廓图表明该因素各水平的因变量均值。

双因素方差分析时,指定一个因素做横轴变量,另一个因素变量的每个水平产生不同的线。如果是三因素方差分析,可以指定第三个,该因素每个水平产生一个轮廓图。双因素或多因素轮廓图中的相互平行的线表明在因素间无交互效应;不平行的线表明有交互效应

Factors框中为因素变量列表。

Horlzontal Axis横坐标框,选择选择“Factors”框中一个因素变量做横坐标变量。被选的变量名反向显示,单击向右拉箭头按钮,将变量名送入相应的横坐标轴框中。

如果只想看该因素变量各水平的,因变量均值分布,单击“Add”按钮,将所选因素变量移入下面的“Plots”框中。

则,不点击“Add”按钮,接着做下步。

Separate Lines分线框。如果想看两个因素变量组合的各单元格中因变量均值分布,或想看两个因变量间是否存在交互效应,选择“Factors”框中另一个因素变量,单击右拉按钮将变量名送入“Separate Lines”框中。单击“Add”按钮,将自动的图形表达式送入到“Plots”栏中。分线框中的变量的每个水平将在图中是一条线。图形表达式是用“*”连接的两个因量名。

Separate Plots分图框。如果在“Factors”栏中还有因素变量,可以按上述方法,将其送入“Separate Plot”框中,单击“Add”按钮,将自动生成的图形表达式送入到“Plots”栏中。图形表达式是用“*’连接的三个因素变量名。分图变量的水平生成一张线图。

将图形表达式送到“Plots”框后发现有错误,单击选错的变量,单击“Remove”按钮,将其取消,再重新输入正确内容。

在检查无误后,按“Continue”按钮确认,返回到主对话框。如果取消做的设置单击“Cancel”按钮

7) 选择多重比较

在主对话框中单击“Post Hoc”选项,打开“Post Hoc Multiple Comparisons for Observed Means”对话框,从“Factor(s)”框,单击向右拉按钮,使被选变量进入“Post Hoc test for”框。本例子选择了“a”和“b”。

然后选择多重比较方法。在对话框中选择多重比较方法。本例子选择了“Duncan”和“Tamhane's T2”。

第二章 常用统计技术(1)方差分析

第二章常用统计技术 第二章常用统计技术 【考试趋势】 单选4-5题,多选6-8题,综合分析7-8题。总分值30-40分。总分170分。占比20%左右。 【大纲考点】 一、方差分析 (一)方差分析基本概念 1.掌握因子、水平和方差分析的三项基本假定 2.熟悉方差分析是在同方差假定下检验多个正态均值是否相等的统计方法(难点) (二)方差分析方法 1.掌握单因子的方差分析方法(平方和分解、总平方和、因子平方和、误差平方和,自由由度、f比、显著性) (重点) 2.了解重复数不等情况下的方差分析方法。(难点) 二、回归分析 主要研究定量因子,也就是变量分析 (一)散布图与相关系数 1.掌握散布图的作用与做法 2.掌握样本相关系数的定义、计算及其检验方法(重点,难点) (二)一元线性回归 1.掌握用最小二乘估计建立一元线性回归方程的方法(重点,难点) 2.掌握一元线性回归方程的检验方法(重点,难点) 3.熟悉一元线性回归方法在预测中的应用 (三)了解可化为一元线性回归的曲线回归问题 三、试验设计 三、试验设计

(一)基本概念与正交表 1.了解试验设计的必要性 2.熟悉常用正交表及正交表的特点 (二)正交试验设计与分析 1.熟悉使用正交表进行试验设计的步骤 2.掌握无交互作用的正交试验设计的直观分析法与方差分析法 3.熟悉贡献率的分析方法 4.了解有交互作用的正交试验设计的方差分析法 5.熟悉最佳水平组合的选取 【考点解读】 三种统计技术的特点:新版教材第74页。 第一节方差分析 第一节方差分析 一、方差分析 1、三项基本假定-(掌握p75) 为什么要方差分析?目的和用途。方差分析不是简单分析方差,通过方差分析因子的显著与否。方差只是手段。对结果的影响是否显著。要用到假设检验。零假设,备择假设。 但是假设检验的前提条件是:正态分布,等方差,观测相互独立。也就是大纲里讲的三项基本假定。 2、方差分析的统计检验-(掌握p76) 那么如何在同方差假定下检验多个正态均值是否相等呢?其实统计检验的 问题。大家想一下,零假设,备择假设是什么? 同一个因子,有不同水平,每个水平重复多次试验就得到一个分布。有几个水平就有几个分布,方差分析是看分布的均值是否相等。相等,说明因子变动对结果没影响,相差越大就越显著! 3、单因子的方差分析-(掌握p76-79)

spss实验报告---方差分析

实验报告 ——(方差分析) 一、实验目的 熟练使用SPSS软件进行方差分析。学会通过方差分析分析不同水平的控制变量是否对结果产生显著影响。 二、实验内容 1、某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,问三组石棉矿工的用力肺活量有无差别?(自建数据集) 石棉肺患者可疑患者非患者 1.8 2.3 2.9 1.4 2.1 3.2 1.5 2.1 2.7 2.1 2.1 2.8 1.9 2.6 2.7 1.7 2.5 3.0 1.8 2.3 3.4 1.9 2.4 3.0 1.8 2.4 3.4 1.8 3.3 2.0 3.5 SPSS计算结果: 在建立数据集时定义group1为石棉肺患者,group2为可疑患者,group3为非患者。 零假设:各水平下总体方差没有显著差异。 相伴概率为0.075,大于0.05,可以认为各个组的方差是相等的,可以进行方差检验。

从上表可以看出3个组之间的相伴概率都小于显著性水平0.05,拒绝零假设,说明3个组之间都存在显著差别。 2、某汽车经销商在不同城市进行调查汽车的销售量数据分析工作,每个城市分别处于不同的区域:东部、西部和中部,而且汽车经销商在不同城市投放不同类型的广告,调查数据放置于附件中数据文件“汽车销量调查.sav”。 (1)试分析不同区域与不同广告类型是否对汽车的销量产生显著性的影响?(2)如果考虑到不同城市人均收入具有差异度时,再思考不同区域和不同广告类型对汽车销量产生的影响差异是否改变,这说明什么问题? SPSS计算结果: (1)此为多因素方差分析 相伴概率为0.054大于0.05,可以认为各个组总体方差相等可以进行方差检验。

双因素方差分析

双因素方差分析 一、双因素方差分析的含义和类型 (一)双因素方差分析的含义和内容 在实际问题的研究中,有时需要考虑两个因素对实验结果的影响。例如上一节中饮料销售量的例子,除了关心饮料颜色之外,我们还想了解销售地区是否影响销售量,如果在不同的地区,销售量存在显著的差异,就需要分析原因,采用不同的推销策略,使该饮料品牌在市场占有率高的地区继续深入人心,保持领先地位,在市场占有率低的地区,进一步扩大宣传,让更多的消费者了解,接受该产品。 在方差分析中,若把饮料的颜色看作影响销售量的因素A,饮料的销售地区看作影响因素B。同时对因素A和因素B进行分析,就称为双因素方差分析。 双因素方差分析的内容包括:对影响因素进行检验,究竟一个因素在起作用,还是两个因素都起作用,或是两个因素的影响都不显著。 双因素方差分析的前提假定:采样地随机性,样本的独立性,分布的正态性,残差方差的一致性。 (二)双因素方差分析的类型 双因素方差分析有两种类型:一个是无交互作用的双因素方差分析,它假定因素A 和因素B的效应之间是相互独立的,不存在相互关系;另一个是有交互作用的双因素方差分析,它假定因素A和因素B的结合会产生出一种新的效应。例如,若假定不同地区的消费者对某种品牌有与其他地区消费者不同的特殊偏爱,这就是两个因素结合后产生的新效应,属于有交互作用的背景;否则,就是无交互作用的背景。有交互作用的双因素方差分析已超出本书的范围,这里介绍无交互作用的双因素方差分析。 1.无交互作用的双因素方差分析。 无交互作用的双因素方差分析是假定因素A和因素B的效应之间是相互独立的,不存在相互关系; 2.有交互作用的双因素方差分析。 有交互作用的双因素方差分析是假定因素A和因素B的结合会产生出一种新的效应。例如,若假定不同地区的消费者对某种颜色有与其他地区消费者不同的特殊偏爱,

第10章单因素方差分析

第10章 单因素方差分析 单因素方差分析(0ne-Way ANOV A),又称一维方差分析,它能够对单因素多个独立样本 的均数进行比较,可以用10种检验方法对变量间的均数进行两两比较(即多重比较检验)并给出方差分析表,还可以作出5种类型图形(Type of plots)和2种均数图形(Means plot options) 10.1 单因素方差分析的计量资料 [例10—1] 某社区随机抽取了30名糖尿病患者、IGT 异常人和正常人进行载脂蛋白 (mg /dL)测定,结果示于表10—1。试问3组人群的载脂蛋白测定结果含量是否相同?(倪宗瓒.卫生统计学.第4版,北京:人民卫生出版社,2001.50) 组别(B ) 载脂蛋白测定 糖尿病(1) 85.7 105.2 109.5 96.0 115.2 95.3 110.0 100.0 125.6 111.0 106.5 96.0 124.5 105.1 76.4 95.3 110.0 95.2 99.0 120.0 144.0 117.0 110.0 109.0 103.0 123.0 127.0 121.0 159.0 115.0 IGT 异常(2) 正常人(3) 本例是一个完全随机设计的单因素方差分析。已建立SAS 数据集文件并保存Sasuser.onewav4。 (1)进入SAS /Win(v8)系统,单击Solutions -Analysis -Analyst ,得到分析家窗口。 (2)单击File-open By SAS Name —Sasuser-0neway4—0K ,调入数据文件。 (3)在“分析家”窗口单击Statistics-ANOV A-One way ANOV A ,得到图10—1所示对话框。本例因变量(Dependent)为A(载脂蛋白),单击A —Dependent 。自变量(1ndependent): B(3种人的组别),单击B —Independent 。 图10.1 0ne —way ANOV A :0neway4(单因素方差分析)对话框 (4)单击Tests 按钮,得到图10—2所示对话框。在此对话框的ANOV A(F —检验)选项 中可进行如下设置。 Analysis of variance ,方差分析。 Welch ’s variance-weighted ANOV A ,威尔奇方差—权重方差分析。 Tests for equal variance ,相等方差检验,即方差齐性检验。 Barlett ’s test ,巴特尼特检验。 Brown-Forsythe test ,布朗—福塞斯检验。 Levene ’s test ,列文检验。本例以上都选。

方差分析实验报告

非参数检验 实验报告 方差分析 学院: 参赛队员: 参赛队员: 参赛队员: 指导老师:

目录 一、实验目的 (1) 1.了解方差分析的基本内容; (1) 2.了解单因素方差分析; (1) 3.了解多因素方差分析; (1) 4.学会运用spss软件求解问题; (1) 5.加深理论与实践相结合的能力。 (1) 二、实验环境 (1) 三、实验方法 (1) 1. 单因素方差分析; (1) 2. 多因素方差分析。 (1) 四、实验过程 (1) 问题一: (1) 1.1实验过程 (1) 1.1.1输入数据,数据处理; (1) 1.1.2单因素方差分析 (1) 1.2输出结果 (3) 1.3结果分析 (3) 1.3.1描述 (3) 1.3.2方差性检验 (4) 1.3.3单因素方差分析 (4) 问题二: (4) 2.1实验步骤 (5) 2.1.1命名变量 (5) 2.1.2导入数据 (5) 2.1.3单因素方差分析 (5) 2.1.4输出结果 (7) 2.2结果分析 (7) 2.2.1描述 (7) 2.2.2方差性检验 (8)

2.2.3单因素方差分析 (8) 问题三: (8) 3.1提出假设 (8) 3.2实验步骤 (8) 3.2.1数据分组编号 (8) 3.2.2多因素方差分析 (9) 3.2.3输出结果 (13) 3.3结果分析 (14) 五、实验总结 (14)

方差分析 一、实验目的 1.了解方差分析的基本内容; 2.了解单因素方差分析; 3.了解多因素方差分析; 4.学会运用spss软件求解问题; 5.加深理论与实践相结合的能力。 二、实验环境 Spss、office 三、实验方法 1.单因素方差分析; 2.多因素方差分析。 四、实验过程 问题一: 1.1.1输入数据,数据处理; 1.1.2单因素方差分析 选择:分析→比较均值→单因素AVONA;

方差分析与假设检验实验报告

云南大学滇池学院 方差分析与假设检验实验报告二 学生姓名:方炜学号:20092123080 专业:软件工程 一、实验目的和要求: 1、初步了解SPSS的基本命令; 2、掌握方差分析和假设检验。 二、实验内容: 1、为比较5中品牌的合成木板的耐久性,对每个品牌取4个样本作摩擦试验测量磨损量,得以下数据: (1)它们的耐久性有无明显差异? (2)有选择的作两品牌的比较,能得出什么结果?

2、将土质基本相同的一块耕地分成5块,每块又分成均等的4小块。在每块地内把4个品 种的小麦分钟在4小块内,每小块的播种量相同,测得收获量如下: 考察地块和品种对小麦的收获量有无显著影响?并在必要时作进一步比较。 3、为了研究合成纤维收缩率和拉伸倍数对纤维弹性的影响进行了一些试验。收缩率取0,4, 8,12四个水平;拉伸倍数取460,520,580,640四个水平,对二者的每个组合重复作两次试验,所得数据如下:

(1)收缩率,拉伸倍数及其交互作用对弹性有无显著影响? (2)使弹性达到最大的生产条件是什么? 三、实验结果与分析: 1、运行结果截图: 1、结果分析: (1)、Sig<0.05,耐久性有明显差异 (2)、由样本分析,品牌3分为一类;品牌1,2,5分为一类;品牌4分为一类。而品牌3和品牌4差距最大,品牌3的耐久性最差,品牌4的耐久性最好。 2、运行结果截图:

2、结果分析: (1)、地块(A组)Sig>0.05对小麦的收获量无显著影响,品种(B组)Sig<0.05对小麦的收获量有显著影响。 (2)、由图得,地块4最适合种小麦,地块1最不适合种小麦;而品种2的小麦收获量最大,品种4的小麦收获量最小。 3、运行结果截图:

正交试验方差分析(通俗易懂)

第十一章正交设计试验资料的方差分析 在实际工作中,常常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。 正交设计是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。 第一节、正交设计原理和方法 (一) 正交设计的基本概念 正交设计是利用正交表来安排多因素试验、分析试验结果的一种设计方法。它从多因素试验的全部水平组合中挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优水平组合。 例如,研究氮、磷、钾肥施用量对某小麦品种产量的影响: A因素是氮肥施用量,设A1、A2、A3 3个水平; B因素是磷肥施用量,设B1、B2、B3 3个水平; C因素是钾肥施用量,设C1、C2、C3 3个水平。 这是一个3因素每个因素3水平的试验,各因素的水平之间全部可能的组合有27种。 如果进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。 但全面试验包含的水平组合数较多,工作量大,由于受试验场地、经费等限制而难于实施。 如果试验的主要目的是寻求最优水平组合,则可利用正交设计来安排试验。 正交设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。 正交试验是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。 如对于上述3因素每个因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。 一、正交设计的基本原理 表11-1 33试验的全面试验方案

第10章 方差分析与试验设计

第10章 方差分析与试验设计 三、选择题 1.方差分析的主要目的是判断 ( )。 A. 各总体是否存在方差 B. 各样本数据之间是否有显著差异 C. 分类型自变量对数值型因变量的影响是否显著 D. 分类型因变量对数值型自变量的影响是否显著 2.在方差分析中,检验统计量F是 ( )。 A. 组间平方和除以组内平方和 B. 组间均方除以组内均方 C. 组间平方除以总平方和 D. 组间均方除以总均方 3.在方差分析中,某一水平下样本数据之间的误差称为 ( )。 A. 随机误差 B. 非随机误差 C. 系统误差 D. 非系统误差 4.在方差分析中,衡量不同水平下样本数据之间的误差称为 ( )。 A. 组内误差 B. 组间误差 C. 组内平方 D. 组间平方 5.组间误差是衡量不同水平下各样本数据之间的误差,它 ( )。 A. 只包括随机误差 B. 只包括系统误差 C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差 6.组内误差是衡量某一水平下样本数据之间的误差,它 ( )。 A. 只包括随机误差 B. 只包括系统误差 C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差 7.在下面的假定中,哪一个不属于方差分析中的假定 ( )。 A. 每个总体都服从正态分布 B. 各总体的方差相等 C. 观测值是独立的 D. 各总体的方差等于0 8.在方差分析中,所提出的原假设是210:μμ=H = ···=k μ,备择假设是( ) A. ≠≠H 211:μμ···k μ≠ B. >>H 211:μμ···k μ> C. <

两因素方差分析检验

, 本科学生实验报告 学号:……………………姓名:****** 学院:生命科学学院专业、班级:11级应用生物教育A班 实验课程名称:生物统计学实验 教师:孟丽华(教授) 开课学期:2012至2013学年下学期 填报时间:2013年5月15日 云南师范大学教务处编印 实验序号及名称:实验九:为了选出某物质较为适宜的条件的两因素方差分析检验 实验时间2013-05-10 实验室睿智楼3幢326 (一)、实验目的: 1、能够熟练的使用SPSS进行二因素方差分析; 2、通过本次试验理解二因素方差分析的概念和思想,理解多个因素存在交互效应的统计学含义和实际含义; 3、了解方差分析分解的理论基础和计算原理,能够熟练应用单因素方差分析对具体的实际问题进行有效的分析,通过测量数据研究各个因素对总体的影响效果,判定因素在总变异中的重要程度; 4、进一步熟悉SPSS软件的应用。 (二)、实验设备及材料: 微机、SPSS for Windows V18.0统计软件包及相应的要统计的数据 (三)、实验原理: 1、两因素方差分析主要用来检测两个自变量之间的是否有显著的影响,检测不同

/INTERCEPT=INCLUDE /POSTHOC=原料温度(SNK) /PLOT=PROFILE(原料*温度) /EMMEANS=TABLES(OVERALL) /EMMEANS=TABLES(原料) COMPARE ADJ(LSD) /EMMEANS=TABLES(温度) COMPARE ADJ(LSD) /EMMEANS=TABLES(原料*温度) /PRINT=OPOWER ETASQ HOMOGENEITY DESCRIPTIVE PARAMETER /PLOT=SPREADLEVEL /CRITERIA=ALPHA(.05) /DESIGN=原料温度原料*温度. 方差的单变量分析 表1 主体间因子 值标签N 原料 1 A1 12 2 A2 12 3 A3 12 温度 1 B1(30℃)12 2 B2(35℃)12 3 B3(40℃)12 表2 误差方差等同性的 Levene 检验a 因变量:适宜的条件 F df1 df2 Sig. 1.367 8 27 .255 检验零假设,即在所有组中因变量的误差方差均相 等。 a. 设计 : 截距 + 原料 + 温度 + 原料 * 温度 表3 描述性统计量 因变量:适宜的条件 原料温度均值标准偏差N A1 B1(30℃)34.50 12.583 4 B2(35℃)18.25 7.274 4 B3(40℃)18.00 8.641 4 总计23.58 11.958 12 A2 B1(30℃)49.00 7.874 4

双因素试验的方差分析(精)

实验三 双因素试验的方差分析 实验目的:1掌握单因素实验方差分析的方法与步骤; 2正确分析输出结果中的各参数,并得出正确结论。 试验内容: 某种火箭使用4种燃料,3种推进器进行射程试验。在每种燃料与每种推进器的组合下火箭各发射两次,射程数据见表3.1。 表3.1 火箭的射程数据 试在水平05.0=α下,检验不同燃料(因素)A 、不同推进器(因素)B 下射程是否有显著差异?交互作用是否显著? 操作步骤: 1.在excel 的工作表中输入如表3.1所示的的样本数据。 2.点击“工具—数据分析—方差分析:可重复双因素方差分析”,在弹出对话框的输入区域,拖动鼠标选择样本值A1:D9;每一样本的行数,输入2;显著性水平α设置为0.05,如图 3.1所示。

3.点击确定,输出参数的窗口如图3.2所示。 图3.2 应用excel“数据分析”功能求双因素等重复方差分析的有关参数结果分析: 图3.2 中仅列示了输出结果中的方差分析表。“样本”即燃料因子,“列”即推进器因子,“交互”为燃料和推进器因子的交互作用,SS 为平方和;df 是自由度;P-value 为P 值,即所达到的临界显著水平;F crit 是Fα(t-1,N-t)的值。 由方差分析表可知,因子A (燃料)的作用是一般显著的(P-value的值为0.025969<0.05);因子B(推进器)的作用是高度显著的(P-value的值为0.003506<0.01);而交互作用是极其显著的(P-value的值为6.15E-05<<0.01),这说明燃料的作用于与推进器之间有着密切的关 系,也即每种推进器都有各自最合自得最佳燃料。

SPSS多因素方差分析

体育统计与SPSS读书笔记(八)—多因素方差分析(1) 具有两个或两个以上因素的方差分析称为多因素方差分析。 多因素是我们在试验中会经常遇到的,比如我们前面说的单因素方差分析的时候,如果做试验的不是一个年级,而是多个年纪,那就成了双因素了:不同教学方法的班级,不同年级。如果再加上性别上的因素,那就成了三因素了。如果我们把实验前和试验后的数据用一个时间的变量来表示,那又多了一个时间的因素。如果每个年级都是不同的老师来上,那又多了一个老师的因素,等等等等,所以我们在设计试验的时候都要进行充分考虑,并确定自己只研究哪些因素。 下面用例子的形式来说说多因素方差分析的运用。还是用前面说单因素的例子,前面的例子说了只在五年级抽三个班进行不同教学方法的试验,现在我们还要在初二和高二各抽三个班进行不同教学方法的试验。形成年级和不同教学法班级双因素。 分析: 1.根据实验方案我们划出双因素分析的表格,可以看出每个单元格都是有重复数据(也就是不只一个数据), 年级 不同教学方法的班级 定性班 定量班 定性定量班 五年级 (班级每个人) (班级每个人) (班级每个人) 初中二年级 (班级每个人) (班级每个人) (班级每个人) 高中二年级 (班级每个人) (班级每个人) (班级每个人) 2.因为有重复数据,所以存在在数据交互效应的可能。我们来看看交效应的含义:如果在A因素的不同水平上,B因素对因变量的影响不同,则说明A、B两因素间存在交互作用。交互作用是多因素实验分析的一个非常重要的内容。如因素间存在交互作用而又被忽视,则常会掩盖因素的主效应的显著性,另一方面,如果对因变量Y,因素A与B之间存在交互作用,则已说明这两个因素都Y对有影响,而不管其主效应是否具有显著性。在统计模型中考虑交互作用,是系统论思想在统计方法中的反映。在大多数场合,交互作用的信息比主效应的信息更为有用。根据上面的判断。根据上面的说法,我也无法判断是否有交互作用,不像身高和体重那么直接。这里假设他们之间有交互作用。

spss教程第二章均值比较检验与方差分析要点

第二章均值比较检验与方差分析 在经济社会问题的研究过程中,常常需要比较现象之间的某些指标有无显著差异,特别当考察的样本容量n比较大时,由随机变量的中心极限定理知,样本均值近似地服从正态分布。所以,均值的比较检验主要研究关于正态总体的均值有关的假设是否成立的问题。 ◆本章主要内容: 1、单个总体均值的 t 检验(One-Sample T Test); 2、两个独立总体样本均值的 t 检验(Independent-Sample T Test); 3、两个有联系总体均值均值的 t 检验(Paired-Sample T Test); 4、单因素方差分析(One-Way ANOVA); 5、双因素方差分析(General Linear Model Univariate)。 ◆假设条件:研究的数据服从正态分布或近似地服从正态分布。 在Analyze菜单中,均值比较检验可以从菜单Compare Means,和General Linear Model得出。如图2.1所示。 图2.1 均值的比较菜单选择项 §2.1 单个总体的t 检验(One-Sample T Test)分析 单个总体的 t 检验分析也称为单一样本的 t 检验分析,也就是检验单个变量的均值是否与假定的均数之间存在差异。如将单个变量的样本均值与假定的常数相比较,通过检验得出预先的假设是否正确的结论。

例1:根据2002年我国不同行业的工资水平(数据库SY-2),检验国有企业的职工平均年工资收入是否等于10000元,假设数据近似地服从正态分布。 首先建立假设:H0:国有企业工资为10000元; H1:国有企业职工工资不等于10000元 打开数据库SY-2,检验过程的操作按照下列步骤: 1、单击Analyze →Compare Means →One-Sample T Test,打开One-Sample T Test 主对话框,如图2.2所示。 图2.2 一个样本的t检验的主对话框 2、从左边框中选中需要检验的变量(国有单位)进入检验框中。 3、在Test Value框中键入原假设的均值数10000。 4、单击Options按钮,得到Options对话框(如图2.3),选项分别是置信度(默认项是95%)和缺失值的处理方式。选择后默认值后返回主对话框。 图2.3 一个样本t检验的Options对话框 5、单击OK,得输出结果。如表2.1所示。 表2.1(a).数据的基本统计描述 One-Sample Statistics

实验二方差分析剖析

实验报告 课程名称:_______统计软件___________ 学院名称:___ _数学与应用数学_______ 班级:___ ______________ 姓名:_______ _____________ 学号:_____ __________ _ 2015-2016 _ 学年第 ___ 一_ __学期数学与统计学院制

variety wsc variety wsc variety wsc variety wsc a1 20.19 a3 4.08 a5 39.38 a7 16.04 a1 21.03 a3 4.40 a5 38.95 a7 15.86 a2 36.06 a4 17.23 a6 30.04 a2 38.97 a4 16.85 a6 28.68 解: 程序如下(其中数据集为L3.anova5_1): 主要输出结果如下: (图4.1) (图4.2)

(图4.3) (图4.4) (图4.5) 结果分析: (1) 用过程univariate判断正态性 从图4.1知, Pr < W 的p值为 0.1694,可判断wsc服从正态分布. (2)用过程ANOVA ,检验是否存在显著性差异 从图4.2知,p <.0001, 可判断存在显著性差异 (3) 用MEANS variety / duncan,可具体的看哪些水平存在差异. 从图4.3知,(a2, a5), a6, a1, (a4,a7), a3 它们之间存在差异。 (4) 用MEANS variety /Dunnett ('a1'),可分析它们与对照组‘a1’的差异是否显著。

从图4.4知,由于检验时都出现了‘***’,说明它们与对照组‘a1’的差异是显著的。 (5) 用过程NPAR1WAY进行非参数检验.看是否存在显著性差异,以及哪个水平是最好的. 从图4.5可看出,在0.05的水平下,各水平之间存在差异,且(a5, a2)的水平是最高的。 例 2 在组织培养过程中采用两种激素(KT、2,4-D)的不同浓度配比,通过观测材料的生根比例,选则合适某实验品种的配比。设计浓度及观测到的生根比例如下表: 0 0.05 0.10 2,4浓度 (d24) KT浓度 0 0.05 0.10 0 0.05 0.10 0 0.05 0.10 (kt) 重复1 0.24 0.35 0.38 0.20 0.25 0.36 0.28 0.50 0.30 重复2 0.26 0.31 0.35 0.21 0.21 0.35 0.20 0.51 0.31 重复3 0.25 0.32 0.35 0.22 0.26 0.34 0.21 0.52 0.32 解: 程序如下:

第2章单因素方差分析

第12章方差分析(Analysis of V ariance) 方差分析是鉴别各因素效应的一种有效统计方法,它是通过实验观察某一种或多种因素的变化对实验结果是否带来显著影响,从而选取最优方案的一种统计方法。 在科学实验和生产实践中,影响一件事物的因素往往很多,每一个因素的改变都有可能影响产品产量和质量特征。有的影响大些,有的影响小些。为了使生产过程稳定,保证优质高产,就有必要找出对产品质量有显著影响的那些因素及因素所处等级。方差分析就是处理这类问题,从中找出最佳方案。 方差分析开始于本世纪20年代。1923年英国统计学家R.A. Fisher 首先提出这个概念,(ANOV A)。因当时他在Rothamsted农业实验场工作,所以首先把方差分析应用于农业实验上,通过分析提高农作物产量的主要因素。Fisher1926年在澳大利亚去世。现在方差分析方法已广泛应用于科学实验,医学,化工,管理学等各个领域,范围广阔。 在方差分析中,把可控制的条件称为“因素”(factor),把因素变化的各个等级称为“水平”或“处理”(treatment)。 若是试验中只有一个可控因素在变化,其它可控因素不变,称之为单因素试验,否则是多因素试验。下面分别介绍单因素和双因素试验结果的方差分析。 1.1 单因素方差分析(One Way Analysis of Variance) 1.一般表达形式 2.方差分析的假定前提 3.数学模形 4.统计假设 5.方差分析:(1)总平方和的分解;(2)自由度分解;(3)F检验 6.举例 7.多重比较 1.1.1 一般表达形式 首先通过一个例子引出单因素方差分析方法。某农业科研所新培养了四种水稻品种,分别用A1,A2,A3,A4表示。每个品种随机选种在四块试验田中,共16块试验田。除水稻品种之外,尽量保持其它条件相同(如面积,水分,日照,肥量等),收获后计算各试验田中产量如下表: 通过这些数据要考察四个不同品种的单位产量,是否有显著性差异。类似的例子很多,如劳动生产率差异,汽车燃油消耗,金属材料淬火温度等问题。上述问题可控实验条件是“种子”。所以种子是因素。把不同的品种A1,A2,A3,A4称为“水平”。1,2,3,4表示试验

SPSS多因素方差分析

体育统计与SPSS读书笔记(八)—多因素方差分析(1) 具有两个或两个以上因素的方差分析称为多因素方差分析。 多因素是我们在试验中会经常遇到的,比如我们前面说的单因素方差分析的 时候,如果做试验的不是一个年级,而是多个年纪,那就成了双因素了:不同教学方法的班级,不同年级。如果再加上性别上的因素,那就成了三因素了。如果我们把实验前和试验后的数据用一个时间的变量来表示,那又多了一个 时间的因素。如果每个年级都是不同的老师来上,那又多了一个老师的因素,等等等等,所以我们在设计试验的时候都要进行充分考虑,并确定自己只研究哪些因素。 下面用例子的形式来说说多因素方差分析的运用。还是用前面说单因素的例子,前面的例子说了只在五年级抽三个班进行不同教学方法的试验,现在我们还要在初二和高二各抽三个班进行不同教学方法的试验。形成年级和不同教学法班级双因素。 分析: 1.根据实验方案我们划出双因素分析的表格,可以看出每个单元格都是有重复数据(也就是不只一个数据), 年级 不同教学方法的班级 定性班 定量班 定性定量班 五年级 (班级每个人) (班级每个人) (班级每个人) 初中二年级 (班级每个人) (班级每个人) (班级每个人) 高中二年级 (班级每个人) (班级每个人) (班级每个人) 2.因为有重复数据,所以存在在数据交互效应的可能。我们来看看交效应的含义:如果在A因素的不同水平上,B因素对因变量的影响不同,则说明A、B两因素间存在交互作用。交互作用是多因素实验分析的一个非常重要的内容。如因素间存在交互作用而又被忽视,则常会掩盖因素的主效应的显著性,另一方面,如果对因变量Y,因素A与B之间存在交互作用,则已说明这两个因素都Y对有影响,而不管其主效应是否具有显著性。在统计模型中考虑交互作用,是系统论思想在统计方法中的反映。在大多数场合,交互作用的信息比主效应的信息更为有用。根据上面的判断。根据上面的说法,我也无法判断是否有交互作用,不像身高和体重那么直接。这里假设他们之间有交互作用。

双因素方差分析习题

1. 某湖水在不同季节氯化物含量测定值如表6.16所示。问不同季节氯化物含量有无差别? 若有差别,进行32个水平的两两比较。 解: 2.有三种抗凝剂(123,,A A A )对一标本作红细胞沉降速度(一小时值)测定,每种抗凝剂 3.将18名原发性血小板减少症患者按年龄相近的原则配为6个单位组,每个单位组中的3名患者随机分配到A 、B 、C 三个治疗组中,治疗后的血小板升高情况见表6.17,问3中治疗方法的疗效有无差别? 表6.17 不同人用鹿茸后血小板的升高值/(4 3 10/mm ) 解: 4.某研究人员以0.3mL/kg 剂量纯苯给大鼠皮下注射染毒,每周3次,经45天后,实验动物白细胞综述下降至染毒前的50%左右,同时设置未染毒组。两组大鼠均按照是否给予升高白

细胞药物分为给药组和不给药组,试验结果见表6.18,试作统计分析。 解: 问:(1)这三类人的该项生理指标有差别吗?() α=) (2)如果有差别,请进行多重比较分析。(0.05 解: 6.将24家生产产品大致相同的企业,按资金分为三类,每个公司的每100元销售收入的生产成本(单位:元)如表6.20所示。这些数据能否说明三类公司的市场生产成本有差异(假 α=) 定生产成本服从正态分布,且方差相同)?(0.05 解: 7.为了解三种不同配比的饲料对仔猪影响的差异,对三种不同品种的猪各选三头进行试验,分别测得其三个月间体重增加量如表6.21所示。假定其体重增加量服从正态分布,且1方 α=) 差相同。试分析不同饲料与不同品种对猪生长有无显着差异?(0.05

8.比较3种化肥(A,B两种新型化肥和传统化肥)施撒在三种类型(酸性、中性和碱性)的土地上对作物的产量情况有无差别,将每块土地分成6块小区,施用A,B两种新型化肥和传统化肥,收割后,测量各组作物的产量,得到的数据如表6.22所示、化肥、土地类型 α=) 及其它们的交互作用对作物产量有影响吗?(0.05 -

第10章__方差分析与试验设计

第10章 方差分析与试验设计 三、选择题 1. C 2. B 3. A 4. B 5. C 1.方差分析的主要目的是判断 ( )。 A. 各总体是否存在方差 B. 各样本数据之间是否有显著差异 C. 分类型自变量对数值型因变量的影响是否显著 D. 分类型因变量对数值型自变量的影响是否显著 2.在方差分析中,检验统计量F是 ( )。 A. 组间平方和除以组内平方和 B. 组间均方除以组内均方 C. 组间平方除以总平方和 D. 组间均方除以总均方 3.在方差分析中,某一水平下样本数据之间的误差称为 ( )。 A. 随机误差 B. 非随机误差 C. 系统误差 D. 非系统误差 4.在方差分析中,衡量不同水平下样本数据之间的误差称为 ( )。 A. 组内误差 B. 组间误差 C. 组内平方 D. 组间平方 5.组间误差是衡量不同水平下各样本数据之间的误差,它 ( )。 A. 只包括随机误差 B. 只包括系统误差 C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差 6. A 7. D 8. D 9. A 10.A 6.组内误差是衡量某一水平下样本数据之间的误差,它 ( )。 A. 只包括随机误差 B. 只包括系统误差 C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差 7.在下面的假定中,哪一个不属于方差分析中的假定 ( )。 A. 每个总体都服从正态分布 B. 各总体的方差相等 C. 观测值是独立的 D. 各总体的方差等于0 8.在方差分析中,所提出的原假设是210:μμ=H = ···=k μ,备择假设是( ) A. ≠≠H 211:μμ···k μ≠ B. >>H 211:μμ· ··k μ> C. <

第10章__方差分析与试验设计

第10章方差分析与试验设计 三、选择题 1.C 2.B 3.A 4.B 5.C 1.方差分析的主要目的是判断()。 A.各总体是否存在方差 B.各样本数据之间是否有显著差异 C.分类型自变量对数值型因变量的影响是否显著 D.分类型因变量对数值型自变量的影响是否显著 2.在方差分析中,检验统计量F是()。 A.组间平方和除以组内平方和B.组间均方除以组内均方 C.组间平方除以总平方和D.组间均方除以总均方 3.在方差分析中,某一水平下样本数据之间的误差称为()。 A.随机误差B.非随机误差C.系统误差D.非系统误差 4.在方差分析中,衡量不同水平下样本数据之间的误差称为()。 A.组内误差B.组间误差C.组内平方D.组间平方 5.组间误差是衡量不同水平下各样本数据之间的误差,它()。 A.只包括随机误差 B.只包括系统误差 C.既包括随机误差,也包括系统误差 D.有时包括随机误差,有时包括系统误差 6.A 7.D8.D9.A10.A 6.组内误差是衡量某一水平下样本数据之间的误差,它()。 A.只包括随机误差 B.只包括系统误差 C.既包括随机误差,也包括系统误差 D.有时包括随机误差,有时包括系统误差 7.在下面的假定中,哪一个不属于方差分析中的假定()。 A.每个总体都服从正态分布B.各总体的方差相等 C.观测值是独立的D.各总体的方差等于0 8.在方差分析中,所提出的原假设是0:=···= ,备择假设是() 12 k A.1:12···kB.1:12···k C. 1:···kD.1:1,2,···,k不全相等 12 9.单因素方差分析是指只涉及()。 A.一个分类型自变量B.一个数值型自变量 C.两个分类型自变量D.两个数值型因变量 10.双因素方差分析涉及()。 A.两个分类型自变量B.两个数值型自变量 C.两个分类型因变量D.两个数值型因变量 11.B12.C

两因素方差分析检验

, 本科学生实验报告 学号:……………………姓名:****** 学院:生命科学学院专业、班级:11级应用生物教育A班 实验课程名称: 生物统计学实验 教师: 孟丽华(教授) 开课学期: 2012至2013学年下学期 填报时间: 2013年5月15日 云南师范大学教务处编印 实验序号及名称:实验九:为了选出某物质较为适宜得条件得两因素方差分析检验 实验时间20130510 实验室睿智楼3幢326 (一)、实验目得: 1、能够熟练得使用SPSS进行二因素方差分析; 2、通过本次试验理解二因素方差分析得概念与思想,理解多个因素存在交互效应得统计学含义与实际含义; 3、了解方差分析分解得理论基础与计算原理,能够熟练应用单因素方差分析对具体得实际问题进行有效得分析,通过测量数据研究各个因素对总体得影响效果,判定因素在总变异中得重要程度; 4、进一步熟悉SPSS软件得应用。 (二)、实验设备及材料: 微机、SPSS for Windows V18、0统计软件包及相应得要统计得数据 (三)、实验原理: 1、两因素方差分析主要用来检测两个自变量之间得就是否有显著得影响,检测不同

/INTERCEPT=INCLUDE /POSTHOC=原料温度(SNK) /PLOT=PROFILE(原料*温度) /EMMEANS=TABLES(OVERALL) /EMMEANS=TABLES(原料) PARE ADJ(LSD) /EMMEANS=TABLES(温度) PARE ADJ(LSD) /EMMEANS=TABLES(原料*温度) /PRINT=OPOWER ETASQ HOMOGENEITY DESCRIPTIVE PARAMETER /PLOT=SPREADLEVEL /CRITERIA=ALPHA(、05) /DESIGN=原料温度原料*温度、 方差得单变量分析 表1 主体间因子 值标签N 原料 1 A1 12 2 A2 12 3 A3 12 温度 1 B1(30℃) 12 2 B2(35℃) 12 3 B3(40℃) 12 表2 误差方差等同性得 Levene 检验a 因变量:适宜得条件 F df1 df2 Sig、 1、367 8 27 、255 检验零假设,即在所有组中因变量得误差方差均相 等。 a、设计 : 截距 + 原料 + 温度 + 原料 * 温度 表3 描述性统计量 因变量:适宜得条件 原料温度均值标准偏差N A1 B1(30℃) 34、50 12、583 4 B2(35℃) 18、25 7、274 4 B3(40℃) 18、00 8、641 4 总计23、58 11、958 12 A2 B1(30℃) 49、00 7、874 4

SPSS软件解决-多因素方差分析

多因素方差分析 多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。SPSS调用“Univariate”过程,检验不同水平组合之间因变量均数,由于受不同因素影响是否有差异的问题。在这个过程中可以分析每一个因素的作用,也可以分析因素之间的交互作用,以及分析协方差,以及各因素变量与协变量之间的交互作用。该过程要求因变量是从多元正态总体随机采样得来,且总体中各单元的方差相同。但也可以通过方差齐次性检验选择均值比较结果。因变量和协变量必须是数值型变量,协变量与因变量不彼此独立。因素变量是分类变量,可以是数值型也可以是长度不超过8的字符型变量。固定因素变量(Fixed Factor)是反应处理的因素;随机因素是随机地从总体中抽取的因素。 [例子] 研究不同温度与不同湿度对粘虫发育历期的影响,得试验数据如表5-7。分析不同温度和湿度对粘虫发育历期的影响是否存在着显著性差异。 表5-7 不同温度与不同湿度粘虫发育历期表 数据保存在“DATA5-2.SAV”文件中,变量格式如图5-1。

1)准备分析数据 在数据编辑窗口中输入数据。建立因变量历期“历期”变量,因素变量温度“A”,湿度为“B”变量,重复变量“重复”。然后输入对应的数值,如图5-6所示。或者打开已存在的数据文件“DATA5-2.SAV”。 图5-6 数据输入格式 2)启动分析过程 点击主菜单“Analyze”项,在下拉菜单中点击“General Linear Model”项,在右拉式菜单中点击“Univariate”项,系统打开单因变量多因素方差分析设置窗口如图5-7。

图5-7 多因素方差分析窗口 3)设置分析变量 设置因变量:在左边变量列表中选“历期”,用向右拉按钮选入到“Dependent Variable:”框中。 设置因素变量:在左边变量列表中选“a”和“b”变量,用向右拉按钮移到“Fixed Factor(s):”框中。可以选择多个因素变量。由于内存容量的限制,选择的因素水平组合数(单元数)应该尽量少。 设置随机因素变量:在左边变量列表中选“重复”变量,用向右拉按钮移到“到Random Factor(s)”框中。可以选择多个随机变量。 设置协变量:如果需要去除某个变量对因素变量的影响,可将这个变量移到“Covariate(s)”框中。 设置权重变量:如果需要分析权重变量的影响,将权重变量移到“WLS Weight”框中。 4)选择分析模型 在主对话框中单击“Model”按钮,打开“Univariate Model”对话框。见图5-8。

相关主题
文本预览
相关文档 最新文档