两因素方差分析检验
- 格式:doc
- 大小:508.50 KB
- 文档页数:14
两因素方差分析-SPSS教程一、问题与数据某研究者已知受教育程度可以影响幸福指数,即如果将研究对象的受教育程度分为高中及以下、大学本科和硕士研究生及以上3个等级(级别依次递增),那么他们的幸福指数会随着受教育程度的增加而增加。
目前,该研究者拟进一步分析研究对象这种受教育程度与幸福指数的相关关系是否受性别影响。
研究者招募了58位研究对象,包括28位男性和30位女性。
每一类性别中,研究对象的受教育程度由均分为3类(高中及以下、大学本科和硕士研究生及以上)。
该研究者采用问卷测量研究对象的幸福指数,研究对象得分在0-100之间分布,分数越高,幸福指数越强。
最终收集了研究对象的幸福指数(Index)、性别(gender)和受教育程度(education)等变量信息,部分数据如图1。
图1 部分数据二、对问题分析研究者已知一个自变量(受教育程度)对因变量(幸福指数)的影响,想判断另一个自变量(性别)对这一相关关系是否存在作用。
针对这种情况,我们可以使用两因素方差分析,但需要先满足6项假设:假设1:因变量是连续变量。
假设2:存在两个自变量,且都是分类变量。
假设3:具有相互独立的观测值。
假设4:任一分类中不存在显著异常值。
假设5:任一分类中残差近似正态分布。
假设6:任一分类都具有等方差性。
假设1-3主要和研究设计有关,经分析,本研究数据满足假设1-3,那么应该如何检验假设4-6,并进行两因素方差分析呢?三、SPSS操作3.1 生成检验假设4-6的新变量检验假设4-6需要用到残差,因此我们先运行两因素方差分析的SPSS操作,得到主要结果和相应残差变量后,再逐一进行对假设的检验。
在主界面点击Analyze→General Linear Model→Univariate,分别将Index 放入Dependent Variable栏,gender和education放入Fixed Factor(s)栏。
如图2。
图2 Univariate点击Plots,分别将gender和education放入Separate Lines和Horizontal Axis栏。
双因素的多重比较方法生物工程 10212575 陈晓穗摘要:本文首先扼要地介绍了多重比较的方法种类,其次引用了一个实例具体地展示了无交叉相互作用的双因素的多重比较方法。
关键词:最小显著差数法 最小显著极差法 双因素 多重比较1.前言用方差分析检验样本的差异是否显著后,获得了显著或极显著的结论。
此时人们便想进一步的了解具体到哪些平均数间有显著差异,哪些不显著。
这就有必要进行两两地比较平均数,以判断这两组数据的显著差异性。
统计学把多个平均数两两间互相比较称为多重比较。
多重比较常有的方法有:最小显著差数法和最小显著极差法。
2.多重比较法 2.1 多重比较法的种类 2.1.1 最小显著差数法最小显著差数法,简称LSD 。
它其实只是t 检验的一个简单变形,并未对检验水准做出任何校正,只是在标准误的计算上充分利用了样本信息, 为所有组的均数统一估计出了一个更为稳健的标准误,其中MS 误差是方差分析中计算得来的组内均方,它一般用于计划好的多重比较。
由于单次比较的检验水准仍为α,因此可认为LSD 法是最灵敏的。
此法的基本作法是:在F 检验显著的前提下,先计算出显著水平为α的最小显著差数αLSD ,然后将任意两个处理平均数的差数的绝对值..j i x x -与其比较。
若..j i x x ->LSDa 时,则.i x 与.j x 在α水平上差异显著;反之,则在α水平上差异不显著。
最小显著差数由..)(j i e x x df a a S t LSD -=计算。
式中)(e df t α为在F 检验中误差自由度下,显著水平为α的临界t 值,..j i x x S -为均数差异标准误,由n MS S e x x j i /2..=-算得。
其中e MS 为F 检验中的误差均方,n 为各处理的重复数。
当显著水平α=0.05和0.01时,从t 值表中查出)(05.0e df t 和)(01.0e df t ,代入式得:....)(01.001.0)(05.005.0ji e ji e x x df x x df S t LSD S t LSD --==2.1.2 最小显著极差法最小显著极差法,简称LSR 。
双因素方差分析一、双因素方差分析的含义和类型(一)双因素方差分析的含义和内容在实际问题的研究中,有时需要考虑两个因素对实验结果的影响。
例如上一节中饮料销售量的例子,除了关心饮料颜色之外,我们还想了解销售地区是否影响销售量,如果在不同的地区,销售量存在显著的差异,就需要分析原因,采用不同的推销策略,使该饮料品牌在市场占有率高的地区继续深入人心,保持领先地位,在市场占有率低的地区,进一步扩大宣传,让更多的消费者了解,接受该产品。
在方差分析中,若把饮料的颜色看作影响销售量的因素A,饮料的销售地区看作影响因素B。
同时对因素A和因素B进行分析,就称为双因素方差分析。
双因素方差分析的内容包括:对影响因素进行检验,究竟一个因素在起作用,还是两个因素都起作用,或是两个因素的影响都不显著。
双因素方差分析的前提假定:采样地随机性,样本的独立性,分布的正态性,残差方差的一致性。
(二)双因素方差分析的类型双因素方差分析有两种类型:一个是无交互作用的双因素方差分析,它假定因素A 和因素B的效应之间是相互独立的,不存在相互关系;另一个是有交互作用的双因素方差分析,它假定因素A和因素B的结合会产生出一种新的效应。
例如,若假定不同地区的消费者对某种品牌有与其他地区消费者不同的特殊偏爱,这就是两个因素结合后产生的新效应,属于有交互作用的背景;否则,就是无交互作用的背景。
有交互作用的双因素方差分析已超出本书的范围,这里介绍无交互作用的双因素方差分析。
1.无交互作用的双因素方差分析。
无交互作用的双因素方差分析是假定因素A和因素B的效应之间是相互独立的,不存在相互关系;2.有交互作用的双因素方差分析。
有交互作用的双因素方差分析是假定因素A和因素B的结合会产生出一种新的效应。
例如,若假定不同地区的消费者对某种颜色有与其他地区消费者不同的特殊偏爱,这就是两个因素结合后产生的新效应,属于有交互作用的背景,否则,就是无交互作用的背景。
二、数据结构方差分析的基本思想:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
第三节随机区组设计的两因素方差分析(two-way ANOVA)1、用途:用于随机区组设计的多个样本均数比较,其统计推断是推断各样本所代表的各总体均数是否相等。
随机区组设计考虑了个体差异的影响,可分析处理因素和个体差异对实验效应的影响,所以又称两因素实验设计,比完全随机设计的检验效率高。
该设计是将受试对象先按配比条件配成配伍组(如动物实验时,可按同窝别、同性别、体重相近进行配伍),每个配伍组有三个或三个以上受试对象,再按随机化原则分别将各配伍组中的受试对象分配到各个处理组。
值得注意的是,同一受试对象不同时间(或部位)重复多次测量所得到的资料称为重复测量数据(repeated measurement data),对该类资料不能应用随机区组设计的两因素方差分析进行处理,需用重复测量数据的方差分析。
2、计算公式:随机区组设计的两因素方差分析是把总变异中的离均差平方和SS 与自由度分别分解成处理间、区组间和误差三部分,其计算公式见表5.4。
表5.4两因素方差分析的计算公式变异来源离均差平方和自由度均方总N-1处理间k-1区组间b-1误差* # b区组数3、分析步骤(以例说明):例5.2某医师研究A、B和C三种药物治疗肝炎的效果,将32只大白鼠感染肝炎后,按性别相同、体重接近的条件配成8个配伍组,然后将各配伍组中4只大白鼠随机分配到各组:对照组不给药物,其余三组分别给予A、B和C药物治疗。
一定时间后,测定大白鼠血清谷丙转氨酶浓度(IU/L),如表5.5。
问四组大白鼠的血清谷丙转氨酶是否相同。
表5.5 四组大白鼠血清谷丙转氨酶浓度(IU/L)区组对照组试验组合计A药组B药组C药组1 845.1 652.4 624.3 445.1 2566.92 834.7 741.3 772.3 432.5 2780.83 826.5 675.6 632.5 362.7 2497.34 812.8 582.8 473.6 348.7 2217.95 782.8 491.8 462.8 345.9 2083.36 745.6 412.2 431.8 312.8 1902.47 730.4 494.6 484.9 296.3 2006.28 684.3 379.5 380.7 228.4 1672.96262.2 4430.2 4262.9 2772.4 17727.7 ()782.78 553.78 532.86 346.55 553.99()4925110.04 2571668.14 2391246.57 995764.14 10883788.89 ()本研究的主要目的在于比较不同治疗方法的效果,同时还可以比较不同区组间大鼠血清谷丙转氨酶浓度是否相同。
. . , 本科学生实验报告
学号:……………………姓名:****** 学院:生命科学学院 专业、班级:11级应用生物教育A班 实验课程名称: 生物统计学实验 教 师: 孟丽华(教授) 开 课 学 期: 2012至2013学年 下学期 填 报 时 间: 2013年5月15日 云南师范大学教务处编印 一.实验设计方案 实验序号及名称:实验九:为了选出某物质较为适宜的条件的两因素方差分析检验
实验时间 2013-05-10 实验室 睿智楼3幢326 (一)、实验目的: 1、能够熟练的使用SPSS进行二因素方差分析;
2、通过本次试验理解二因素方差分析的概念和思想,理解多个因素存在交互效应的统计学含义和实际含义; 3、了解方差分析分解的理论基础和计算原理,能够熟练应用单因素方差分析对具体的实际问题进行有效的分析,通过测量数据研究各个因素对总体的影响效果,判定因素在总变异中的重要程度; 4、进一步熟悉SPSS软件的应用。 (二)、实验设备及材料: 微机、SPSS for Windows V18.0统计软件包及相应的要统计的数据
(三)、实验原理:
1、两因素方差分析主要用来检测两个自变量之间的是否有显著的影响,检测不同. . 组合之间哪种最显著; 2、两因素方差分析有两种类型:一个是无交互作用的双因素方差分析,它假定因素A和因素B的效应之间是相互独立的,不存在相互关系;另一个是有交互作用的双因素方差分析,它假定因素A和因素B的结合会产生出一种新的效应; 3、双因素方差分析的前提假定:采样地随机性,样本的独立性,分布的正态性,残差方差的一致性; 4、比较观测变量总离差平方和各部分的比例,在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由于控制变量引起的,可以主要由控制变量来解释,即控制变量给观测变量带来了显著影响; 5、两因素方差分析:(一)、交叉分组资料的方差分析:设试验考察A、B两个因素,A因素分个水平,B因素分b个水平。所谓交叉分组是指A因素每个水平与B因素的每个水平都要碰到,两者交叉搭配形成b个水平组合即处理,试验因素A、B在试验中处于平等地位,试验单位分成b个组,每组随机接受一种处理,因而试验数据也按两因素两方向分组。这种试验以各处理是单独观测值还是有重复观测值又分为两种类型:1)、两因素单独观测值试验资料的方差分析对于A、B两个试验因素的全部b个水平组合,每个水平组合只有一个观测值,全试验共有b个观测值;2)、两因素有重复观测值试验的方差分析对两因素和多因素有重复观测值试验结果的分析,能研究因素的简单效应、主效应和因素间的交互作用(互作)效应;(二)、无交互作用的双因素试验的方差分析:1)、基本假设:方差齐性和相互独立;2)、线性统计模型: ,其中 ,所有期望值的总平均: , 要分析因素A,B的差异对试验结果是否有显著影响,即为检验如下假设是否成立: , ;
ijijijX111abijijab11biijija
0112:0aH0212:0bH. . 6、两因素方差分析的进一步分析:1)、方差齐性检验:由于方差分析的前提是各水平下的总体服从正态分布并且方差相等,因此有必要对方差齐性进行检验,即对控制变量不同水平下各观测变量不同总体方差是否相等进行分析。SPSS单因素方差分析中,方差齐性检验采用了方差同质性(Homogeneity of Variance)的检验方法,其零假设是各水平下观测变量总体方差无显著性差异,实现思路同SPSS两独立样本t检验中的方差齐性检验;2)、多重比较检验:多重比较检验就是分别对每个水平下的观测变量均值进行逐对比较,判断两均值之间是否存在显著差异。其零假设是相应组的均值之间无显著差异;3)、其他检验:①先验对比检验,②趋势检验; 7、方差分析与t检验的区别:t检验只适宜检验两个平均数之间是否存在差异。对于一个复杂的问题,t检验只能进行多组平均数两两之间的差异检验。而方差分析可以同时检验两个或多个平均数之间的差异以及几个因素水平之间的交互作用; 8、有时原始资料不满足方差分析的要求,除了求助于非参数检验方法外,也可以考虑变量变换。常用的变量变换方法有:对数转换:用于服从对数正态分布的资料等;平方根转换:可用于服从Possion分布的资料等;平方根反正弦转换:可用于原始资料为率,且取值广泛的资料;其它:平方变换、倒数变换、Box-Cox变换等。 (四)、实验内容: 内容:生物统计学(第四版)121页第六章习题 6.7 实验方法步骤
1、启动spss软件:开始→所有程序→SPSS→spss for windows→spss 18.0 for windows,直接进入SPSS数据编辑窗口进行相关操作;
2、定义变量,输入数据。点击“变量视图”定义变量工作表,用“name”命令定义变量“适宜的条件”(小数点零位);变量“原料”(小数点零位),“A1”赋值为“1”,. . “A2”赋值为“2” ,“A3”赋值为“3” , 变量“温度”(小数点零位),“B1(30℃)”赋值为“1”,“B2(35℃)”赋值为“2” ,“B3(40℃)”赋值为“3”,点击“变量视图工作表”,一一对应将不同“原料”与“温度”的适宜的条件的数据依次输入到单元格中;
3、设置分析变量。数据输入完后,点菜单栏:“分析(A)”→“一般线性模型(G)”→“单变量(U)…”,将“适宜的条件”移到因变量列表(E)中,将“原料”及“温度”移入固定因子(F)的列表中进行分析; 1)、点“模型(M)…”,指定因子:“全因子”前打钩,“在模型中包含截距”前打钩,(默认),点“继续”; 2)、点“绘制(T)…”:将“原料”移入“水平轴”列表中,将“温度”移入“单图”中; 3)、点“两两比较(H)…”,将因子“原料”和“温度”移入“两两比较检验”列表中,①假定方差齐性:点“S-N-K(S)”法检验;②未假定方差齐性,点“Tamhane’s T2(M)”,点“继续”,然后点“确定”,便出结果; 4)、点“选项(O)…”,估计边际均值:将“因子与因子交互”列表中的“OVERLL”、“原料”、“温度”、“原料*温度”移入“显示均值”列表中,在“比较主效应”前打钩,输出:在“描述统计”、“方差齐性检验”、“功能估计”、“分布-水平图”、“检验效能”、“参数估计”前打钩,显著水平:0.05(默认),点“继续”,然后点击“确定”便出结果; .
. 模型(M)…: 绘制(T)… 两两比较(H)… .
. 选项(O)… 4、表格绘制出来后,进行检查修改,将其复制到实验报告中,将虚框隐藏等; 5、将所求的描述性统计指标数据表格保存,对其所求得的结果进行分析,书写实验报告。 (五)、实验结果: UNIANOVA 适宜的条件 BY 原料温度 /METHOD=SSTYPE(3) /INTERCEPT=INCLUDE /POSTHOC=原料温度(SNK) /PLOT=PROFILE(原料*温度) /EMMEANS=TABLES(OVERALL) /EMMEANS=TABLES(原料) COMPARE ADJ(LSD) /EMMEANS=TABLES(温度) COMPARE ADJ(LSD) /EMMEANS=TABLES(原料*温度) /PRINT=OPOWER ETASQ HOMOGENEITY DESCRIPTIVE PARAMETER /PLOT=SPREADLEVEL /CRITERIA=ALPHA(.05) /DESIGN=原料温度原料*温度.
方差的单变量分析 表1 主体间因子 值标签 N . . 原料 1 A1 12 2 A2 12 3 A3 12 温度 1 B1(30℃) 12 2 B2(35℃) 12 3 B3(40℃) 12 表2
误差方差等同性的 Levene 检验a 因变量:适宜的条件 F df1 df2 Sig. 1.367 8 27 .255 检验零假设,即在所有组中因变量的误差方差均相等。 a. 设计 : 截距 + 原料 + 温度 + 原料 * 温度 表3
描述性统计量 因变量:适宜的条件 原料 温度 均值 标准 偏差 N A1 B1(30℃) 34.50 12.583 4 B2(35℃) 18.25 7.274 4 B3(40℃) 18.00 8.641 4 总计 23.58 11.958 12 A2 B1(30℃) 49.00 7.874 4 B2(35℃) 37.50 4.203 4 B3(40℃) 15.50 5.972 4 总计 34.00 15.562 12 A3 B1(30℃) 45.25 8.016 4 B2(35℃) 46.00 7.071 4 B3(40℃) 27.00 6.055 4 总计 39.42 11.196 12 总计 B1(30℃) 42.92 10.900 12 B2(35℃) 33.92 13.413 12 B3(40℃) 20.17 8.167 12 总计 32.33 14.313 36 表4 主体间效应的检验 因变量:适宜的条件
源 III 型平方和 df 均方 F Sig. 偏 Eta 方 非中心 参数 观测到的幂b 校正模型 5513.500a 8 689.187 11.233 .000 .769 89.867 1.000