方差分析(包括三因素)
- 格式:ppt
- 大小:456.50 KB
- 文档页数:42
第六章方差分析方差分析是R.A.Fister发明的,用于两个及两个以上样本均数差别的显著性检验。
由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。
方差分析的基本思想是:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
方差分析主要用于:1、均数差别的显著性检验,2、分离各有关因素并估计其对总变异的作用,3、分析因素间的交互作用,4、方差齐性检验。
第一节Simple Factorial过程6.1.1 主要功能调用此过程可对资料进行方差分析或协方差分析。
在方差分析中可按用户需要作单因素方差分析(其结果将与第五章第四节相同)或多因素方差分析(包括医学中常用的配伍组方差分析);当观察因素中存在有很难或无法人为控制的因素时,则可对之加以指定以便进行协方差分析。
6.1.2 实例操作[例6-1]下表为运动员与大学生的身高(cm)与肺活量(cm3)的数据,考虑到身高与肺活量有关,而一般运动员的身高高于大学生,为进一步分析肺活量的差异是否由于体育锻6.1.2.1 数据准备激活数据管理窗口,定义变量名:组变量为group (运动员=1,大学生=2),身高为x ,肺活量为y ,按顺序输入相应数值,建立数据库,结果见图6.1。
图6.1 原始数据的输入6.1.2.2 统计分析激活 Statistics 菜单选ANOV A Models 中的Simple Factorial...项,弹出Simple Factorial ANOV A 对话框(图6.2)。
在变量列表中选变量y ,点击 钮使之进入Dependent 框;选分组变量group ,点击 钮使之进入Factor(s)框中, 并点击Define Range...钮在弹出的Simple Factorial ANOV A:Define Range 框中确定分组变量group 的起止值(1,2);选协变量x ,点击 钮使之进入Covariate(s)框中。
概念笔记Main effect 一个因素的独立效应,即其不同水平引起的方差变异。
三因素的实验有三个主效应。
把某一因素的一个水平同该因素的其他水平比较,不考虑其他因素。
Interaction 多个因素的联合效应,A因素的作用受到B因素的影响,即有交互——two-way interaction. 当一因素作用受到另外两个因素影响,即三因素交互three-way interaction.重复测量一个因素的三因素混合设计3*2*2的混合设计A3*B2*R2 【A, B为被试间因素】需要分析的有——A, B, R 各自主效应二重交互作用,A*B, A*R, B*R三重交互作用,A*B*C结果发现,A, B为被试间因素,交互作用SIG当二重交互作用SIG,需要进行simple effect检验。
A因素水平在B因素某一水平上的变异。
A在B1水平上的简单效应A在B2水平上的简单效应B在A1水平上的简单效应B在A2水平上的简单效应B在A3水平上的简单效应如果三重交互作用SIG,需要进行三因素的简单简单效应分析simple simple effect. 某一因素的水平在另外两个因素的水平结合上的效应在A1B1水平结合上,R1 与R2 差异在A1B2水平结合上,R1 与R2 差异在A2B1水平结合上,R1 与R2 差异在A2B2水平结合上,R1 与R2 差异在A3B1水平结合上,R1 与R2 差异在A3B2水平结合上,R1 与R2 差异重复测量方差分析之后,如果三重交互作用显著,需要编辑语法,得出三个因素各自的简单效应某一因素在其他两个因素的某一实验条件内的简单效应检验三因素重复测量方差分析对应的会有3种简单效应检验结果SPSS在输出简单效应检验结果的同时,也会报告多重比较结果,会有更直观的对比结果。
如果三重交互作用SIG,需要进行简单简单效应检验。
固定某两个因素水平组合,考察研究者最感兴趣的那个变量的效应。
MANOV A R1 R2 BY A(1,3) B(1,2)/WSFACTORS=R(2)/PRINT=CELLINFO(MEANS)/WSDESIGN/DESIGN/WSDESIGN=R/DESIGN=MWITHIN B(1) WITHIN A(1)MWITHIN B(2) WITHIN A(1)MWITHIN B(1) WITHIN A(2)MWITHIN B(2) WITHIN A(2)MWITHIN B(1) WITHIN A(3)MWITHIN B(2) WITHIN A(3)上述语法内容是检验被试内变量R在被试间变量A, B 上的简单简单效应。
1第6章⽅差分析1第6章⽅差分析⽅差分析是R. A. Fister 发明的,⽤于两个及两个以上样本均数差别的显著性检验. 由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,⼀是不可控的随机因素,另⼀是研究中施加的对结果形成影响的可控因素. ⽅差分析的基本思想是:通过分析研究中不同来源的变异对总变异的贡献⼤⼩,从⽽确定可控因素对研究结果影响⼒的⼤⼩.6.1 单因素⽅差分析我们把在实验中或在抽样时发⽣变化的“量”称为因素或因⼦. ⽅差分析的⽬的就是分析因⼦对实验或抽样的结果有⽆显著影响. 如果在实验中变化的因素只有⼀个,这时的⽅差分析称为单因素⽅差分析;在实验中变化的因素不只⼀个时,就称多因素⽅差分析. 双因素⽅差分析是多因素⽅差分析的最简单情形.因⼦在实验中的不同状态称作⽔平. 如果因⼦A 有r 个不同状态,就称它有r 个⽔平. 我们针对因素的不同⽔平或⽔平的组合,进⾏实验或抽取样本,以便了解因⼦的影响. 当⽅差分析的影响因⼦不唯⼀时,必要注意这些因⼦间的相互影响. 如果因⼦间存在相互影响,我们称之为“交互影响”;如果因⼦间是相互独⽴的,则称为⽆交互影响. 互影响有时也称为交互作⽤,是对实验结果产⽣作⽤的⼀个新因素,分析过程中有必要将它的影响作⽤也单独分离开来.6.1.1 单因素⽅差分析的模型假设设某单因素A 有r 种⽔平:1A ,2A ,…,r A ,在每种⽔平下的试验结果服从正态分布2(,)i N µσ(1,2,,i r = ). 在各⽔平下分别独⽴做了i n (1,2,,i r = )次试验,所得数据见表,其中ij x 表⽰表⽰第i 种⽔平下第j 个试验数据. 判断因素A 对试验结果是否有显著影响. 这⾥我们假定各种⽔平下的试验结果有相同的标准差σ. 单因素⽅差分析问题可以归结为以下的假设检验: 012:r H µµµ=== 1:H 12,,,r µµµ 不全相等表6-1 单因⼦试验表6.1.2 单因素⽅差分析的原理如何检验统计假设0H ?⼀般情况下,1µ,2µ,,r µ不全相同将反映在ij x (1,2,,;i r = 1,2,,)i j n = 取值的⼤⼩不同上,这时离差211()in r ij i j S x x ===?∑∑也⽐较⼤. 其中111in r ij i j x x n ===∑∑,1ri i n n ==∑. 但是我们还不能只从S ⽐较⼤就断定1µ,2µ,,r µ不全相同,因为在1µ,2µ,,r µ全相同时,由于试验中的随机误差影响,S 也可能取⽐较⼤的值. 为了区别这两种情况,先把离差S 作⼀个分解. 令 11in i ijj ix xn ==∑2112112211111122111()()()()2()()()()ii ii iin rT ij i j n rij i i i j n n n rr r ij i i ij i i i j i j i j n rrij i i i i j i S x x x x x x x x x x x x x x x x n x x ==============?=?+?=?+?+??=?+?∑∑∑∑∑∑∑∑∑∑∑∑∑ (5. 1)记上式分解的第⼀项为e S ,第⼆项为A S . 211()i n r e ij i i j S x x ===?∑∑ , 1(rA i i i S n x x ==?∑有T A e S S S =+即总离差T S 等于组内误差e S 与组间离差A S 之和.下⾯分析e S : 对任⼀指定的1i r ≤≤,21()in ij i j x x =?∑是⽔平i A 下试验数据的离差,是由随机因素造成的. e S 是所有⽔平下离差的和,因⽽也是由随机因素造成的.形成A S 除了随机因素外,如果1µ,2µ,,r µ不全相同,这个差异也要从A S 反映出来,⼀般A S 取⽐较⼤的值. 因此,将A S 和e S ⽐较,如果A S 不太⼤,我们只能认为A S 是由试验的随机误差形成的,从⽽接受0H ;如果A S 太⼤,我们便有理由怀疑A S 完全是由试验的随机误差形成的,认为1µ,2µ,,r µ不全相同,从⽽拒绝0H . 我们将⽤形如A e S c S ??>的判别区域,c 由预先给定的信度α确定. 给定α后,需要计算统计量AeS S 在0H 为真时的分布. 可以证明,在0H 为真时,(1,)1A e S n p F p n p p S ~. 即1AeS n p p S ??服从参数为1p ?和n p ?的F 分布. 只需从F 分布表,查(1,)F p n p α??,使((1,))P F p n p αηα>??=. 其中(1,)F p n p η??~.最后得到的检验⽅法是: 若(1,)1AeS n p F p n p p S α??>,就拒绝0H ,否则接受0H图6-1. (4,10)F 时的F 曲线和0.05α=时的临界值6.1.3 单因素⽅差分析表对上⼀⼩节的分析进⾏总结,得到单因素⽅差分析表6-2. 表6-2 单因素⽅差分析表3若0.01(1,)F F r n r α>??,称因素A 对试验结果有⾮常显著的影响,⽤“* *”号表⽰;若0.050.01(1,)(1,)F r n r F F r n r α??<6.2 利⽤SPSS 进⾏单因素⽅差分析6.2.1 SPSS ⽅差分析对数据的要求应⽤⽅差分析对数据进⾏统计推断之前应注意样本分布的正态性,即偏态分布样本不宜⽤⽅差分析. 对偏态分布的样本应考虑⽤对数变换、平⽅根变换、倒数变换、平⽅根反正弦变换等变量变换⽅法变为正态或接近正态分布的数据后再进⾏⽅差分析.在⽅差分析的F 检验中,是以各个实验组内总体⽅差齐性(⽅差相等)为前提的,因此,按理应该在⽅差分析之前,要对各个实验组内的总体⽅差先进⾏齐性检验. 如果各个实验组内总体⽅差为齐性,⽽且经过F 检验所得多个样本所属总体平均数差异显著,这时才可以将多个样本所属总体平均数的差异归因于各种实验处理的不同所致;如果各个总体⽅差不齐,那么经过F 检验所得多个样本所属总体平均数差异显著的结果,可能有⼀部分归因于各个实验组内总体⽅差不同所致.但是,⽅差齐性检验也可以在F 检验结果为多个样本所属总体平均数差异显著的情况下进⾏,因为F 检验之后,如果多个样本所属总体平均数差异不显著,就不必再进⾏⽅差齐性检验.在使⽤SPSS 进⾏⽅差分析时,要求因⼦变量值为整数,⽽因变量应为定量变量(区间测量级别). SPSS 对于偏离正态的样本数据也是稳健的. 各组数据应来⾃⽅差相等的总体.6.2.2 SPSS ⽅差分析过程⽤SPSS 进⾏⽅差分析时,选项如图 .图 6-2 SPSS ⽅差分析的选项这些选项的含义如下:描述性:计算每组中每个因变量的个案数、均值、标准差、均值的标准误、最⼩值、最⼤值和95%的置信区间.固定和随机效果:显⽰固定效应模型的标准差、标准误和95%置信区间,以及随机效应模型的标准误差、95%置信区间和成分间⽅差估计.⽅差同质性检验:计算Levene 统计量以检验组间⽅差是否相等. 该检验独⽴于正态分布的假设.Brown-Forsythe :指采⽤Brown-Forsythe 分布的统计量进⾏的各组均值是否相等的检验.Brown-Forsythe分布也近似于F分布,但采⽤Brown-Forsythe检验对⽅差齐性没有要求,所以当因变量的分布不满⾜⽅差齐性的要求时,采⽤Brown-Forsythe检验⽐F检验更稳妥。
方差分析简介1. 引言方差分析(analysis of variance,简称ANOVA)是一种假设检验方法,即基本思想可概述为:把全部数据的总方差分解成几部分,每一部分表示某一影响因素或各影响因素之间的交互作用所产生的效应,将各部分方差与随机误差的方差相比较,依据F分布作出统计推断,从而确定各因素或交互作用的效应是否显著。
因为分析是通过计算方差的估计值进行的,所以称为方差分析。
方差分析的主要目标是检验均值间的差别是否在统计意义上显著。
如果只比较两个均值,事实上方差分析的结果和t检验完全相同。
只所以很多情况下采用方差分析,是因为它具有如下两个优点:(1)方差分析可以在一次分析中同时考察多个因素的显著性,比t检验所需的观测值少;(2)方差分析可以考察多个因素的交互作用。
方差分析的缺点是条件有些苛刻,需要满足如下条件:(1)各样本是相互独立的;(2)各样本数据来自正态总体(正态性:normality);(3)各处理组总体方差相等(方差齐性:homogeneity of variance)。
因此在作方差分析之前,要作正态性检验和方差齐性检验,如不满足上述要求,可考虑作变量变换。
常用的变量变换方法有平方根变换,平方根反正弦变换、对数变换及倒数变换等。
方差分析在医药、制造业、农业等领域有重要应用,多用于试验优化和效果分析中。
2. 单因素方差分析2.1 基本概念(1)试验指标:在一项试验中,用来衡量试验效果的特征量称为试验指标,有时简称指标,也称试验结果,通常用y表示。
它类似于数学中的因变量或目标函数。
试验指标用数量表示称为定量指标,如速度、温度、压力、重量、尺寸、寿命、硬度、强度、产量和成本等。
不能直接用数量表示的指标称为定性指标。
如颜色,人的性别等。
定性指标也可以转化为定量指标,方法是用不同的数表示不同的指标值。
(2)试验因素:试验中,凡对试验指标可能产生影响的原因都称为因素(factor),也称因子或元,类似于数学中的自变量。
三因素方差分析的原理及应用郭萍【摘要】基于双因素方差分析,推导出三因素方差分析的原理,给出了偏差平方和分解式及三因素方差分析表,并将推导的结果应用在具体的数学建模案例中,同时利用MATLAB实现了该案例的求解.求解结果的一致性说明了原理推导的正确性.【期刊名称】《沈阳大学学报》【年(卷),期】2015(027)001【总页数】4页(P40-43)【关键词】三因素方差分析;数学建模;MATLAB【作者】郭萍【作者单位】青岛理工大学琴岛学院基础部,山东青岛266106【正文语种】中文【中图分类】O29当今社会是一个信息高度发达、人们的社会经济活动日益频繁的社会,大量的信息、数据需要人们处理. 如何从这些海量的信息中提取有用的信息,指导人们的社会实践活动,越发显得必要而迫切,从而为数理统计提供了日益广阔的舞台[1].方差分析是数理统计中非常重要的内容. 方差分析又称“变异数分析”或“F检验”,是由 R A Fisher 发明的,用于对两个及两个以上样本均数差别的显著性检验[2]. 三因素方差分析是检验在三种因素影响下,三个以上总体的均值彼此是否相等的一种统计方法. 文献[3]给出了单因素及双因素方差分析的原理,但并未给出三因素方差分析的相关内容. 本文详细推导了无交互影响的三因素方差分析的原理及偏差平方和分解式,由此给出了三因素方差分析表,利用该分析表解决了一个具体的数学建模案例,并通过MATLAB实现了该案例的求解. 求解结果的一致性说明了原理推导的正确性.设有三个因素A,B,C,因素A取r个水平,分别记为A1,A2,…,Ar;因素B取s个水平,分别记为B1,B2,…,Bs;因素C取t个水平,分别记为C1,C2,…,Ct. 在水平组合(Ai,Bj,Ck)下样本相互独立,且记其中,i=1,2,…,r;j=1,2,…,s;k=1,2,…,t. 称μ为一般平均,αi为因素A的第i个水平的效应,βj为因素B的第j个水平的效应,γk为因素C的第k个水平的效应. 显然,αi,βj,γk满足如下关系式:若μijk=μ+αi+βj+γk,则数学模型为假设检验如下:记故无交互影响的三因素方差分析表如表1所示.(1) 若FA>F1-α(r-1,(r-1)(s-1)(t-1)+(r-1)(t-1)+(r-1)(s-1)+(s-1)(t-1)),则拒绝H01,表示在因素A的各水平下的效应有显著差异;(2) 若FB>F1-α(s-1,(r-1)(s-1)(t-1)+(r-1)(t-1)+(r-1)(s-1)+(s-1)(t-1)),则拒绝H02,表示在因素B的各水平下的效应有显著差异;(3) 若FC>F1-α(t-1,(r-1)(s-1)(t-1)+(r-1)(t-1)+(r-1)(s-1)+(s-1)(t-1)),则拒绝H03,表示在因素C的各水平下的效应有显著差异.某集团为了研究商品销售点所在的地理位置、销售点处的广告和销售点的装潢这三个因素对商品的影响程度,选了三个位置(如市中心黄金地段、非中心的地段、城乡结合部)、两种广告形式、两种装潢档次在四个城市进行了搭配试验. 表2是销售量的数据.试在显著性水平0.05下,检验不同地理位置、不同广告、不同装潢下的销售量是否有显著差异[4].解法1 按照推导出的偏差平方和分解式,计算求得方差分析表,如表3所示.由于FA≈13.915 8>F0.95(2,7)=4.74,FB≈15.5966>F0.95(1,7)=5.59,FC≈12.323 2>F0.95(1,7)=5.59,因此,在显著性水平α=0.05下,因素A的不同水平、因素B的不同水平及因素C的不同水平都对该商品的销售量有显著影响. 为了使该商品的销售情况更好,地理位置、广告、装潢都需要进行合理的选择.解法2 MATLAB实现.统计工具箱中用anovan作多因素方差分析. 无交互影响的三因素方差分析命令为[p,t]=anovan(x,group). 返回值p是三个概率. 当p>α时接受H0,说明因素有显著影响;当p<α时拒绝H0,说明因素无显著影响. t是方差分析表.编写程序如下:clc,clearx=[955 927 905 855 880 860 870 830 875 870 870 821];group={[′A1′;′A1′;′A1′;′A1′;′A2′;′A2′;′A2′;′A2′;′A3′;′A3′;′A3′;′A3′;];[′B1′;′B1′;′B2′;′B2′;′B1′;′B1′;′B2′;′B2′;′B1′;′B1′;′B2′;′B2′;];[′C1′;′C2′;′C1′;′C2′;′C1′;′C2′;′C1′;′C2′;′C1′;′C2′;′C1′;′C2′;]};[p,t]=anovan(x,group)求得p的值分别为0.003 6,0.005 5,0.009 9,方差分析表如表4所示.第一个p值是在因素A(即地理位置)的影响下得到的,第二个p值是在因素B(即广告)的影响下得到的,第三个p值是在因素C(即装潢)的影响下得到的. 由于三个p值均小于0.05,故拒绝原假设,说明因素A的不同水平、因素B的不同水平及因素C的不同水平都对该商品的销售量有显著影响.MATLAB实现的结果与利用偏差平方和分解式得到的结果是一致的,说明偏差平方和分解式及无交互影响的三因素方差分析表的推导都是正确的.近年来, 随着计算机技术的发展和普及, 借助于计算机及MATLAB[5]软件完成统计计算、分析统计结果、作出统计推断已经成为必然趋势. 但是没有理论支撑的应用, 就如空中楼阁.对无交互影响的三因素方差分析原理及偏差平方和分解式的推导, 对数据较少的实际问题, 不仅可以通过动手计算, 分析问题的结果; 而且有了理论的支撑, 可以更好地理解MATLAB软件中程序的意义, 同时对统计结果作出更透彻的分析.【相关文献】[1] 夏传武. MATLAB 在概率统计教学中的应用[J]. 徐州工程学院学报, 2005,20(S1):96-98. (Xia Chuanwu. The Application of MATLAB in Teaching of Probability Statistics[J]. Journal of Xuzhou Institute of Technology, 2005,20(S1):96-98.)[2] 易昆南,程勋杰. “假设检验”决策的误区:一场由全国大学生数学建模竞赛引发的争论[J]. 重庆理工大学学报:自然科学版, 2013,27(4):106-109.(Yi Kunnan,Cheng Xunjie. A Frequently Mistaken Concept in “Hypothesis Test”: A Dispute Triggered by China Undergraduate Mathematical Contest in Modeling[J]. Journal of Chongqing University of Technology: Natural Science, 2013,27(4):106-109.)[3] 魏宗舒,等. 概率论与数理统计教程[M]. 北京:高等教育出版社, 2001:372-391.(Wei Zongshu,et al. The Course of Probability Theory and Mathematical Statistics[M]. Beijing: Higher Education Press, 2001:372-391.)[4] 司守奎. 数学建模算法与程序[M]. 北京:国防工业出版社, 2007:225.(Si Shoukui. Algorithm and Program of Mathematical Modeling[M]. Beijing: National Defense Industry Press, 2007:225.)[5] 季丽丽,马骥. 基于MATLAB转子绕线机控制系统调节器的仿真研究[J]. 沈阳大学学报:自然科学版, 2012,24(1):25-27.。