第六讲-方差分析中主效应和交互效应的图形(英文)
- 格式:ppt
- 大小:437.00 KB
- 文档页数:3
方差分析简介1. 引言方差分析(analysis of variance,简称ANOV A)是一种假设检验方法,即基本思想可概述为:把全部数据的总方差分解成几部分,每一部分表示某一影响因素或各影响因素之间的交互作用所产生的效应,将各部分方差与随机误差的方差相比较,依据F分布作出统计推断,从而确定各因素或交互作用的效应是否显著。
因为分析是通过计算方差的估计值进行的,所以称为方差分析。
方差分析的主要目标是检验均值间的差别是否在统计意义上显著。
如果只比较两个均值,事实上方差分析的结果和t检验完全相同。
只所以很多情况下采用方差分析,是因为它具有如下两个优点:(1)方差分析可以在一次分析中同时考察多个因素的显著性,比t检验所需的观测值少;(2)方差分析可以考察多个因素的交互作用。
方差分析的缺点是条件有些苛刻,需要满足如下条件:(1)各样本是相互独立的;(2)各样本数据来自正态总体(正态性:normality);(3)各处理组总体方差相等(方差齐性:homogeneity of variance)。
因此在作方差分析之前,要作正态性检验和方差齐性检验,如不满足上述要求,可考虑作变量变换。
常用的变量变换方法有平方根变换,平方根反正弦变换、对数变换及倒数变换等。
方差分析在医药、制造业、农业等领域有重要应用,多用于试验优化和效果分析中。
2. 单因素方差分析2.1 基本概念(1)试验指标:在一项试验中,用来衡量试验效果的特征量称为试验指标,有时简称指标,也称试验结果,通常用y表示。
它类似于数学中的因变量或目标函数。
试验指标用数量表示称为定量指标,如速度、温度、压力、重量、尺寸、寿命、硬度、强度、产量和成本等。
不能直接用数量表示的指标称为定性指标。
如颜色,人的性别等。
定性指标也可以转化为定量指标,方法是用不同的数表示不同的指标值。
(2)试验因素:试验中,凡对试验指标可能产生影响的原因都称为因素(factor),也称因子或元,类似于数学中的自变量。
方差分析之常用术语一、历史方差分析(analysis of variance 或者ANOV A)是由英国统计学家Sir Ronald Fisher发展的。
F检验就是以他的名字命名的。
与t检验相比,方差分析明显的优越之处在于,前者只适宜检验两个平均数之间是否存在差异,它只能把对一个复杂的问题的探讨拆成对多组平均数两两之间差异的检验。
然而,方差分析的特点是可以同时检验两个或多个平均数之间的差异,并且可以解释几个因素水平之间的交互作用。
方差分析有力地促进了复杂实验设计的发展,它使研究者有可能通过实验设计,深入探讨问题的实质。
方差分析也帮助了检验假说,它提供了对各种实验设计中显著性检验的基础。
方差分析另一个不同于t检验的特点是,它实质上把“平均数之间是否存在差异”的检验转化为“变异是否存在”的检验。
方差分析的主要功能是分析因变量的总变异中不同来源的变异,如实验处理引起的变异、被试个体差异带来的变异,实验误差带来的变异等等。
二、常用术语因素(factor):因素指研究者在实验中感兴趣的一个变量,研究者通过操纵、改变它,来估计它对因变量(dependent variable)的影响,这个变量也叫自变量(independent variable)。
实验中所操纵的变量的每个特定值叫因素的水平(level),研究者需要事先确定因素的水平及其数量。
因素实验设计(factoral experimental design):因素实验设计通常指多于一个因素的实验设计,如一个含有两因素、每个因素有三个水平的实验设计,成为3*3两因素实验设计。
处理(treatment)与处理水平的结合(treatment combinations):处理与处理水平的结合都是指实验中一个特定的、独特的实验条件。
主效应(main effects)和交互作用(interaction):实验中由一个因素的不同水平引起的变异叫因素的主效应。
在一个单因素实验中,由自变量的不同水平的数据计算的方差即这个自变量的处理效应,或主效应。
方差分析One-Way ANOV A :该命令为单因素方差分析,又称为成组设计方差分析。
主要用于两组或两组以上样本均数间的两两比较。
要求各样本来源的总体满足正态性,各总体间方差齐性,各数据间相互独立等条件。
例如研究者药比较一年中的四个季节水中的氯化物浓度情况,分析氯化物含量的波动是否有一定的规律,并研究前半年与后半年水中氯化物的含量是否有差别。
将分组因素季节移入factor 中,将氯化物移入dependent list 中,如下图:点击Contrasts ,该选项卡的含义为事前比较(Planned Comparisons )。
在多组比较的研究中,研究者感兴趣的并不只是多组间的总F 值(据此可以认为不同的组间是否不同或不全相同),而是根据自己的专业知识或研究目的,研究多组中特定的某两组或多组间的比较结果(例如本例中,该地由于在后半年采用了新的排污条例,研究者想了解新条例实施的效果,可以考虑比较前、后半年的平均水平,即所谓的春夏季与秋冬季的比较)。
在本例中我们将春季和夏季的平均数系数(Coefficients )定义为1,将秋冬两季的系数定义为-1,写成表达式如下(请注意要保证所有系数单因素方差分析的数据输入格式同成组t 检验之和为0,否则结果并不可信):冬秋夏春X X X X ⨯-⨯-⨯+⨯1111但是事前比较结果如果没有统计学意义,并不能认为各组间相同。
因为事前比较所涉及的可能仅仅是某几组间的相互比较,它们间没有差别并不意味着所有的各组间都没有差别,所以在多个样本均数的比较中,除了对研究者感兴趣的几个组进行比较之外,最好使用方差分析了解总的情况,并在方差分析拒绝H0假设后,使用检验后的两两比较(Post Hoc )进一步分析所有可能存在的组间差别。
另外,在事前比较中所使用的t 检验实际上就是LSD 法(从t 值大小与自由度上均可以确认)。
由于我们所收集的资料是按照一年的四个季节分组的,故分组变量的取值有一定的规律性,取值越大表示越靠近年底,而且取值间距相同。
研究变量的主效应与交互效应集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-在多因素实验研究中,主效应就是在考察一个变量是否会对因变量的变化发生影响的时候,不考虑其他研究变量的变化,或者说将其他变量的变化效应平均掉。
换句话说,就是其他研究变量都不变化的情况下,单独考察一个自变量对因变量的变化效应。
交互效应,则是反映两个或两个以上自变量相互依赖、相互制约,共同对因变量的变化发生影响。
换句话说,如果一个自变量对因变量的影响效应会因另一个自变量的水平不同而有所不同,则我们说这两个变量之间具有交互效应。
在分析多个自变量的效应时,要注意主效应与交互效应之间的关联性。
我在《应用实验心理学》的第二章末尾,专门就这一问题进行了讨论。
现录于此,仅供参考:在析因实验(多因素实验)中,数据收集、数据分析的主要目标是考察自变量的主效应和交互效应是否显着。
一个自变量的主效应显着,意味着该自变量的各个水平在其它自变量的所有水平上的平均数存在差异;否则,就不存在显着性差异。
比如,在自变量A和自变量B构成的2×2析因设计中,如果A的主效应显着,那就意味着A1在B1和B2水平下的平均数与A2在B1和B2水平下的平均数存在显着性差异。
变量间的交互效应则是指一个因子的效应依赖于另一个因子的不同水平。
在析因设计中,方差分析直接给出自变量的主效应和交互效应是否显着的结果,多数研究者也依次判定自变量的作用是否明显、这些自变量的作用是否相互依赖。
事实上,自变量的主效应与交互效应的评估并非这么简单,它们存在关联性,需要具体情况具体分析。
我们就以两个自变量的主效应和交互效应来分析。
当交互效应不显着的时候,两个自变量相互独立,我们可以直接从其主效应是否显着来评估自变量对因变量的作用大小;当两个自变量间的交互效应显着时,就不能简单地从主效应是否显着直接得出结论了。
我们现在以交互效应显着为前提,来区分自变量A的主效应是否显着的三种情况:第一,交互效应显着,A的主效应也显着,而且主效应方向与简单效应方向一致,如图2-5中的b图就属于这类情况。
1、单因素方差分析(One-Way ANOV A)操作原理依次选择Analyze→Compare Means→One-Way ANOV A,见图1。
图1 进入One-Way ANOV A图打开One-Way ANOV A主对话框,见图2。
图2 One-Way ANOV A主对话框Dependent list:因变量栏;factor:因素变量;Contrasts:均值多项式比较;Post Hoc:各组均值多重比较检验;Options:定义选项,指定要输出的统计量和处理缺失值等方法。
•One-Way ANOV A : Contrasts:单因素方差分析Contrasts子对话框:单击Contrasts按钮,打开Contrasts对话框,见图3。
图3 One-Way ANOV A Contrasts子对话框Polynominal:多项式。
选择就可以激活其右边的Degree小菜单;Degree:程度:可选择linear(线性)、quadratic(二次多项式)、cubic(三次多项式)、4th(四次多项式) 、5 th(五次多项式);Coeffients: 系数。
为多项式指定各组均值的系数,因素变量有几组就输入几个系数。
Coeffients Total:系数总计。
•One-Way ANOV A :Post Hoc :单因素方差分析Post Hoc子对话框:单击Post Hoc 按钮,打开Post Hoc子对话框,见图4。
图4 One-Way ANOV A Post Hoc子对话框Equal variances assumed:假定方差齐性。
在该条件下,由十四种比较均值的方法可供选择,常用的有以下几种:LSD:最小显著差异法,用T检验完成各组均值之间的两两比较;Bonferroni:修正最不显著差异法,用T检验完成各组均值之间的配对比较;S-N-K:用student range 分布进行所有各组均值间的配对比较;Scheffe:佛检验法,对所有可能的组合进行同步进入的配对比较;Dunnet:修复极差法;Dunnett:指定一组为对照组,然后将其逐个与其他组进行两两比较,此方法可选择双尾或单尾检验;Equal variances Not Assumed:假定方差齐次。
统计学中的方差分解与交互作用统计学是通过收集、分析和解释数据来研究和推断关于整个群体的特征和规律的学科。
在统计学中,方差分解是一种重要的分析工具,用于研究变量之间的关系和变差的来源。
同时,交互作用也是统计学中的一个重要概念,用于描述两个或更多变量之间的相互影响。
本文将探讨方差分解和交互作用在统计学中的应用和意义。
一、方差分解方差分解是将总体或总体样本的变异性分解为几个部分以了解各部分对总体变异性的贡献程度的分析方法。
它可以帮助我们理解数据的来源和影响因素,并量化各种因素对总体变异性的解释程度。
在方差分解中,常常使用方差分析(ANOVA)来进行分析。
方差分解可以将总变异性分为组内变异性和组间变异性。
组内变异性表示同一组内个体数据之间的差异,而组间变异性则表示不同组之间数据的差异。
这种分解可以帮助我们识别影响变量的因素,并量化这些因素对整体变异性的贡献。
方差分解可以用于不同领域的研究,比如医学研究、社会科学研究和经济学研究等。
通过方差分解,研究人员可以深入分析不同因素对总体变异性的影响,从而提供更精确的研究结论和实证分析。
二、交互作用在统计学中,交互作用描述了两个或更多变量之间存在的相互影响。
当变量之间的关系受到其他变量的干扰或调整时,就可能产生交互作用。
交互作用可以帮助我们理解变量之间的复杂关系和相互作用模式。
在回归分析中,交互作用通常通过引入交互项来评估。
交互项是两个或多个变量相乘的结果,并提供了关于变量之间关系的更详细的信息。
通过分析交互作用,我们可以揭示不同变量之间的相互作用效应,从而更好地理解数据背后的机制。
交互作用在统计学中的应用非常广泛。
在医学研究中,交互作用可以帮助探究不同因素对治疗效果的影响。
在市场研究中,交互作用可以帮助分析消费者对产品特性的反应。
通过运用交互作用的概念,我们可以更加全面地了解变量之间的关系和影响,从而做出更精确的推断和决策。
三、方差分解与交互作用的关系方差分解和交互作用在统计学中起着不同的作用,但也存在一定的联系和关联。
在多因素实验研究中,主效应就是在考察一个变量是否会对因变量的变化发生影响的时候,不考虑其他研究变量的变化,或者说将其他变量的变化效应平均掉;换句话说,就是其他研究变量都不变化的情况下,单独考察一个自变量对因变量的变化效应;交互效应,则是反映两个或两个以上自变量相互依赖、相互制约,共同对因变量的变化发生影响;换句话说,如果一个自变量对因变量的影响效应会因另一个自变量的水平不同而有所不同,则我们说这两个变量之间具有交互效应;在分析多个自变量的效应时,要注意主效应与交互效应之间的关联性;我在应用实验心理学的第二章末尾,专门就这一问题进行了讨论;现录于此,仅供参考:在析因实验多因素实验中,数据收集、数据分析的主要目标是考察自变量的主效应和交互效应是否显着;一个自变量的主效应显着,意味着该自变量的各个水平在其它自变量的所有水平上的平均数存在差异;否则,就不存在显着性差异;比如,在自变量A和自变量B构成的2×2析因设计中,如果A的主效应显着,那就意味着A1在B1和B2水平下的平均数与A2在B1和B2水平下的平均数存在显着性差异;变量间的交互效应则是指一个因子的效应依赖于另一个因子的不同水平;在析因设计中,方差分析直接给出自变量的主效应和交互效应是否显着的结果,多数研究者也依次判定自变量的作用是否明显、这些自变量的作用是否相互依赖;事实上,自变量的主效应与交互效应的评估并非这么简单,它们存在关联性,需要具体情况具体分析;我们就以两个自变量的主效应和交互效应来分析;当交互效应不显着的时候,两个自变量相互独立,我们可以直接从其主效应是否显着来评估自变量对因变量的作用大小;当两个自变量间的交互效应显着时,就不能简单地从主效应是否显着直接得出结论了;我们现在以交互效应显着为前提,来区分自变量A的主效应是否显着的三种情况:第一,交互效应显着,A的主效应也显着,而且主效应方向与简单效应方向一致,如图2-5中的b图就属于这类情况;这种情况下,在自变量B的两个水平上,自变量A从A1到A2的变化引起的因变量的变化趋势一致,只是变化幅度不一致;这里的交互效应掩盖了自变量A在自变量B不同水平上的效应量的差异;很明显,在B1上平上,A的效应量大于其在B2水平上的效应量;第二,交互效应显着,A的主效应也显着,这时A的效应方向可能会被交互效应歪曲;比如图2-5中的a图、d图都属于这类情况;在a图中,A的变化在B1的水平上引起了因变量的显着变化,但在B2水平上却未引起因变量的变化,这就是说A的变化不是在任何情况下都会引起因变量的变化的,它依赖于自变量B的水平;在d图中,虽然A的变化在B的两个水平上都引起了因变量的明显变化,但是变化的方向正好相反,从其主效应看,A的水平提高可以促进因变量分数的提高,但实际情况是,当A在B1水平上提高时,反而会导致因变量分数的下降;所以在这种情况下,显着的交互效应掩盖或歪曲了自变量A的作用机制:它在B的不同水平上效应量是不同的;第三,交互效应显着,A的主效应却不显着,实际上是交互效应掩盖了A的效应,如图2-5中的c、e、f图都属于这种情况;我们从这些图示中可以明显看到A的效应,但方差分析结果却会显示A的主效应不显着,这是因为A在B的两个水平上的效应方向相反,计算A的主效应时A1和A2的差异量被掩盖在了平均过程中;那么,如何依据自变量主效应和其与其它自变量的交互效应来进行结果分析呢这一点很简单:当方差分析结果显示A的主效应及A与其它自变量的交互效应都不显着时,则说明A的效应真的不明显;当方差分析的结果显示A的主效应不显着但A与其它自变量的交互效应显着时,则说明A其实是对因变量有明显作用的,即A的效应其实是存在的,只不过其效应的大小和方向依赖于其它自变量的不同水平;上述分析提醒我们,在说明方差分析结果时你要特别注意,如果因子间的交互效应达到了显着性水平,那么自变量的效应有可能会被歪曲或掩盖,也就是说,不能简单地依据其主效应是否显着来判断它是否对因变量有影响,而是要进行简单效应检验,分别考察其在其它自变量不同水平上的变化情况;否则,可能会得到错误结论;应该记住,一个因子的主效应是对其在另外一个因子所有不同水平下观测分数的平均而得到的,而这种平均的结果可能很难准确地反映每种具体实验处理的效应;“总之,交互效应可能会掩盖或歪曲两个因子中任何一个因子的主效应;因此,只要是交互效应达到了统计学上的显着性水平,你在就主效应问题作出结论前都要仔细考察具体的数据变化;”。