当前位置:文档之家› 方差分析(ANOVA)与协方差分析(ANCOVA)

方差分析(ANOVA)与协方差分析(ANCOVA)

方差分析(ANOVA)与协方差分析(ANCOVA)
方差分析(ANOVA)与协方差分析(ANCOVA)

方差分析(ANOVA)与协方差分析(ANCOVA) 第5章方差分析(ANOVA)与协方差分析(ANCOVA)

——野外竞争试验

Deborah E.Goldberg

Samuel M.Scheiner

5.1 引言

自从达尔文时期,竞争就占据了生态理论的中心,关于竞争的实验在许多来自许多不同环境的多生物种之间开展过(Jackson,1981综述; Connell,1984; Schoener,1984; Hairston,1989; Gurevitch,1992)。有各种各样的竞争实验,而本章的重点则放在怎样为具体的竞争问题选择适当的实验设计和统计分析。这类选择取决于所研究问题及系统的许多方面。对于大多数我们所给出的设计、基本的统计方法、方差分析(ANOVA)和协方差分析(ANCOVA)在实验设计与分析的教科书中也有详尽描述,我们在这里就不像本书其他章节那样提供详细的统计细节。对于ANOVA的基本介绍见第四章。虽然我们着重于竞争,但许多观点对其他类型的种间关系实验同样有效,如捕食者—猎物关系或者互惠共生关系。

5.2 关于竞争的生态问题

我们可以提出关于竞争的最简单问题莫过于竞争是否在野外存在,要回答这个问题,就必须利用实验处理,使潜在竞争者们的绝对多度可被控制,同时检验处理中存在低多度潜在竞争者时物种是否可能生长的更好。这类多度处理之间生长的差异即是竞争的量纲(或促进facilitation的量纲如果在较高多度下生长较佳)。在任何野外竞争调查中,发现是否存在竞争是重要的第一步,但是,就其本身而言,并没有什么意义。多数关于竞争的重要问题包括竞争强度的比较以及随之而来的实

验设计及分析,这比在两种或更多种多度处理间的简单比较更为复杂 (Goldburg 和Barton,1992)。

有一组问题需要比较在不同环境条件下(生境或时间)竞争强度大小。例如,野外观测结果可能推测出一个物种的分布是由同营养级所有其它物种竞争的总和所决定的假设,检验此假设的野外实验就必须比较中心种(focal sp.)在其多度高的生境和在其多度低或稀少的生境中竞争影响的强度(如 Hairston 1980; Gureritch 1986; Mcgreno 和Chapin 1989)。同样,要解决植物生态学家目前关于是否竞争重要性随生产力提高而增加或保持恒定的争论,就必须比较

不同生产力生境中种群或群落的竞争强度(如Wilson和Tilman 1995; Twolau—Strutt和Keddy 1996 )。5.4.1节给出关于比较不同生境竞争强度实验的统计分析方法。

第二组问题要求比较不同分类单位的竞争强度。例如,经典竞争理论预测,对于共生的物种,种内竞争比种间竞争要激烈。竞争的机理模型对存在某些与竞争力有关的性状进行预

1977;Schoener 1986;Tilman 1988; Werner 和 Anholt 1993),这就需要在有这些性状的测(Grime

不同分类单位中进行比较。同样,对于作为竞争环境结果的不同性状选择强度的量化也需要在不同的表现型或基因型间进行比较。5.4.2节给出关于检验物种性状与竞争力关系和排比竞争力假设的实验的统计分析方法。

此外,有些问题需要同时对环境和分类单位进行比较。例如,许多预测与竞争力有关性状的模型同时也预测在不同环境中这些性状变化的方式,或预测竞争力和对其他过程的反应之间的权衡, 如捕食或者干扰 (见前面引用文献)。这些预测可以从对不同环境下 (如不同资源限制性,天敌密度,干扰等) 不同分类单位间的竞争强度的比较中得到检验。这就需要有大量独立因子的高度复杂的实验设计,而生

物学上的主要兴趣点通常在于因子间的统计上的相互作用 (如:分类单位×竞争×环境相互作用项用于检验在不同环境下,竞争等级是否有变化)。然而,高阶多因子实验设计通常会产生许多无法解释的相互作用项,且需要非常大的样本量。此类复杂性的加入应特别小心,要仔细考虑感兴趣的生态学问题是什么。

在本章中前面讲述的不同问题及相应实验设计将从检验模型预测的竞争相互作用的角度来描述,因为这是多数野外竞争实验的典型目的。然而,同样而且更重要的用途是对特定竞争模型参数化,对竞争相互作用长期动态过程进行外插,以及对模型进行改善 (Freckleton和Wathinson 1997)。关于竞争强度的量测与竞争理论模型之间关系的深入讨论不是本章的目的,Laska和Woatton (1998)已经讨论了许多这方面的问题(还见Frechleton 和Walkinson 1997,1999)。

值得提醒的是前面述及的很基本的竞争实验不能单独解决竞争关系的机理。负相关能在直接相互作用中产生 (冲撞竞争 Interference Competition),能通过竞争共享限制资源而产生 (开拓竞争 Exploitation Competition),能通过共有天敌而产生 (表性竞争

Apparent Competition) 以及通过其它复杂途径产生,懂得这些机理对于发展关于竞争在解释进化和生态格局中的作用的一般理论至关重要 (Schoener 1986;Tilman 1987)。然而有许多各种不同的方法 (野外与实验室,观测和实验,调整除竞争以外的其它过程) 来检验具体某一个相互作用机理,从而要对研究竞争的实验设计和统计分析给出一个一般性的讨论是困难的。因此本章仅着重于全面理解竞争的一部分:野外竞争强度的量测与比较。

总而言之,我们强调了除简单表明在某时某地某一对物种间竞争存在以外几乎所有要用比较来研究的关于竞争的重要生态问题。因此,本章的第一个,也许是也是最重要的建议就是进行竞争实验的第一步是要小心考虑研究的目的从而确定适当的比较。这可能听起来没有什么而且太明了,但是在文献中那些有设计完美、分析

完全的实验却没有对明显格局给出什么解释,对假设或理论预测进行检验,不对模型参数化,或不对某一系统的经营决定提出有力支持的报告和文章汗牛充栋,多之又多。

5.3实验设计

5.3.1. 名词,术语

在我们一头扎进不同的实验设计并且要回答哪一个是合适的这类问题之前,我们要定义一些基本术语。中心分类单位 (focal texon) 是那些要量测的对竞争有反应的生物分类单位。关联分类单位 (associated taxon) 是那些要量测的对中心分类单位的影响的分类单位,即该分类单位的多度可在实验中改动 (注意,在一些试验设计中,同一个种既可能是中心分类单位,也可能是关联分类单位)。背景分类单位 (background taxon) 是那些出现在所有实验处理中但并不明确确定是中心分类单位还是关联分类单位的分类单位。背景分类单位可以包括其他潜在竞争者,资源种,天敌及共益物种,分类单位通常是物种,但也可以是基因型或一组物种(见5.3.6节)

反应参数 (response parameter) 是被量测中心种的特性方面的量测。个体水平的反应包括行为,形态,生理,以及关于个体适合度 (fitness)等方面(如生长速率,存活概率,或繁殖产出)。种群水平 (population-level) 反应包括种群大小或生长率,种群大小可由密度,生物量,盖度及其它多度等测量,群落水平(community-level) 反应包括如分类或功能群组成的参数,优势度,或多样性等量测。

竞争力可在中心种间比较 (竞争反应),或在关联种间比较 (竞争影响) (Goldburg和Werner 1983) 。这种区别是重要的,因为物种的不同形状可以决定其压迫其他物种的能力 (竞争影响)以及忍耐或避免压迫的能力(竞争反应) (Goldburg 和Landa 1991)。竞争影响可由关联种的自然多度或者以每单位数量多

少进行量测。通常关于多度的量测是密度,生物量及盖度 (对于基生丛状生物),但其他量测也可以(如植物的全根长或叶面积)。利用关联种多度的不同量测的结果进行比较本身就可提供大量的信息。例如物种可以有不同的单株影响,但相似的每单位重量影响,这表示主要由性状影响的单株竞争效果实际上是取决于每一个体的生物量。

5.3.2. 基本实验设计

基于实验密度控制的方式,竞争实验一般可分为三类:替代设计

(substitutive design)、加入设计 (additive design) 和反应表面设计(response surface design) (图5.1; Silvertown 1987;Gibson 等1999) 。对所有这一类实验,其基本方法都是在实验中变换密度。如果多度的自然变化被用来检验竞争,与关联物种自然密度梯度相关的环境差异也可以直接影响中心种个体,因而能够将竞争影响与其它的生物或非生物的环境因子相混淆。

在替代实验 (替代序列) 中,总密度总是保持一致而每一物种的频度则是变动的(图5.1A)。对替代实验有各种批评,在过去的数十年中,不断有文献对其使用提出限制,因而在自然群落中一般不建议进行这类试验 (Gibson 等1999及所引文献)。替代实验只检验种内和种间竞争的相对强度。因而,尽管试验设计符合所有相当苛刻的假定,它也不是检验竞争存在与否或比较竞争绝对强度大小的适当试验。但是对于仅要求比较相对竞争强度的问题来说,如生态位分离是否出现,替代实验在符合假定条件时是有用的。

在加入实验中,中心种的密度保持恒定而关联种的密度在实验中变化 (图

5.1B)。虽然通常在描述中仅举两个种加多种密度处理为例,此定义还是适合于许多野外实验。例如“移除实验(removal experiment)”常常比较中心种在两种处理中的反应,一种处理使关联种以自然多度出现,另一种处理便是将其完全剔除。如果中心种密度相同,这就是一个仅有两个关联种密度: “有与无” 的加入实

验。关联种由于能使竞争的同种个体数目一致,在实验所有处理中保持中心种密度恒定是非常重要的。然而要记住的是在相同的起始同种密度条件下,由于生物量的变化,种内竞争强度也可以变化,尤其是当不同物理环境也要进行比较时。因此,Miller(1996)建议在加入试验中使用一棵中心植物从而完全消除种内竞争。在一些情况下,保持中心种密度一致可能意味着从实验样方中移出或加入一些中心种个体。如加入中心种个体,在所有处理中,对中心种的操作必须完全一致,这就是说,它们必须全部是引入或是天然存在的个体。

5.3.5节介绍了几种选择关联种密度处理的重要考虑,加入实验设计的主要限制是他们混淆了密度和频度的影响,当关联种密度升高,同时频度也升高,换言之,它使关联种在所有植物中占较大比例,因为中心种密度恒定。如果竞争强度同时取决于频度与密度,那么这个问题就可能严重了。

第三个列出的设计,反应表面设计 (或加入序列,Silvertown,1987), 通过变化中心植物与关联植物的密度来绕过这个问题(图5.1C)。此类实验能够为开发真实性高的种群动态模型提供数据 (Law和Walkinson, 1987, Freckleton和Walkinson, 1997) 。虽然这是一个理想的两植物物种设计,大数目的密度组合使这类实验在许多野外条件下不可行,尤其是需要观察几个种的组合时。即使在实验室条件下也没有多少人做大密度组合实验 (见Gibson等1999综述)。因而,我们不打算对这些实验的分析作进一步的讨论,有兴趣的读者可参阅Ayala等 (1973)与Low和Walkinson(1987)

图5.1 操作两物种(或基因型或种组)密度的竞争实验的三类设计:A) 替换实验B) 加入实验,和C) 反应表面设计。在图中每一点表示一个实验处理,在c中变型平面(phase plane)上包括A)和B) 的亚部分由实线标出

5.3.3. 反应变量水平和时空尺度问题

大多数竞争野外实验使用个体水平反应参数,如捕获行为或个体生长速率,这是由于实验处理的时空尺度的限制所致。只是对小个体,短命有机体,量测整个种群的生长率才是可行的。这种限制意味着关于竞争导致的种群分布或多度的结论只能从个体量测推测出来而不是直接量测。由于相互作用系数 (interaction coefficient) 随不同生活史阶段和量测的种群动态 (demographic) 参数的不同而有极大的差异 (见Desteven 1991,a,b; Howard 和Goldburg 2000),这就提示了一个重要的问题:用中心个体的哪个生活史阶段是最为合适的。最理想的是实验应该贯穿所有龄级或者生活史所有阶段,这样基于年龄或个体大小结构的种群动态模型就可以在各种实验条件下估计种群生长率 (见Gurevitch1986; Mcpeck 和Pechaoky, 1998)。在实践中,这种情况并非总是可行的,因而选择的某些生活史

阶段就要基于其在种群控制中的重要性。对基于动态数据的一系列模型进行敏感性分析在确定此类研究的最佳年龄和生活史阶段是有用的 (Caswell 1989)。

相对较少的实验量测群落水平反应来回答竞争是如何影响种群组成或多样性(Goldburg和Barton 1992)。对于群落水平反应的分析,可用方法包括1)在单因子分析中使用相对种群多度作为反应变量,这在5.4节讨论,2)在这类单因子的分析中用多样性指数代表群落

属性。以及3) 用方差多元分析 (第6章)分析所有种的绝对多度。Goldburg

及其同事(Goldburg,1994; Goldburg等1995;Goldburg和Estebrook 1998)曾经描述过研究竞争的群落水平结果的一些其他实验和分析方法。

5.3.4. 绝对与相对反应变量:何时标准化,

几乎所有的反应变量都能被表述为绝对值或者将其标准化为无关联种时的变量值。在分析中用哪一种数值都能对竞争强度比较的解释产生重大影响,图5.2表示了一个比较两个中心种对同一关联种的密度梯度的生长反应的例子。使用中心种的绝对值,我们发现在没有关联种时 (低截率) 种2生长比种1低,并有较低斜率。因而种2被认为是一个有较好反应的竞争种 (对加入每一个关联种有较低的生长绝对值的减少,图5.2A)。然而,当用百分比生长表示时,在没有关联种时两种截率均为100%,而种1有较低的生长减少而被认为是有较好反应的竞争种(图5.2B)。

图5.2 两中心种,两类不同反应变量的加入实验的假设结果: A)绝对生长,B)与关联种群缺失时生长比较的百分比,用绝对反应时,我们发现种2是较佳反应的竞争者。而用最大生长百分比时,种1就是较佳反应竞争者。

大多数植物生态学家在竞争实验中使用基于百分比的系数来标准化数据。最常见的指数是RCI=(Pr-Pc)/Pr。式中Pr是移除实验中没有关联植物时中心种的表现,Pc是在有关联植物的控制处理种中心中的表现。然而,该指数在竞争结果和

促进结果方面并非对称 (Markham和Chanway 1996),而且其统计性质很差(Hedges 等1999,还见Freckle和Walkinson 1997)。因而Hedge等(1999)建议使用密切相关的对数反应比值来代替,lnRR=ln(Pc/Pr)(自然对数,或用以10为底的对数)。该指数已被广泛应用于捕食者-被捕食者相互作用的实验研究之中 (对此指数和其他指数的深入讨论见Osenberg等1999)。

解释标准化了和未标准化的数据的潜在冲突在比较不同中心种的竞争反应或比较同一中心种在不同环境下 (即高与低生产力生境) 的竞争反应时表现最为明显,因为非标准化数据的截距通常不一样。这种现象也可能出现在比较关联种的竞争影响上。通常我们期望在一个生境中的一个中心种对不同关联种的回归中有相同的截距 (即没有任何关联种时中心种的表现)。因而标准化了的和未标准化的数据可以得到相同的结果。然而,在移除实验中关联种为零密度的处理中,两个因子可能导致关联种的截距不一致。第一,可能会出现前关联种的残余影响,这些前关联种可能与现在用的关联种不一样。这种结果在基生植物中容易出现,这些植物在某一地点会有累积的影响。例如植物对养分有效性会有不同的残余影响,因为枯枝落叶的质量不同可导致分解速率或土壤有机质积累的不同。此外,残留根在实验中很少被移出,因而死根和分解中的根的存在也能够有明显的残余影响。第二,关联种只能从其原来生长的地方移除。如果不同的关联种原来在不同的微环境出现或聚集,而这些微环境又对中心种有直接影响,则中心种就可能对不同的关联种有不同的零密

度反应,这就是说,它们的截距可以不同。这两个潜在问题点出了在移除实验中对每一个关联种都要分别进行零密度处理的重要性。

在文献中极少述及到将关联种存在时中心种的反应标准化到关联种不存在时的中心种反应的条件;下面这些建议应被视为是基本的。对那些关注竞争后果的分布与丰富的问题,相对值可能是有用的。例如,假如竞争导致在低生产力生境内的中心种个体生长减少10g,而在高生产力生境的减少100g的话,则说明竞争在生产力较高的生境中更为强烈。然而,如果在没有竞争的时候,单株生长在低生产力和高生产力生境中分别为10g和200g,相对反应则是0%和50%,说明竞争在低生产力生境更强烈,而且实际上强烈到将中心种排除掉 (见campbell和Grime [1992]例:竞争实验中标准化与非标准化数据的不同结果)。

在另一方面,如果是研究竞争机制,绝对值可能更有用。例如,如果研究兴趣在于资源有效性导致的减产,即关联种的消耗改变了中心种的资源使用及其生长。使用标准化的数据会使得理解这些关系背后的过程变的困难。绝对反应值在量化竞争影响和反应从而可以使用于种群相互作用模型时是必要的,因为多数种群动态模型使用绝对参数,而不是相对参数。例如,在Lotka-Volterra竞争公式中,没有竞争的平衡态密度 (K)是一个明晰具体化的参数,而K和个体竞争系数()对相互作用的动态和平衡态结果有影响。 ,ij

5.3.5. 变化竞争强度:要多少密度处理,

加入实验的密度变化范围可以是简单的关联种的有和无或使用几个密度。当仅要求自然条件下竞争影响的总体强度时,有/无处理比较是合适的。然而,除非竞争影响全部线性,否则有/无比较 (或任意二种密度的比较)就不能准确算出单株影响 (per-capita effects)(图5.3)。当单株竞争影响的密度依赖性被检验时,它很少是常数(如 Harper 1977; Schoener 1986;

Pacala 和Silender 1990), 因而从有/无比较内插而来的全密度范围的单株影响一般来说是不太保险。在关联种中比较竞争影响,尤其是把这些竞争影响与性状联系起来需要单株影响的信息,因而总密度影响与单株影响 (或者更一般地,总丰富度和单位生物量)不能相互混淆。

图5.3 每株竞争影响的不正确估计的例子:实验有两种处理:关联种的自然密度以及关联种全部移出,真正的每株影响在图中由实线标出,从两处理线性内差出的数值(点线)在低关联种密度时低估每株影响,而在高关联种密度种密度下,高估其影响。

如选择多种密度,多密度处理但是少重复或无重复通常比较少密度处理但多重复要好,从而任何曲线关系都被检出并量化。合适的分析则应对密度反应变量的回归曲线的斜率进行比较,而不是不同处理的均值的比较 (第10章5.4.2节)。由于最强曲线关系和重复间最大变异倾向于在最低密度时出现,我们建议在密度低的范围增加密度处理。自然密度以上的密度同样有用,因为1) 自然条件下密度常常上下浮动很大,和2) 竞争通常只发生在密度高于诸如捕食等其它因子决定的情况下。不管在实验中使用什么密度,在文章发表时一定要注意给出自然密度范围,读者可以判读研究对实验结果在自然条件下的适用性。

5.3.

6. 两种竞争和全部竞争:用什么样关联种组,

实验中变化丰富度的关联种可以是一个种,或是一组种进行考虑。哪个更好取决于研究种的生物性状和实验目的。动物生态学家们在量测两个种间的竞争时倾向于选择一个基于先

验的可能强势的竞争者,而植物生态学家们更多的是量化整个植物群落中心种的总竞争。由于所有植物均需要有限的几种资源,所有植物都是潜在竞争者,因而在选择子集时几乎没有什么既定标准基础。因而,植物群落野外竞争实验的最普通类型就是有/无加入设计,其中…关联种?就是除中心种以外的整个植物群落(Goldburg 和 Baston 1992)。而对于许多动物种,可定义更严格的功能群,每一功能群由共同资源的潜在相互作用种组成 (如食种子者或食昆虫者)。这里的危险在于:虽然潜在竞争者通常由分类上相关的种 (如同属植物)选出,分类上关系较远的种同样可以共享资源并竞争资源(如,沙漠中食种子的啮齿类动物,蚂蚁和鸟可同为一功能群,Brown等1986)。

当问题兴趣在于种内竞争能力的比较以及竞争能力与性状的关系时,一种为中心种一种为关联种的种对实验通常最为合适。种的数目也会变的重要,因为检验这些关系基本上是用每一个关联种或中心种在随后统计分析中作为一个重复。在检验与竞争能力有关的种性状的假设中只使用一个种的一个性状的单一量测值不是真正的重复。例如,如果只有两个关联种进行比较,其中有较大叶子的一个种有较强的负影响,从而得出叶子大小强烈影响竞争能力的结论是无根据的,因为在每一级叶子大小中缺乏重复。各分类单位也可以有性状的不同,例如根长或养分吸收速率。由于叶子大小还和其他这类变量相混淆,将叶子大小作为是唯一的影响竞争能力的原因是没有道理的。我们建议或是在性状级别内重复物种,或是使用具有连续性状范围值的物种。

5.3.7. 直接和间接影响:怎么使用背景种,

中心种对关联种丰富度的反应表示了关联种直接影响加上所有非直接影响以及关联物种和所有背景种的高阶相互作用的影响即:净影响(net effect)。如果无背景种出现,则仅仅是量测直接影响(见下面的讨论) 。丰富度调节的间接影响(abundance-mediated indirect effects)

定义为当背景种改变了关联种丰富度时该关联种对中心种影响的改变(Abrams 等1996)。性状调节的间接影响(trait-mediated indirect effects)定义为当背景种改变关联种的每株影响时该关联种对中心种影响的改变(Abram 等1996)。

如果首要问题关注关联种对中心种的分布与丰富度的影响时,净影响可以是所希望使用的。例如,假如移出一个优势种而没有对中心种有什么影响,这是由于其他未量测的种对该优势种移除反应比中心种更快,从而导致对中心种的压制与该移出优势种对其压制相当。此时得出来自该关联种的竞争在控制中心种丰富度的作用是不重要的结论是适当的,尽管该关联种在没有背景种的情况,在两种实验中表现出对中心种的强烈直接影响。然而,如果首要

问题是关联种的哪一个性状使得该种成为优势种,量测其净竞争影响就会误导,因为背景种的性状也会影响实验结果。

因而我们一般的建议是:当问题是关于性状和竞争能力的关系,或性状对竞争等级的确定时,最好是使用两两实验,这类实验减少潜在的丰富度调节的间接影响或性状调节的间接影响。相反,对关于竞争导致的丰富度和分布变化的问题,最好在实验中将所有间接影响引入反应变量,即在所有处理中留下背景种,因为生物环境以及随之产生的间接影响复杂性不同,生境的物理环境和历史也不尽相同。

实际上,几乎所有任何野外实验设计中都不可避免背景种,因而我们不可能仅量测直接影响。消除设计的中心种和关联种以外的所有生物几乎是不可能的,甚至不是应该希望的。第一,开拓竞争(exploitation competition)本身即是一种由共同食物资源引发的间接相互作用。当这些资源是活有机体时,尽管食物本身不是设

计中的关联种或中心种,它们,很明显也必须包括在实验当中。同样,负相互作用可以通过天敌 (apparent competition,表性竞争;Holt,1997;connell ,1990)或共同互惠共生种引发, 并且移除背景种会妨碍探查这两类竞争者间的重要相互作用(但如果只是量化开拓竞争本身则是可行的)。检视这些中间的非运作种的动态,如资源,天敌或共同互惠共生种对理解相互作用的机制是非常重要的一步,第二,微生物是生物群的一部分而且可以是一系列间接影响中的重要链节,但它们是非常难以移除的。为设计和解释野外实验,关键的是认识到哪些背景种存在,并且在解释结果时引入这些知识。

5.4. 统计分析与结果解释

5.4.1. 生境比较:对分布和丰富度的竞争影响

关于竞争最普通的一个问题是竞争是否影响中心种的分布与丰富度,回答这个问题建议使用的方法是在不同生境种重复进行有背景种的有/无加入实验。这些生境包括那些中心种存在或丰富,以及那些中心种不存在或稀少的地方。这实际上是一个种群问题,而且理想的是使用种群水平的反应参数 (5.3.3节)。在一个生境类型中 (中心种丰富或稀少)最少要有两个重复实验地,因而生境条件对中心种的分布的影响能够从结果中体现出来。如果每一生境类型仅用一个实验地 (实际上,这是最常出现的),我们可做出的唯一有效的推论就是实验地是否有不同竞争强度,就是说,样地与生境混淆。

关联种可以是由既定标准选出的一个种,一组种,或整个群落 (见5.3.6节)。由于问题所关注的是一些关联种或种组出现的净后果,在实验所有处理中把所有其他种留下当做背景

种是合适的,用另一句话说,即量化所有直接和间接 (即丰富度引发和性状引发) 的影响之和。

实际实验将包含在每一个实验地建立实验区域,在该区域内加入中心种以及适当地移除关联种。重要的是将中心种个体加回到其天然生境以及加入到那些它不存在的生境以检验移植影响。这种设计还要保证中心种密度在所有处理中相同。(5.3.2节)

对一个有单一中心种,单一关联种或种组以及每一生境类型有若干实验地的实验,正确的ANOVA模型是

(5.1) ,,,,X,,,,,,,,,,,,,,,,,,ijklijijijkljkijk

式中是总体均值,是第i个关联种导致的离差 (以自然丰富度存在或移出),是第j,,,ji

个生境(中心种自然丰富或稀少)导致的离差,是第i个处理和第j个生境的相互作用,,,ij

是第j个生境内第k个实验样地导致的离差,是第i个处理与第j个生境,,,,,,,,,jkijk

内第k个实验地相互作用导致的离差,而则是在每一个实验地,处理组合内第l个重复,ijkl

所导致的离差。处理与生境均是固定因子,而实验地是随机因子,所以总的模型是一个混合正交套设计 (Mixed cross-nested)。该模型的自由度,估计均方差E(MS),以及F-检验在表5.1中列出;SAS程序在附录5.1A中。对于其统计基础理论上详细的解释请见Searle (1971)。更复杂的设计,包括实验地内区组因子,也可以使用 (第4章)。

表1 完全平衡正交套设计的ANOVA

影响自由度估计均方差 F-值

处理 t-1 222 ,,n,,hsn, MSMSe,TTS,,H,,,,,

生境 h-1 222 ,,tn,,stn,MSMS e,HS,,H,,,,

处理×生境(生境) (t-1)( h-1) 222 ,,n,,sn,MSMS e,,HS,,H,,,,, 实验地 h(s-1) 22 MSMS ,,tn,S,,Hee,,

处理×实验地(生境) (t-1)h(s-1) 22, ,n,MSMS eTS,,He,,,,,

残差 ths(n-1) 2 ,e

这个ANOVA的重要结果是处理×生境相互作用项是否明显,就是说,竞争的强度是否在中心种丰富的实验地与中心种缺失稀少的实验地之间不同。结果的期望格局在图5.4中表示即在中心种个体缺乏或稀少的实验地中竞争强度要比中心种个体丰富的实验地要大。请注意,在此分析中,处理×生境相互作用项是由处理×实验地相互作用(为分母)来检验,其检验效力是实验地数目的函数。因而,此例中最强有力的设计应使每生境类型内的实验地数目最大(表5.1中s)。很明显,如果实验地距离远,这种策略存在潜在的后勤困难。

当重复次数在所有处理因子每一水平上不一致时,实验设计称为:“非平衡” (Searle 1987)。非平衡设计因为材料不足(如有时在一个实验地内,种内或基因型内进行重复比其他更困难)或因死亡丢失重复,在生态学实验中非常常见。非平衡ANOVA设计分析起来更困

们。读者可以查阅Millken和难,而且与平衡ANOVA不一样,没有一个正确方法来分析它

Johnson (1984), Foy (1992), Shaw和Mitchell-Olds(1993)以及Newman等(1997)。SAS 6.0及更高版本可以使用Satterthwaite自由度近似对非平衡设计构建一个近似F-检验 (Sattethwaite 1946;Hooking 1985;见附录5.1A)。如果在分析中使用SAS GLM过程时,则必须使用III类平方和。源于其他类型平方和 (I 类,II类,IV类)的F-检验全是不正确的。由于在这个问题上有许多方法可用而没有一般的共识,因而研究者们必须衡量SAS所用方法对使用的某一具体设计是否适用(见第4章)。

分析包括固定和随机影响-混合模型的非平衡设计的另一种方法是最大似然法(Mclean等 1991)。该方法在SAS的MIXED程序中给出(附录5.1B)。这个方法的一个优点是它看来对非平衡设计比对标准的最小二乘法更稳定。虽然这并未被证明。它的缺点是复杂设计的计算要花很长时间而且有时会发散而得不到唯一结果。应指出此技术的文件说明并不完全清楚,尤其是那些没有较深统计训练的人们,我们强烈建议请统计学家来帮忙。

5.4.2. 种间比较:性状和竞争能力的关系。

(或种组间)竞争力比较和确定竞争力与性状关系,通常要基于每一植株的测量。我种间

们推荐使用的种间比较的方法是具有不同关联种密度的加入设计,加入一个中心种及几个性状值不同的关联种(比较竞争影响)或一个关联种及几个中心种(比较竞争反应;图5.2A)。关联种密度与中心种反应的显著关系(非零斜率)表示竞争(负斜率)或互益(正斜率)。

图5.4 有/无加入实验设计结果预测的格局。关键结果是竞争强度(由于竞争者的存在中心种多度降低)在中心种通常不存在的地方要比其存在的地方大得多(即生境×竞争相互作用)。在此例中,中心种在其多度高的生境中也比其多度低生境中生长为强,甚至在关联种不存在时亦是如此。竞争存在于两种类型的生境中,因而生境与竞争二者都可能是明显的主要影响。

这种分析是逐步递近的 (见Ear 1996,图17.1)。第一步是利用斜率一致性方法来检验中心种或关联种间密度影响的不同,ANOVA模型是

(5.2) X,,,,,,,,,,,ijkijijijk

其中是平均截距(即零密度的反应参数值),是第i种密度处理导致的离差(预测关联,,i

种密度对反应参数的影响线的平均斜率),是关联种j或中心种导致的距平均截距的离差,j

(关联种或中心种间截距的不同),是种与密度相互作用导致的离差(种间斜率的不同,,,ij

图5.2A)。此外是连续变量而是类型变量。 ,,ji

在此第一步的分析,我们只考虑相互作用项。我们忽略密度的主影响以及这个环节上种的密度,因为这些主影响只有在相互作用影响不在统计上显著区别于0时才有意义。这些分析运算的SAS程序在附录5.2中给出。只有发现斜率间存在差异,随后的多元比较才能够进行 (Ear1996, 第17.6节) 以发现哪些具体的种彼此相互不同。另外一个选择是检查具体种间或种组间的先验假设,这些检验可通过一系列具体比较(对比检验-contrast test)而不是一个总体的ANOVA。

当全体关联种使用一个零密度处理时(没有竞争者),因为不可能将一个处理水平(不同关联种)分派给该密度上的所有重复,所以该分析的一个潜在问题就浮现出来。在这种情况下,在关联种中随机分配零密度重复是合理的处理方法。(例如,

若有3个关联种和30个零密度重复,则10个重复被随机分配给每一关联种的处理)。由于在野外移除实验中,对每一关联种常常都有清楚的零密度处理存在,所以只有当所有关联种个体都加入时此问题才应被提出 (即对笼子实验或温室实验) (见5.3.4节)。

如果斜率都相同,我们就能使用下列公式来进行:? 测量平均斜率(Δ)和 ?检验种间截

)的不同: 距(,j

(5.3) X,,,,,,,,ijkijijk

注意:此模型除了缺失相互作用项以外和公式5.2一模一样。该模型的SAS程序在附录5.3中给出。明显的密度影响(非零斜率)表示竞争或互益存在。平均斜率计量了所有关联种对中心种的影响。

在中心种间的比较中,明显的物种影响仅表示在关联种所有不同密度情况下中心种,j

种之间恒有差距 (即在最大生长率或大小方面)。因为中心种相同而且在关联种不存在的情况下不应该对关联种有不同的反应,所以在比较关联种的时候,明显的物种影响问题较多。明显的关联种主影响的生物解释在5.3.4节给出。明显的中心种或关联种影响的另一解释是在处理数据时对非线性数据使用线性回归的结果。图5.5所示的例子中,两个中心种在线性回归分析中具有相同的斜率但是都有不同的截距。但是仔细观察图示可以发现两者截距实际上很相近,但是种B在低关联种密度时是强烈非线性的,如果数据不能转换为线性时,则应该使用非线性回归(第10章)。

将每株影响或反应与一个具体性状值相对应,通过性状值校正斜率,便可进行第二层统计分析 (如Goldburg 和 Landa 1991)。当物种较少,或者仅有几个分离的性状值时,在关联种或中心种之间就可以对斜率与先前的对照进行比较 (Day和

方差分析和协方差分析,协变量和控制变量

方差分析和协方差分析,协变量和控制变量 方差分析 方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。 方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。 假定条件和假设检验? 1. 方差分析的假定条件为:(1)各处理条件下的样本是随机的。(2)各处理条件下的样本是相互独立的,否则可能出现无法解析的输出结果。(3)各处理条件下的样本分别来自正态分布总体,否则使用非参数分析。(4)各处理条件下的样本方差相同,即具有齐效性。 2. 方差分析的假设检验假设有K个样本,如果原假设H0样本均数都相同,K个样本有共同的方差σ,则K个样本来自具有共同方差σ和相同均值的总体。如果经过计算,组间均方远远大于组内均方,则推翻原假设,说明样本来自不同的正态总体,说明处理造成均值的差异有统计意义。否则承认原假设,样本来自相同总体,处理间无差异。 作用 一个复杂的事物,其中往往有许多因素互相制约又互相依存。方差分析的目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最佳水平等。方差分析是在可比较的数组中,把数据间的总的“变差”按各指定的变差来源进行分解的一种技术。对变差的度量,采用离差平方和。方差分析方法就是从总离差平方和分解出可追溯到指定来源的部分离差平方和,这是一个很重要的思想。经过方差分析若拒绝了检验假设,只能说

spss学习系列23.协方差分析

(一)原理 一、基本思想 在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著影响。如果忽略这些因素的影响,则有可能得到不正确的结论。这种影响的变量称为协变量(一般是连续变量)。 例如,研究3种不同的教学方法的教学效果的好坏。检查教学效果是通过学生的考试成绩来反映的,而学生现在考试成绩是受到他们自身知识基础的影响,在考察的时候必须排除这种影响。 协方差分析将那些难以控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对于观察变量的影响,从而实现对控制变量效果的准确评价。 协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间没有交互影响。前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量,而协方差分析中既包含了定性变量(控制变量),又包含了定量变量(协变量)。 协方差分析在扣除协变量的影响后再对修正后的主效应进行方差分析,是一种把直线回归或多元线性回归与方差分析结合起来的方法,其中的协变量一般是连续性变量,并假设协变量与因变量间存在线性关系,且这种线性关系在各组一致,即各组协变量与因变量所建立的回归直线基本平行。 当有一个协变量时,称为一元协方差分析,当有两个或两个以上的协变量时,称为多元协方差分析。

二、协方差分析需要满足的条件 (1)自变量是分类变量,协变量是定距变量,因变量是连续变量;对连续变量或定距变量的协变量的测量不能有误差; (2)协变量与因变量之间的关系是线性关系,可以用协变量和因变量的散点图来检验是否违背这一假设;协变量的回归系数(即各回归线的斜率)是相同的,且不等于0,即各组的回归线是非水平的平行线。否则,就有可能犯第一类错误,即错误地接受虚无假设; (3) 自变量与协变量相互独立,若协方差受自变量的影响,那么协方差分析在检验自变量的效应之前对因变量所作的控制调整将是偏倚的,自变量对因变量的间接效应就会被排除; (4)各样本来自具有相同方差σ2的正态分布总体,即要求各组方差齐性。 三、基本理论 1. 观测值=均值+分组变量影响+协变量影响+随机误差. 即 ()ij i ij ij y u t x x βε=++-+ (1) 其中,X 为所有协变量的平均值。 注:在方差分析中,协变量影响是包含在随机误差中的,在协方差分析中需要分离出来。 用协变量进行修正,得到修正后的y ij (adj)为 (adj)()ij ij ij i ij y y x x u t βε=--=++ 就可以对y ij (adj)做方差分析了。关键问题是求出回归系数β. 2. 总离差=分组变量离差+协变量离差+随机误差,

协方差分析理论与案例

协方差分析理论与案例 假设我们有N 个个体的K 个属性在T 个不同时期的样本观测值,用it y ,it x ,…,N,t=1,…,T,k=1,…,K 表示。一般假定y 的观测值是某随机实验的结果,该实验结果在属性向量x 和参数向量θ下的条件概率分布为(,)f y x θ。使用面板数据的最终目标之一就是利用获取的信息对参数θ进行统计推断,譬如常假设假定的y 是关于x 的线性函数的简单模型。协方差分析检验是识别样本波动源时广泛采用的方法。 方差分析:常指一类特殊的线性假设,这类假设假定随机变量y 的期望值仅与所考察个体所属的类(该类由一个或多个因素决定)有关,但不包括与回归有关的检验。而协方差分析模型具有混合特征,既像回归模型一样包含真正的外生变量,同时又像通常的方差一样允许每个个体的真实关系依赖个体所属的类。 常用来分析定量因素和定性因素影响的线性模型为: *,1,,,1,,it it it it it y x u i N t T αβ'=++=???=??? 从两个方面对回归系数估计量进行检验:首先,回归斜率系数的同质性;其 次,回归截距系数的同质性。检验过程主要有三步: (1) 检验各个个体在不同时期的斜率和截距是否都相等; (2) 检验(各个体或各时期的)回归斜率(向量)是否都相等; (3) 检验各回归截距是否都相等。 显然,如果接受完全同同质性假设(1),则检验步骤中止。但如果拒绝了完全同质性性假设,则(2)将确定回归斜率是否相同。如果没有拒绝斜率系数的同质性假设,则(3)确定回归截距是否相等。(1)是从(2)、(3)分离出来的。 基本思想:在作两组或多组均数1y ,2y ,…,k y 的假设检验前,用线性回归分析方法找出协变量X 与各组Y 之间的数量关系,求得在假定X 相等时修定均数1y ',2y ',…,k y '然后用方差分析比较修正均数间的差别,这就是协方差分析的基本思想。 协方差分析的应用条件:⑴要求各组资料都来自正态总体,且各组的方差相等;(t 检验或方差分析的条件)⑵各组的总体回归系数i β相等,且都不等于0(回归方程检验)。因此,应用协方差分析前,要对资料进行方差齐性检验和回归系数的假设检验(斜率同质性检验),只有满足上述两个条件之后才能应用,否则不宜使用。 ⑴各比较组协变量X 与分析指标Y 存在线性关系(按直线回归分析方法进行判断)。 ⑵各比较组的总体回归系数i β相等,即各直线平行(绘出回归直线,看是否

方差分析(ANOVA)与协方差分析(ANCOVA)

方差分析(ANOVA)与协方差分析(ANCOVA) 第5章方差分析(ANOVA)与协方差分析(ANCOVA) ——野外竞争试验 Deborah E.Goldberg Samuel M.Scheiner 5.1 引言 自从达尔文时期,竞争就占据了生态理论的中心,关于竞争的实验在许多来自许多不同环境的多生物种之间开展过(Jackson,1981综述; Connell,1984; Schoener,1984; Hairston,1989; Gurevitch,1992)。有各种各样的竞争实验,而本章的重点则放在怎样为具体的竞争问题选择适当的实验设计和统计分析。这类选择取决于所研究问题及系统的许多方面。对于大多数我们所给出的设计、基本的统计方法、方差分析(ANOVA)和协方差分析(ANCOVA)在实验设计与分析的教科书中也有详尽描述,我们在这里就不像本书其他章节那样提供详细的统计细节。对于ANOVA的基本介绍见第四章。虽然我们着重于竞争,但许多观点对其他类型的种间关系实验同样有效,如捕食者—猎物关系或者互惠共生关系。 5.2 关于竞争的生态问题 我们可以提出关于竞争的最简单问题莫过于竞争是否在野外存在,要回答这个问题,就必须利用实验处理,使潜在竞争者们的绝对多度可被控制,同时检验处理中存在低多度潜在竞争者时物种是否可能生长的更好。这类多度处理之间生长的差异即是竞争的量纲(或促进facilitation的量纲如果在较高多度下生长较佳)。在任何野外竞争调查中,发现是否存在竞争是重要的第一步,但是,就其本身而言,并没有什么意义。多数关于竞争的重要问题包括竞争强度的比较以及随之而来的实

spss协方差分析的基本原理-最棒的

协方差分析的基本原理 1.协方差分析的提出 无论是单因素方差分析还是多因素方差分析,它们都有一些人为可以控制的控制变量。在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著影响。如果忽略这些因素的影响,则有可能得到不正确的结论。 例如,研究3种不同的教学方法的教学效果的好坏。检查教学效果是通过学生的考试成绩来反映的,而学生现在考试成绩是受到他们自身知识基础的影响,在考察的时候必须排除这种影响。又比如,考查受教育程度对个人工资是否有显著影响,这时必须考虑工作年限因素。一般情况下,工作年限越长,工资就越高。在研究此问题时必须排除工作年限因素的影响,才能得出正确的结论。再如,如果要了解接受不同处理的小白鼠经过一段时间饲养后体重增加量有无差别,已知体重的增加和小白鼠的进食量有关,接受不同处理的小白鼠其进食量可能不同,这时为了控制进食量对体重增加的影响,可在统计阶段利用协方差分析(Analysis of Covariance),通过统计模型的校正使得各组在“进食量”这个变量的影响上相等,即将进食量作为协变量,然后分析不同处理对小白鼠体重增加量的影响。 为了更加准确地控制变量不同水平对结果的影响,应该尽量排除其它在实验设计阶段难以控制或者是无法严格控制的因素对分析结果的影响。利用协方差分析就可以完成这样的功能。协方差分析将那些难以控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对于观察变量的影响,从而实现对控制变量效果的准确评价。 协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间没有交互影响。前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量,而协方差分析中既包含了定性变量(控制变量),又包含了定量变量(协变量)。协方差分析在扣除协变量的影响后再对修正后的主效应进行方差分析,是一种把直线回归或多元线性回归与方差分析结合起来的方法,其中的协变量一般是连续性变量,并假设协变量与因变量间存在线性关系,且这种线性关系在各组一致,即各组协变量与因变量所建立的回归直线基本平行。当有一个协变量时,称为一元协方差分析,当有两个或两个以上的协变量时,称为多元协方差分析。以下将以一元协方差分析为例,讲述协方差分析的基本思想和步骤。 2.协方差分析的计算公式 以单因素协方差分析为例,总的变异平方和表示为: Q Q Q Q ++ 总控制变量协变量随机变量 = 协方差分析仍然采用F检验,其零假设 H为多个控制变量的不同水平下,各总体平均值没有显著差异。 F统计量计算公式为: 2 2 S F S 控制变量 控制变量 随机变量 =, 2 2 S F S 协变量 协变量 随机变量 = 以上F统计量服从F分布。SPSS将自动计算F值,并根据F分布表给出相应的相伴概率值。 如果F 控制变量 的相伴概率小于或等于显著性水平,则控制变量的不同水平对观察变量产生了显著的影响;如 果F 协变量 的相伴概率小于或等于显著性水平,则协变量的不同水平对观察变量产生了显著的影响。 3.协方差分析需要满足的假设条件 (1)自变量是分类变量,协变量是定距变量,因变量是连续变量; (2)对连续变量或定居变量的协变量的测量不能有误差; (3)协变量与因变量之间的关系是线性关系,可以用协变量和因变量的散点图来检验是否违背这一假设;(4)协变量的回归系数是相同的。在分类变量形成的各组中,协变量的回归系数(即各回归线的斜率)必须是相等的,即各组的回归线是平行线。如果违背了这一假设,就有可能犯第一类错误,即错误地接受虚无假设。

协方差分析

第十一节协方差分析 (analysis of covariance) 在各种试验设计中,对应变量(dependent variable)Y 研究时,常希望其他可能影响Y的变量在各组间保持基本一致,以达到均衡可比。例如:比较几种药物的降压作用,各试验组在原始血压、性别、年龄等指标应无差异。

第十一节协方差分析 有时这些变量不能控制,须在统计分析时,通过一定方法来消除这些变量的影响后,再对应变量y作出统计推断。称这些影响变量为协变量(Covariate)。 如果所控制的变量是分类变量时,可用多因素的方差分析; 当要控制的变量是连续型变量时,可用协方差分析,以消除协变量的影响,或将协变量化成相等后,对y的修正均数进行方差分析。

第十一节协方差分析 例如:比较几种不同饲料对动物体重增加的作用,可把动物的进食量作为协变量。 比较大学生和运动员的肺活量时,可把身高作为协变量。 比较治疗后二组舒张压的大小,可把治疗前的舒张压作为协变量。

第十一节协方差分析 协方差分析的基本原理: 协方差分析是把直线回归和方差分析结合起来的一种统计分析方法。当不同处理结果的y值受协变量x的影响时,先找出y与x的直线关系,求出把x值化为相等后y的修正均数,然后进行比较,这样就能消除x对y的影响,更恰当地评价各种处理的作用。

协方差分析的步骤 ±观察指标服从正态分布、方差齐性、各观察相互独立H检验分组因素与协变量x是否有交互作用。对上例,即是否雌雄羔羊进食量相同,它们的体重增加量却不相同。如检验结果分组因素与协变量x间没有交互作用,即说明雌雄羔羊进食量相同的情况下,它们的体重增加量是相同的。进行第二项检验: H检验协变量与应变量之间是否存在线性关系。如果不存在线性关系,则不能简单地运用协方差分析,因为协方差分析是利用协变量x与应变量y之间的线性回归关系扣除协变量x对y的影响。必要时可考虑进行变量转换。如果检验结果协变量与应变量之间存在线性关系,则进行第三项检验: H进一步扣除x对y影响的前提下,检验各组的修正均数差别是否有统计学意义。

协方差分析

协方差分析 某城市教育局在一次对全市初中一年级至高中三年级学生的调查研究中想要考察身心发展对学习成绩的影响,研究者手机了各学校初一年级至高三年级学生的学业成绩以及相关身心发展量表得分,在分析时以学生所在年级来代表年龄差异,但是由于男同学与女同学的身心发展存在差异,因此需要在结果中排除性别因素,然而无法在收集数据时只收集男同学的数据或收集女同学的数据,那么该如何排除性别因素对结果的影响呢? 在实验设计中,考虑到实际的实验情形,无法一一排除某些会影响实验结果的无关变量(干扰变量),为了排除这些不能在实验处理中所操作的变量,而其结果又会影响因变量,可以通过“统计控制”的方法来弥补实验控制的不足,为了提高实验研究的内在效率,必须将可能干扰实验结果的无关变量加以控制,不致产生严重的系统性误差。控制系统误差的方法有很多,例如以随机的方式将被试分配至不同群体;将系统误差加入实验设计,使其变成一个自变量;尽可能控制可控制的系统误差如光纤亮度、噪音等。 实验研究的优点众所周知,即其严密的逻辑性以及可以良好的控制误差,但是让一个标准的实验设计走出实验室,在社会科学领域实施通常比较困难。因此在社会科学领域中经常实施的是准实验设计,在准实验设计中无法使用实验控制法来完全控制无关的干扰变量,故经常增加实验内在效度的方法——统计控制法,最常用的便是协方差分析(analysis of covariance,ANCOV A)。 顾名思义,协方差分析是方差分析的一种,它也包括自变量与因变量,同方差分析,因变量为连续变量且需要满足方差分析关于因变量的假设条件,自变量为分类变量。不同的是,并不是实验所关注的自变量却为研究者进行控制的一类变量被加入分析,它们被称为“协变量”(covariate),要注意,协变量是连续变量。 1.协方差分析的假设 协方差分析的基本假设与方差分析相同,包括变量的正态性、观测值独立、方差齐性等,此外还有三个重要的假设: 1)因变量与协方差之间直线关系; 2)所测量的协变量不应有误差,如果选用的是多项的量表,应有高的内部一致性信度或重 测信度,α系数最好大于0.80。这一假设若被违反会造成犯一类错误的概率上升,降低统计检验力。 3)“组内回归系数同质性”(homogeneity of with in rgression),各实验处理组中一举 协变量(X)预测因变量(Y)的回归线的回归系数要相等,即斜率相等,各条回归线平行。如果斜率不等则不宜直接进行协方差分析。 2.协方差分析的方差分解 方差分析的原理是将因变量的总方差分解成自变量效果(组间)与误差效果(组内)两个部分,再进行F检验。协方差使用的也是这样的方差分析思路,将因变量的总方差先行分割为协变量可解释部分与不可解释部分,不可解释的部分再由方差分析原理进行拆解。协方差分析的方差拆解如下: 3.协方差分析的步骤 协方差分析结合了回归分析与方差分析的方法,计算方法比较复杂,由于涉及回归分析的基本思路,因此一下内容也许需要在阅读了本章第六部分“一元线性回归分析”后理解得更加透彻。 以单因素协方差分析为例说明协方差分析的步骤: 1)协方差分析的准备 (B:组间;W:组内;T:总和;n:组内样本容量;k:组间容量;x:协变量;y:因变量)

23. 协方差分析

23. 协方差分析 一、基本原理 1. 基本思想 在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著影响。如果忽略这些因素的影响,则有可能得到不正确的结论。这种影响的变量称为协变量(一般是连续变量)。 例如,研究3种不同的教学方法的教学效果的好坏。检查教学效果是通过学生的考试成绩来反映的,而学生现在考试成绩是受到他们自身知识基础的影响,在考察的时候必须排除这种影响。 协方差分析将那些难以控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对于观察变量的影响,从而实现对控制变量效果的准确评价。 协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间没有交互影响。前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量,而协方差分析中既包含了定性变量(控制变量),又包含了定量变量(协变量)。 协方差分析在扣除协变量的影响后再对修正后的主效应进行方差分析,是一种把直线回归或多元线性回归与方差分析结合起来的方法,其中的协变量一般是连续性变量,并假设协变量与因变量间存在线性关系,且这种线性关系在各组一致,即各组协变量与因变量所建立的回归直线基本平行。 当有一个协变量时,称为一元协方差分析,当有两个或两个以上

的协变量时,称为多元协方差分析。 2. 协方差分析需要满足的条件 (1)自变量是分类变量,协变量是定距变量,因变量是连续变量;对连续变量或定距变量的协变量的测量不能有误差; (2)协变量与因变量之间的关系是线性关系,可以用协变量和因变量的散点图来检验是否违背这一假设;协变量的回归系数(即各回归线的斜率)是相同的,且不等于0,即各组的回归线是非水平的平行线。否则,就有可能犯第一类错误,即错误地接受虚无假设; (3) 自变量与协变量相互独立,若协方差受自变量的影响,那么协方差分析在检验自变量的效应之前对因变量所作的控制调整将是偏倚的,自变量对因变量的间接效应就会被排除; (4)各样本来自具有相同方差σ2的正态分布总体,即要求各组方差齐性。 二、协方差理论 1. 观测值=均值+分组变量影响+协变量影响+随机误差. 即 ()ij i ij ij y u t x x βε=++-+ (1) 其中,X 为所有协变量的平均值。 注:在方差分析中,协变量影响是包含在随机误差中的,在协方差分析中需要分离出来。 用协变量进行修正,得到修正后的y ij (adj)为 (adj)()ij ij ij i ij y y x x u t βε=--=++

最新协方差分析在教学评价中的应用

协方差分析在教学评价中的应用

协方差分析在教学评价中的应用 摘要:通过回归分析和方差分析方法的结合,协方差分析方法能够有效地消除混杂因素对分析指标的影响.运用SPSS软件,对某 高校六个班一门基础课和一门专业课上下学期的期末成绩进 行了协方差分析.结论显示,协方差分析方法能够对教学效率 做出更合理的评价. 关键词: 协方差分析教学效率方差分析 一前言 方差分析是从质量因子探讨不同因素水平对实验指标影响的差异.一般来说,质量因子是可以人为控制的.回归分析是从数量因子的角度出发,通过建立回归方程来研究实验指标与一个(或几个)因子之间的数量关系.大多数情况下,数量因子是不可以人为加以控制的. 协方差分析是建立在方差分析和回归分析基础之上的一种统计分析方法.在许多有关效果评价的实验中,经常会出现可控制的质量因子和不可控制的数量因子同时影响实验结果的情况,这时就需要采用协方差分析的统计处理方法,将质量因子与数量因子(即协变量)综合起来加以考虑. 比如,在实际的教学管理中,要评价教学效率和质量,比较不同班级同一课程的学习效率,除了要考虑使用教程、教师素质、教学方法、

班级学风、学生学习努力程度这些当前影响因素以外,学生的前期学习基础差异也影响着当前的教学效率.为了能够准确地考查评价教学效率,必须消除前期学习基础差异这些因素的影响,才能得到正确的评价. 方差分析法忽视了学生的基础成绩对当前成绩的影响,没有考虑学生的基础成绩这一混杂因素的影响,仅仅对当前的学生学习成绩进行评价,得出的结论就不能全面客观地反映实际教学效率. 本研究采用协方差分析法,利用一个教学班两个学期的物流管理课程期末成绩和配送中心管理课程期末成绩的数据,对教学效率的评价问题进行了研究. 二协方差分析及公式 为了提高实验效果的精确性,需要尽力排除影响实验结果的其他因素,即非处理因素(混杂因素)的干扰和影响,使各处理间尽量一致,再对各处理因素做方差分析,这就是协方差分析. 协方差分析的基本思想是在作两组或多组均数yi(i =1,2,…, n)之间的比较前,用直线回归方法找出各组因变量与协变量之间的数量关系,求得在假定协变量相等时的修正均数yi(i =1,2,…, n),然后用方差分析比较修正均数的差别.协方差分析涉及一些较深的统计理论, (1)计算各组的均值、平方和及协方和:

方差分析和回归分析的区别与联系

一、方差分析和回归分析的区别与联系?(以双变量为例) 联系: 1、概念上的相似性 回归分析是为了分析变量间的因果关系,研究自变量X取不同值时,因变量平均值Y的变化。运用回归分析方法,可以从变量的总偏差平方和中分解出已被自变量解释掉的误差(解释掉误差)和未被解释掉的误差(剩余误差); 方差分析是为了分析或检验总体间的均值是否有所不同。通过对样本中自变量X取不同值时所对应的因变量Y均值的比较,推论到总体变量间是否存在关系。运用方差分析,也可以从变量的总离差平方和中分解出已被自变量解释掉的误差和未被自变量解释掉的误差。因此两种分析在概念上所具有的相似性是显而易见的。 2、统计分析步骤的相似性 回归分析在确定自变量X是否为因变量Y的影响因素时,从分析步骤上先对X和Y进行相关分析,然后建立变量间的回归模型。最后再进行参数的统计显着性检验或对回归模型的统计显着性进行检验。 方差分析在确定X是否是Y的影响因素时,是先从样本所的数据的分析入手,然后考察数据模型,最后对样本均值是否相等进行显着性检验。二者在分析步骤上也具有相似性。 3、假设条件具有一定的相似性 回归分析有五个基本假定,分别是:自变量可以是随机变量也可以是非随机变量;X与Y之间存在的非确定性的相关关系,要求Y的所有子总体,其方差都相等;子总体均值在一条直线上;随机变量Y i是统计独立的,即Y1的数值不影响Y2的数值,各Y值之间都没有关系;Y 值的每一个子总体都满足正态分布。 方差分析的基本假定有:等方差性(总体中自变量的每一取值所对应因变量Y i的分布都具有相同方差);Y i的分布为正态分布。 二者在假设条件上存在着相同。 4、在总离差平方和中的分解形式和逻辑上的相似性 回归分析中,TSS=RSS+RSSR,而在方差分析中,TSS=RSS+BSS。二者均是以已解释掉的误差与未被解释掉的误差之和为总离差平方和。 5、确定影响因素上的相似性 为简化分析起见,我们假设只有一个自变量X影响因变量Y。在回归分析中,要确定X是否是Y 的影响因素,就要看当X已知时,对Y的总偏差有无影响。如果X不是影响Y的因素,等同于只知变数Y的数据列一样,此时用Y去估计每个丫的值,所犯的错误(即偏差)为最小。如果因素X 是影响Y的因素,那么当已知X值后 6、在统计显着性检验上具有相似性 回归分析的总显着性检验,是一种用R2测量回归的全部解释功效的检验。检验RSSR*(N-2)/RSS,方差分析的显着性检验是一种根据样本数据提取信息所进行的显着性检验。它也是通过F检验进行的。 区别: 1、研究变量的分析点不同 回归分析法既研究变量Y又研究变量X并在此基础上集中研究变量Y与X的函数关系,得到的是在不独立的情况下自变量与因变量之间的更加精确的回归函数式,也即判断相关关系的类型,因此需建立模型并估计参数。方差分析法集中研究变量Y的值及其变差而变量X值仅用来把Y值划分为子群或组,得到的是自变量(因素)对总量Y是否具有显着影响的整体判断,因此不需要建立模型和估计参数。

SPSS学习系列23. 协方差分析

23. 协方差分析 (一)原理 一、基本思想 在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著影响。如果忽略这些因素的影响,则有可能得到不正确的结论。这种影响的变量称为协变量(一般是连续变量)。 例如,研究3种不同的教学方法的教学效果的好坏。检查教学效果是通过学生的考试成绩来反映的,而学生现在考试成绩是受到他们自身知识基础的影响,在考察的时候必须排除这种影响。 协方差分析将那些难以控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对于观察变量的影响,从而实现对控制变量效果的准确评价。 协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间没有交互影响。前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量,而协方差分析中既包含了定性变量(控制变量),又包含了定量变量(协变量)。 协方差分析在扣除协变量的影响后再对修正后的主效应进行方差分析,是一种把直线回归或多元线性回归与方差分析结合起来的方法,其中的协变量一般是连续性变量,并假设协变量与因变量间存在线性关系,且这种线性关系在各组一致,即各组协变量与因变量所建立的回归直线基本平行。 当有一个协变量时,称为一元协方差分析,当有两个或两个以上

的协变量时,称为多元协方差分析。 二、协方差分析需要满足的条件 (1)自变量是分类变量,协变量是定距变量,因变量是连续变量;对连续变量或定距变量的协变量的测量不能有误差; (2)协变量与因变量之间的关系是线性关系,可以用协变量和因变量的散点图来检验是否违背这一假设;协变量的回归系数(即各回归线的斜率)是相同的,且不等于0,即各组的回归线是非水平的平行线。否则,就有可能犯第一类错误,即错误地接受虚无假设; (3)自变量与协变量相互独立,若协方差受自变量的影响,那么协方差分析在检验自变量的效应之前对因变量所作的控制调整将是偏倚的,自变量对因变量的间接效应就会被排除; (4)各样本来自具有相同方差σ2的正态分布总体,即要求各组方差齐性。 三、基本理论 1. 观测值=均值+分组变量影响+协变量影响+随机误差. 即 ()ij i ij ij y u t x x βε=++-+(1) 其中,X 为所有协变量的平均值。 注:在方差分析中,协变量影响是包含在随机误差中的,在协方差分析中需要分离出来。 用协变量进行修正,得到修正后的y ij (adj)为 (adj)()ij ij ij i ij y y x x u t βε=--=++ 就可以对y ij (adj)做方差分析了。关键问题是求出回归系数β.

第一节方差分析原理.doc

第一节方差分析原理 一、方差分析基本思想 方差分析( analysis of variance ,或缩写 ANOVA )又称变异数分析,是一种应用非常广 泛的统计方法。其主要功能是检验两个或多个样本平均数的差异是否有统计学意义,用以推断它们的总体均值是否相同。它是真正用来进行上述“多组比较”问题的正确方法,从这个意 义上说,它可看成是t 检验等“两组比较法”的推广。理解方差分析的原理,主要在于其基本思想,而不在于数学推导。 以单因素完全随机化实验设计为例(这是最简单的多组实验设计)介绍方差分析的原理。注意下面列出的该种设计的数学模式,假设有 k 个处理,每个处理下有n 个被试,一共有nk 个被试。 K 个处理下的数据构成比较中的k 个组或 k 个样本。 理T 1 T 2 ?T j ?T k X 11 X 12 ?X 1j ?X 1k X 21 X 22 ?X 2j ?X 2k 各?????? 数据X i1 X i2 ?X ij ?X ik ?????? X n1 X n2 ?X nj ?X nk 不失一般地,其对应的图示如下:

根据测量学中的真分数理论,观测值等于真值和误差之和;据此,对照上面的数据可得到下面的数学模型: 其中: X ij 指第 j 个处理下的第 i 个被试的实验数据; μ 指总体均值;在图中样本数据中,即红色线表示的总平均; μ 指第 j 个处理的均值; j τ 称为第 j 个处理的效应;通常,τj=μj–μ,也即各组均值偏离总平均的离差; j ε ij 为随机误差( idd 表示误差独立同分布);在该模型中,误差就是各组中数据偏离 其组均值的离差。因为根据单因素完全随机化设计的特点,同组中的被试,其各方面条件都相同,接受的处理也相同,其观测值间的差异只能归结为随机误差。 首先对检验的零假设进行变换: 下面我们就需要构造一个统计量使得它在Ho"下无未知量且有精确的分布,以进行假设2 检验。由于τj是每个处理的平均数与总平均之差,所以我们考虑从数据的离均差的平方 入手来构造统计量: 对每个观测数据: 即:任意一个数据与总平均数的离差= 该数与所在组平均数的离差+ 所在组的平均数与总平均数的离差。 我们针对第j 组中每个数据的上述分解式的平方求和得:

方差分析和相关分析与回归分析

《统计学》实验五 一、实验名称:方差分析 二、实验日期: 2010年12月3日 三、实验地点:经济管理系实验室 四、实验目的和要求 目的:培养学生利用EXCEL进行数据处理的能力,熟练掌握利用EXCEL 进行方差分析,对方差分析结果进行分析 要求:就本专业相关问题收集一定数量的数据,用EXCEL进行方差分析 五、实验仪器、设备和材料:个人电脑(人/台),EXCEL 软件 六、实验过程 (一)问题与数据 消费者与产品生产者、销售者或服务的提供者之间经常发生纠纷。当分生纠纷后,消费者常常会向消费者协会投诉。为了对几个行业的服务质量进行评价,消费者协会在零售业、旅游业、航空公司、家电制造业分别抽取了不同的企业作为样本。其中零售业抽取7家、旅游业抽取6家、航空公司抽取5家、家电制造业抽取5家。具体数据如下: 取显著性水平α=0.05,检验行业不同是否会导致消费者投诉的显著性差异?(二)实验步骤 1、进行假设 2、将数据拷贝到EXCEL表格中 3、选择“工具——数据分析——单因素方差分析”,得到如下结果:

(三)实验结果分析:由以上结果可知:F>F crit=3.4066或P-value=0.0387657<0.05,拒绝原假设,表明行业对消费者投诉有着显著差异。 实验心得体会 在这学习之前我们只学习了简单的方差计算,现在运用计算机进行方差分析,可以做出更多的比较。通过使用计算机可以很快的计算出组间和组内的各种数值,便于我们进行比较分析。

《统计学》实验六 一、实验名称:相关分析与回归分析 二、实验日期: 2010年12月3日 三、实验地点:经济管理系实验室 四、实验目的和要求 目的:培养学生利用EXCEL进行数据处理的能力,熟练掌握EXCEL绘制散点图,计算相关系数,拟合线性回归方程,拟合简单的非线性回归方程,利用回归方程进行预测。 要求:就本专业相关问题收集一定数量的数据,用EXCEL进行相关回归分析(计算相关系数,一元线性回归分析,一元线性回归预测) 五、实验仪器、设备和材料:个人电脑(人/台),EXCEL 软件 六、实验过程 (一)问题与数据 10个学生每天用于学习英语的时间和期末考试的成绩的数据如下表所示。要求, (1)绘制学习英语的时间和期末考试的成绩的散点图,判断2者之间的关系 形态 (2)计算学习英语的时间和期末考试的成绩的线性相关系数 (3)用学习英语的时间作自变量,期末考试成绩作因变量,求出估计的回归方程。 (4)求每天学习英语的时间为150分钟时,销售额95%的置信区间和预测区间。 学生时间(分钟)成绩(分) A 120 85 B 60 65 C 100 76 D 70 71 E 80 74 F 60 65 G 30 54 H 40 60 I 50 62

方差分析和回归分析的区别与联系

方差分析和回归分析的区 别与联系 Prepared on 22 November 2020

一、方差分析和回归分析的区别与联系(以双变量为例) 联系: 1、概念上的相似性 回归分析是为了分析变量间的因果关系,研究自变量X取不同值时,因变量平均值Y的变化。运用回归分析方法,可以从变量的总偏差平方和中分解出已被自变量解释掉的误差(解释掉误差)和未被解释掉的误差(剩余误差); 方差分析是为了分析或检验总体间的均值是否有所不同。通过对样本中自变量X取不同值时所对应的因变量Y均值的比较,推论到总体变量间是否存在关系。运用方差分析,也可以从变量的总离差平方和中分解出已被自变量解释掉的误差和未被自变量解释掉的误差。因此两种分析在概念上所具有的相似性是显而易见的。 2、统计分析步骤的相似性 回归分析在确定自变量X是否为因变量Y的影响因素时,从分析步骤上先对X 和Y进行相关分析,然后建立变量间的回归模型。最后再进行参数的统计显着性检验或对回归模型的统计显着性进行检验。 方差分析在确定X是否是Y的影响因素时,是先从样本所的数据的分析入手,然后考察数据模型,最后对样本均值是否相等进行显着性检验。二者在分析步骤上也具有相似性。 3、假设条件具有一定的相似性 回归分析有五个基本假定,分别是:自变量可以是随机变量也可以是非随机变量;X与Y之间存在的非确定性的相关关系,要求Y的所有子总体,其方差都相等;子总体均值在一条直线上;随机变量Y i是统计独立的,即Y1的数值不

影响Y2的数值,各Y值之间都没有关系;Y值的每一个子总体都满足正态分布。 方差分析的基本假定有:等方差性(总体中自变量的每一取值所对应因变量Y i 的分布都具有相同方差);Y i的分布为正态分布。 二者在假设条件上存在着相同。 4、在总离差平方和中的分解形式和逻辑上的相似性 回归分析中,TSS=RSS+RSSR,而在方差分析中,TSS=RSS+BSS。二者均是以已解释掉的误差与未被解释掉的误差之和为总离差平方和。 5、确定影响因素上的相似性 为简化分析起见,我们假设只有一个自变量X影响因变量Y。在回归分析中,要确定X是否是Y的影响因素,就要看当X已知时,对Y的总偏差有无影响。如果X不是影响Y的因素,等同于只知变数Y的数据列一样,此时用Y去估计每个丫的值,所犯的错误(即偏差)为最小。如果因素X是影响Y的因素,那么当已知X 值后 6、在统计显着性检验上具有相似性 回归分析的总显着性检验,是一种用R2测量回归的全部解释功效的检验。检验RSSR*(N-2)/RSS, 方差分析的显着性检验是一种根据样本数据提取信息所进行的显着性检验。它也是通过F检验进行的。 区别: 1、研究变量的分析点不同

方差分析与协方差分析

方差分析 方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。 方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。 方差分析的作用 一个复杂的事物,其中往往有许多因素互相制约又互相依存。方差分析的目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最佳水平等。方差分析是在可比较的数组中,把数据间的总的“变差”按各指定的变差来源进行分解的一种技术。对变差的度量,采用离差平方和。方差分析方法就是从总离差平方和分解出可追溯到指定来源的部分离差平方和,这是一个很重要的思想。 经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。 方差分析的分类及举例

一、单因素方差分析 (一)单因素方差分析概念理解步骤 是用来研究一个控制变量的不同水平是否对观测变量产生 了显著影响。这里,由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析。 例如,分析不同施肥量是否给农作物产量带来显著影响,考察地区差异是否影响妇女的生育率,研究学历对工资收入的影响等。这些问题都可以通过单因素方差分析得到答案。 单因素方差分析的第一步是明确观测变量和控制变量。例如,上述问题中的观测变量分别是农作物产量、妇女生育率、工资收入;控制变量分别为施肥量、地区、学历。 单因素方差分析的第二步是剖析观测变量的方差。方差分析认为:观测变量值的变动会受控制变量和随机变量两方面的影响。据此,单因素方差分析将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分,用数学形式表述为:SST=S SA+SSE。 单因素方差分析的第三步是通过比较观测变量总离差平方和各部分所占的比例,推断控制变量是否给观测变量带来了显著影响。 (二)单因素方差分析原理总结 容易理解:在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由控制变量引起

方差分析与协方差分析

方差分析 方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。 方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。 方差分析的作用 一个复杂的事物,其中往往有许多因素互相制约又互相依存。方差分析的目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最佳水平等。方差分析是在可比较的数组中,把数据间的总的“变差”按各指定的变差来源进行分解的一种技术。对变差的度量,采用离差平方和。方差分析方法就是从总离差平方和分解出可追溯到指定来源的部分离差平方和,这是一个很重要的思想。 经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。 方差分析的分类及举例

一、单因素方差分析 (一)单因素方差分析概念理解步骤 是用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。这里,由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析。 例如,分析不同施肥量是否给农作物产量带来显著影响,考察地区差异是否影响妇女的生育率,研究学历对工资收入的影响等。这些问题都可以通过单因素方差分析得到答案。 单因素方差分析的第一步是明确观测变量和控制变量。例如,上述问题中的观测变量分别是农作物产量、妇女生育率、工资收入;控制变量分别为施肥量、地区、学历。 单因素方差分析的第二步是剖析观测变量的方差。方差分析认为:观测变量值的变动会受控制变量和随机变量两方面的影响。据此,单因素方差分析将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分,用数学形式表述为:SST=S SA+SSE。 单因素方差分析的第三步是通过比较观测变量总离差平方和各部分所占的比例,推断控制变量是否给观测变量带来了显著影响。 (二)单因素方差分析原理总结 容易理解:在观测变量总离差平方和中,如果组间离差平方和 所占比例较大,则说明观测变量的变动主要是由控制变量引起的,

协方差分析及协变量

残差平方和 概念: 为了明确解释变量和随机误差各产生的效应是多少,统计学上把数据点与它在回归直线上相应位置的差异称残差,把每个残差的平方后加起来称为残差平方和,它表示随机误差的效应。 意义: 每一点的y值的估计值和实际值的差的平方之和称为残差平方和,而y 的实际值和平均值的差的平方之和称为总平方和。 定义: 协方差是关于如何调节协变量对因变量的影响效应,从而更加有效地分析实验处理效应的一种统计技术,也是对实验进行统计控制的一种综合方差分析和回归分析的方法。 意义 当研究者知道有些协变量会影响因变量,却不能够控制和不感兴趣时(当研究学习时间对学习绩效的影响,学生原来的学习基础、智力学习兴趣就是协变量),可以在实验处理前予以观测,然后在统计时运用协方差分析来处理。 将协变量对因变量的影响从自变量中分离出去,可以进一步提高实验精确度和统计检验灵敏度。 方差是用来度量单个变量“自身变异”大小的总体参数,方差越大,该变量的变异越大; 协方差是用来度量两个变量之间“协同变异”大小的总体参数,即二个变量相互影响大小的参数,协方差的绝对值越大,二个变量相互影响越大。

对于仅涉及单个变量的试验资料,由于其总变异仅为“自身变异”(如单因素完全随机设计试验资料,“自身变异”是指由处理和随机误差所引起的变异),因而可以用方差分析法进行分析; 对于涉及两个变量的试验资料,由于每个变量的总变异既包含了“自身变异”又包含了“协同变异”(是指由另一个变量所引起的变异),须采用协方差分析法来进行分析,才能得到正确结论。 方法 (一)回归模型的协方差分析 如果那些不能很好地进行试验控制的因素是可量测的,且又和试验结果之间存在直线回归关系,就可利用这种直线回归关系将各处理的观测值都矫正到初始条件相同时的结果,使得处理间的比较能在相同基础上进行,而得出正确结论。这一做法在统计上称为统计控制。 这时所进行的协方差分析是将回归分析和方差分析结合起来的一种统计分析方法,这种协方差分析称为回归模型的协方差分析。 (二)相关模型的协方差分析 方差分析中根据均方MS与期望均方EMS间的关系,可获得不同变异来源的方差分量估计值;在协方差分析中,根据均积MP与期望均积EMP间的关系,可获得不同变异来源的协方差分量估计值。 这种协方差分析称为相关模型的协方差分析。 残差平方和: 为了明确解释变量和随机误差各产生的效应是多少,统计学上把数据点与它在回归直线上相应位置的差异称残差,把每个残差的平方后加起来称为残差平方和,它表示随机误差的效应。 回归平方和 总偏差平方和=回归平方和+ 残差平方和。 残差平方和与总平方和的比值越小,判定系数 r2 的值就越大。 协变量:在实验的设计中,协变量是一个独立变量(解释变量),不为实验者所操纵,但仍影响实验结果。

相关主题
文本预览
相关文档 最新文档