当前位置:文档之家› 第七章 方差分析

第七章 方差分析

第七章  方差分析
第七章  方差分析

第七章方差分析

第一节方差分析的意义

?3个以上平均数间的差异进行显著性检验,若仍采用t检验法两两检验,将存在以下三方面的缺陷:?其一,检验过程非常烦琐。

?其二,不能充分利用试验资料的全部信息,精度不高。

?其三,随着k的增大,犯第一类错误的概率也将增加。

第二节方差分析的步骤

?一、自由度和平方和的分解

?方差是平方和除以自由度的商。因此,方差分析的第一步就是进行自由度和平方和的分解。?设有k个处理,每个处理皆含有n个重复观察值的完全随机试验资料,其数据结构见表7.1。

表7.1 k个处理每处理n个重复观察值的完全随机试验数据符号表

表7.1 nk个观察值的单向分组资料模式

?总变异平方和

?总变异是nk个观察值的变异,

?受条件的限制,自由度为n T=nk-1

?总变异平方和可以分解为处理内和处理间两个部分

?处理内(即误差)变异为各处理内观察值与处理平均数的变异,因每处理具有自由度(n– 1)和平方和

?而资料共有k个处理,故处理内自由度为:

?df e=k(n– 1)

?处理内平方和SS e为:

?处理平均数间的平方和

?具自由度n t=k-1,注意

?为了正确地进行F测验,必须使它们都估计着同一参数s2,。因而,样本间的平方和应为:

总变异的=处理间的+处理内的

平方和 SS T = SS t + SS e

自由度 (nk-1) = (k-1) + k(n-1)

进而得:

样本间的均方

样本内的均方

?〔例7.1〕研究A、B、C、D、E共5个饲草品种的鲜草产量差异,E为对照,盆栽试验,每品种3盆,完全随机放置于同一网室内。以对照E孕穗期作为刈割日期,测得各品种单株鲜重(g)见表7.2,试分解其自由度和平方和。

表7.2 不同饲草品种单株鲜重的结果(g)

?解:

?总变异自由度df T=nk-1=3?5-1=14

?处理(品种)间自由度df t=k-1=5-1=4

?品种内(误差)自由度df e=k(n-1)=5?(3-1)=10

?矫正数

?处理(品种)间平方和

?品种内(误差)平方和

?进而可得:

?总变异均方

?品种间均方

?品种内均方

二、F检验

?方差分析中的F检验主要用于检验某项变异因素的效应或方差是否真实存在,是一尾F检验。因此在计算F值时,必须以要检验项变异因素的均方作分子,以另一项变异(例如试验误差项)的均方作分母。

?此比法与方差分析模型和各项变异来源的期望均方有关。在此类检验中,所检验的统计假设

如果作分子的均方小于作分母的均方,则F<1,可以不必查F表即可确定P>0.05,接受H0。?〔例7.2〕〔例7.1〕已算得品种间均方

?品种内均方

?具自由度df1=4,df2=10。试检验品种间变异是否显著大于品种内(即误差)变异?

?解:

?①假设或H0:μA= μB= μC= μD= μE;或 H A:μA、μB、μC、μD和μE间存在差异, (μA、μB、μC、μD和μE间不“完全相等”) ?②显著水平分别取α=0.05和α=0.01。

?∵s t2→试验误差+处理效应差异

? s e2→试验误差

?∴s t2/ s e2≤1,说明无处理效应;

>1,说明可能有处理效应;

>F ,说明处理效应显著存在。

因此要测验H0,必需使F= s t2/ s e2,

③计算

本例

?查F分布右尾临界值表(附表5):当df1=4,df2=10时,F0.05(4,10)=3.48,F0.01(4,10)=5.99,实得F>F0.01(4,10)>F0.05(4,10)。

?④推断:

?即品种间变异在0.01水平上显著大于品种内(即误差)变异,说明不同品种的单株鲜重在0.01水平上有显著差异(P=2.05×10-)5。

?在统计分析过程中,一般将自由度和平方和分解及F检验结果,归纳整理成方差分析表,并在F 值右上角用“*”、“**”分别标注=0.05和=0.01的显著性,如表7.3所示。

表7.3 不同饲草品种单株鲜重的方差分析表

三、多重比较

?F检验的结果表明处理间是否存在真实差异。

?若F

?若F>F0.05,就表明各处理间的差异非试验误差所致而是实质性差异.但是F检验无法判定哪些处理

间差异达到0.05或0.01显著水平,哪些处理间没有显著差异。要明确这一问题,需要进一步对处理间平均数进行两两比较——多重比较(multiple comparisons)。

1 、多重比较方法的种类

?多重比较方法很多,下面介绍常用的FPLSD法、DLSD法、q法和SSR法。

?(1)FPLSD法

?FPLSD(Fisher’s Protected Least Significant Difference)法即Fisher氏保护下的最小显著差数法,又称PLSD法。

?首先是在处理间的F检验为显著的前提下,确定一个最小显著尺度LSDα;

?若则在α水平上显著;

?反之,在α水平上不显著。

?所以, FPLSD法实质上仍是t检验。

?其中tα,为显著水平为时,误差项自由度df e下的t临界值。

?在t检验中,

?为平均数差数的标准误,且

?当n1=n2=n时,

?在方差分析中,是所有处理共同的误差方差,

?因此(7.9) 的可用于所有处理间的多重比较。

?例7.3〕试以FPLSD法,检验表7.2资料各品种平均数间的差异显著性。

?解:在〔例7.2〕中,已算得F=28.06**达0.01显著水平,s2e=1033.53,df e=15,

?查t分布两尾临界值表(附表4),取显著水平=0.05和=0.01,当df e=10时,t0.05(10)=2.228,t0.01(10)=3.169故

?LSD0.05=2.228×26.249=58.48(g);

?LSD0.01=3.169×26.249=83.18(g)

?然后,将各品种的单株鲜重进行两两比较,若相比较的两平均数的差数绝对值≥58.48g,则在0.05水平上显著;若差数绝对值≥83.18g,则在0.01水平上显著。

?多重比较的表示方法(列梯形法)

?结论:5个品种以品种B的单株鲜重最高,与A、D、E、C的差异均达到0.01显著水平;其次是品种A,但与品种D差异未达到0.05显著水平;品种C单株鲜重最低,且与其他品种的差异均达到0.05或0.01显著水平;对照E单株鲜重超过品种C,居第4位,除与D差异未达到0.05显著水平外,与其他品种差异均达到0.05或0.01显著水平。

?(2)DLSD法

?DLSD(Dunnett’s Least Significant Difference)法即Dunnett氏最小显著差数法

?专供检验若干个处理平均数与共同比较标准CK平均数的差异显著性。

?任一平均数与CK平均数差数的绝对值≥|DLS

|时,则在α水平上显著;反之,在α水平上不显著。

α

?DLSD法与FPLSD法唯一不同的是:

?DLSD法是查Dunnett’s Dt临界值----- Dt

FPLSD法是查t临界值----- t α:

α

?即Dunnett’s最小显著差数为:

为平均数差数的标准误,计算公式同(7.9)式;

为误差项自由度df e下,处理数为k(不包括CK)时Dunnett氏临界值。

?〔例7.4〕试以DLSD法,检验表7.2资料各品种平均数间的差异显著性。

?解:在〔例7.2〕中已算得 =26.249(g)

?查Dunnett’s Dt临界值表(附表6),取显著水平α=0.05和α=0.01,当df e=10、k=4时,Dt0.05(10,

4)=2.97,Dt0.01(10,4)=3.95

?故

?DLSD0.05=2.97×26.249=77.96(g);

?DLSD0.01=3.95×26.249=103.68(g)

?将各品种的单株鲜重与对照E进行比较,两样本平均数的差数≥77.96g为在0.05水平上差异显著;

差数≥103.68g为在0.01水平上差异显著。

?结论:由表7.2可知,只有品种B与对照E平均数的差异达到0.01显著水平,其他品种与对照E的差异均未达到0.05的显著水平。

?(3)q法

?q法由Student-Newman-Keul于1952年提出,一般称为复极差检验法,有时又称SNK检验法或NK检验法。该方法是将一组k个平均数由大到小排列后,根据所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小显著极差(Least Significant Ranges)值。q检验因是根据极差抽样分布原理,其各个比较都可保证同一个显著水平。其最小显著极差为:

?其中为平均数的标准误:

?α为显著水平;df e为误差项自由度;p为秩次距,是所有比较的平均数按大到小顺序排列所计算出的两极差范围内所包含的平均数个数。

?即在显著水平为α、误差项自由度为df e、秩次距为p(2≤p≤k)时的q临界值。

?因此,在每一显著水平下该法有k-1个尺度值。平均数比较时,尺度值随秩次距p的不同而异。当要检验的两个平均数的差数绝对值≥时,则在水平上显著;反之,在水平上不显著。?〔例7.5〕试对表7.2资料的各平均数作q检验。

?解:〔例7.1〕已算得:s2e=1033.53,n=3。所以,

?查q临界值表(附表7),取显著水平α=0.05和α=0.01,当df e=10时,p=2,3,4,5的值,并由

(7.12)计算出最小显著极差,列于表7.4

表7.4 表7.2资料及值

?多重比较的表示方法(列梯形法)

?结论:5个品种的单株鲜重以B品种最高、C品种最低;对照品种E居第4位,与FPLSD法检验结果不一致的是,对照E与品种A的差异未达到0.05的显著水平。

(4)SSR法

?SSR法(Shortest Significant Ranges)又称新复极差法,或称最短显著极差法。由D.B.Duncan 于1955年提出。该法与q法相似,区别仅在于计算最小显著极差LSRα时,不是查q临界值表,而是查Duncan’s SSR临界值表。即最短显著尺度为:

?〔例7.6〕试采用SSR法,对表7.2资料各平均数进行多重比较。

?解:在〔例7.5〕中已算得:。查Duncan’s SSR临界值表(附表8),取显著水平=0.05和=0.01,当df e=10,p=2、3、4、5时及LSRα值见表7.5。?2、多重比较方法的比较及选择

?综上所述,将方差分析的基本步骤可归纳如下:

?①计算各项变异的自由度和平方和,并进而算得其均方;

?②列出方差分析表,进行F检验;

?③若F检验不显著,方差分析告一段落;反之,需进行多重比较。多重比较的方法应根据试验设计和要求合理选择,并将最终结果用简单明晰的方式表示出来。

第三节方差分析的数学模型与期望均方

?一、数学模型

?方差分析是建立在一定数学模型基础之上的。如表7.1资料的数学模型为:

x ij=μ+τi+εij

μ为总体平均数,τi为处理效应,εij为随机误差具有分布N(0,σ2) 。

?若以样本符号表示,其线性组成为:

?为μ的无偏估计量。 t i是τi的无偏估计量。为其所属亚总体误差方差的无偏估计量。

?据此,总变异的平方和可分解为试验误差平方和与处理间平方和,即:

?试验误差平方和为

?假设H0:μ1 = μ2= … = μk,则μ1 = μ2=…= μk= μ;

?故可看成总体σ2的无偏估计。这样,各亚总体合并的?也就是σ2的无偏估计量。

?处理间平方和是

?均方为:

?因t i=τi + e i,故

?估计了

二、期望均方

?是σ2的无偏估计量,

?所以σ2为的数学期望(mathematical expectation),

为的数学期望,并被称为期望均方,简记为EMS(expected mean squares)。其中,部分因性质的不同而异,分为固定模型(fixed model)和随机模型(random model)。

1、固定模型

?固定模型是指各处理的平均效应τi=μi-μ是固定的一个常量,且满足Στi= 0(或Σn iτi= 0),但此常量未知。其研究对象是处理本身,处理效应τi为固定的处理效应。固定模型的目的仅在于了解处理间的不同效应。例如,研究若干个小麦新品种的产量,或探讨某水稻品种几种密度、几种肥料、几种农药的效应等。

选用固定模型时, (7.17) 式中的为固定效应的方差,一般用表示,因而处理间均方估计了。在F检验中假设H0:τi=0 (i=1,2,…,k),即H0: μ1 = μ2= … = μk;对H A:τi≠0 。

若F>Fα,则表示存在,τi≠0,处理效应真实存在;若 F

?〔例7.9〕进行7个玉米品种单株籽粒产量比较试验,每品种3次重复,完全随机设计。本试验需明确各品种的效应,因此为固定模型,其方差分析和期望均方的参数估计列于表7.8。

表7.8 7个玉米品种单株产量的方差分析和期望均方表

?品种内s e2估计了σ2,因而;品种间s t2估计了σ2 + nκ2,因而。现F=5.35>F0.05,说明在0.05水平上τi是存在的,说明了品种效应间的变异。

?随机模型是指各处理效应τi不是常量,而是从正态总体N(0, t2)中得到的一个随机变量;总体方差是重要的研究对象,其目的是要对所研究处理所属的总体作出推论。如研究黄河流域棉区陆地棉地方品种的遗传变异,可从该地区大量地方品种中随机抽取一部分品种作为代表进行试验,以便通过这些品种的试验结果推论该地区陆地棉地方品种的总体情况,这种处理效应便是随机模型的处理效应。

?选用随机模型时, (7.17) 式中的为随机效应的方差,一般记为s t2即处理间均方估计了s2+ ns t2,在F检验中,假设H0:s t2 = 0;对H A:s t2 ≠ 0

?显然,这里检验的是处理效应的变异度(方差)是否存在,而不是检验处理效应本身是否存在。?若F>Fα,则表示,处理间的变异真实存在;若F

表7.9 大豆对食叶性害虫感抗杂种F4代

单株荚数的方差分析和期望均方

?表7.9的家系间均方s t2估计了s2+ ns t2,即;家系内均方s e2估计了s2,即。现F=7.28>F0.05,说明在0.05水平上是存在的。因此,

是系统间变异方差的估计。

?综上所述,固定模型和随机模型,在试验设计思路和统计推断上有明显不同。

?固定模型中得出的结论仅推断特定的处理;

?随机模型的试验结论则用于推断处理的总体。

?混合模型(记作模型Ⅲ)。混合模型中既包括有固定模型的试验因素,又包括有随机模型的试验因素。

第四节方差分析的基本假定和数据转换

?一、基本假定

?1、效应的“可加性”

?对试验所考察性状有影响的各变异来源的效应(如环境效应)应具有“可加性”(additivity)。?表7.1资料的数学模型为:x ij=μ+τi+εij或x ij-μ=τi+εij。

?可加性实际上是方差分析时平方和分解的数学依据。当用样本估计时,

?对于非可加性资料,一般需进行对数转换或其他转换,使其效应变为可加性。如表7.10中,将倍加性数据用1g x转换后就表现为可加性模型了。

表7.10 倍加性模型与可加性模型的比较及其对数转换

?2、误差的“正态性”

?试验误差εij应该是随机的、彼此独立的,具有平均数为零且作正态分布,即“正态性”

(normality)。

?试验误差是否符合“正态性”,一般用Bartlett氏(1937)c2法进行检验。

?3、误差方差的“同质性”

?所有试验处理必须具有共同的误差方差,即误差方差的“同质性”(homogeneity) 。当试验结果中各处理内的方差差异较大时,应采用Bartlett氏法检验其是否同质。

?在生产实践和科学研究中,如果误差方差不同质,可将变异特殊或方差特别大的处理从该试验中剔除,也可将试验分成几个部分,使每一部分具有比较同质的误差方差,从而作出合理的检验。

?对于不符合三个基本假定的资料,

?可通过数据转换来消除非可加性、非正态性和非同质性,然后再用转换后的数据进行方差分析。?也可以在进行方差分析之前,先剔除某些表现“特殊”的观察值、处理或重复

?也可将总的误差方差分裂为几个较为同质的误差方差;或者抽取小样本求得其平均数,然后再用这些平均数作方差分析.

?可减小不符合基本假定因素的影响。

1、平方根转换(square root transformation)

?对于变异度很大的间断性变量,这类资料往往样本平均数与其方差有比例关系,服从poisson分布。采用平方根转换,将原观察值x转换成;若有些观察值非常小,出现0值,则宜用转换。

2、对数转换(logarithmic transformation)

如数据资料表现为非可加性而呈倍加性,且样本平均数与其标准差或极差成比例关系,或者已知处理效应和处理水平的变化呈比例而非可加,宜采用对数转换。一般将x转换为lg x,

3、反正弦转换(arcsine transformation)

?如资料是次数资料百分数或成数数据,则呈现二项分布。理论上若百分数p>0.7或p<0.3时,需作反正弦转换,即将p转换成。然后再作方差分析。

?〔例7.11〕研究高粱雄性不育系不同贮藏条件下,存放两年后种子发芽率(%)的差异,结果见表7.11。试作方差分析。

?表7.11 4种不同贮藏条件下高粱种子发芽率(p)

表7.12 4种不同贮藏条件下高粱种子发芽率的反正弦值( )

表7.13 表7.12资料的方差分析表

表7.14 不同贮藏条件发芽率平均数的多重比较结果(SSR法)

?结论:不同贮藏条件发芽率平均数间差异达0.01显著水平。其中,当年繁殖种子与4℃和常温下贮藏两年的种子发芽率差异达0.01显著水平,但与-20℃条件下的发芽率差异未达0.05显著水平。

为便于专业方面的表达,方差分析结束后,作结论时一般都应将被转换的数据,再反转回原尺度。本章学习要点

?1、理解方差分析的基本原理(p109)

?2、方差分析的基本步骤、方法

?(1)自由度和平方和分解

?(2)F测验

?(3)多重比较

?①PLSD测验√

?② Duncan氏新复极差测验(SSR测验) √

?③q测验

?④DLSD测验

?3、方差分析的基本假定

第七章_假设检验与方差分析习题答案

第七章 假设检验与方差分析 习题答案 一、名词解释 用规范性的语言解释统计学中的名词。 1. 假设检验:对总体分布或参数做出某种假设,然后再依据抽取的样本信息,对假设是否正确做出统计判断,即是否拒绝这种假设。 2. 原假设:又叫零假设或无效假设,进行统计检验时预先建立的假设,表示为 H 0,总是含有等号。 3. 备择假设:是零假设的对立,表示为 H 1,总是含有不等号。 4. 单侧检验:备择假设符号为大于或小于时的假设检验。 5. 显著性水平:原假设为真时,拒绝原假设的概率。 6. 方差分析:通过对数据总变异进行分解,来检验多个总体均值是否相等的一种统计分析方法。 二、填空题 根据下面提示的内容,将适宜的名词、词组或短语填入相应的空格之中。 1. u ,n x σμ0-,标准正态; ),(),(2/2/+∞--∞n z n z σσ αα 2. 参数检验,非参数检验 3. 弃真,存伪 4. 方差 5. 卡方, F 6. 方差分析 7. t ,u 8. n s x 0 μ-,不拒绝 9. 单侧,双侧 10.新产品的废品率为5% ,0.01 11.相关,总变异,组间变异,组内变异 12.总变差平方和=组间变差平方和+组内变差平方和 13.连续,离散 14.总体均值 15.因子,水平 16.组间,组内 17.r-1,n-r

18. 正态,独立,方差齐

三、单项选择 从各题给出的四个备选答案中,选择一个最佳答案,填入相应的括号中。 1.B 2.B 3. B 4.A 5. C 6. B 7. C 8. A 9. D 10. A 11. D 12. C 四、多项选择 从各题给出的四个备选答案中,选择一个或多个正确的答案,填入相应的括号中。 1.AC 2.A 3.B 4.BD 5. AD 五、判断改错 对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。 1. 在任何情况下,假设检验中的两类错误都不可能同时降低。 ( × ) 样本量一定时 2. 对于两样本的均值检验问题,若方差均未知,则方差分析和t 检验均可使用,且两者检验结果一致。 ( √ ) 3. 方差分析中,组间离差平方和总是大于组内离差平方和。( × ) 不一定 4. 在假设检验中,如果在显著性水平0.05下拒绝了 00:μμ≤H ,则在同一水平一定可以拒绝假设00:μμ=H 。( × ) 不一定 5. 为检验k 个总体均值是否显著不同,也可以用t 检验,且与方差分析相比,犯第一类错误的概率不变。( × ) 会增加 6. 方差分析中,若拒绝了零假设,则认为各个总体均值均有显著性差异。( × ) 不完全相等 六、简答题 根据题意,用简明扼要的语言回答问题。 1. 假设检验与统计估计有何区别与联系? 【答题要点】 假设检验是在给定显著性水平下,计算出拒绝域,并根据样本统计量信息来做出是否拒

第七章 方差分析

第七章方差分析 方差分析(analysis of variance)是检验多个总体均值是否相等的统计方法。目的:通过检验多个总体的均值是否相等来判断定类变量对定距变量是否有显著影响。 第一节方差分析引述 一、方差分析的基本思想和原理 例1:想了解四个行业的服务质量如何,得到以下数据: 消费者对四个行业的投诉次数 自变量行业是分类变量,因变量被投诉次数是定距变量。 想知道行业对被投诉次数的影响,就要分析不同行业的被投诉次数之间是否有显著差异,即检验四个行业被投诉次数的总体均值是否相等(注意不是样本均值)。如果相等,行业对投诉次数无影响;如果均值不全相等,有影响。 为什么不用均值检验的方法? 均值检验一次只研究两个样本,要检验4个总体均值是否相等,需要6次检验(1-2,1-3,1-4,2-3,2-4,3-4)。每次检验犯第一类错误的概率是α,作多次检验会增加犯错概率和降低置信水平。而方差分析同时将所有样本信息结合在一起,增加了分析的可靠性,降低了犯错的概率,避免拒绝真实的原假设。如何用样本均值检验总体均值即判断行业对投诉次数是否有影响? 各行业被投诉次数的样本均值不相等,是否可说明不同行业被投诉次数有明显差异?不一定,也许各行业总体均值无差异,仅仅因为抽样的随机性造成了彼此之间的差异/随机误差。(来自同一个总体的各个样本之间因为随机性而造成的均值差异和来自不同总体的样本之间的均值差异在散点图上是有差异的。)所以,方差分析就是对于差异来源进行分析(来源于随机误差还是不同总体间的真实差异),从而判断不同总体均值是否相等。 在例1中,在同一行业(同一总体)下,样本的各观测值不同,其差异可看作抽样的随机性造成的,称之为随机误差。在不同行业(不同总体)下,各观测

第七章 方差分析基础

第七章方差分析基础 &7.1 方差分析的必要性与作用 一、方差分析的必要性 ●前面学习了两个样本平均数的假设测验,该法只适用于比较两个试验处理的优劣。用于 多个平均数间差异显著性测验,就会表现出如下一些问题: 1.多个处理用t测验计算麻烦 若进行5个样本平均数的差异显著性比较,则需进行10次两两均数差异显著性测验: H0: μ1= μ2 , μ1= μ3 , μ1= μ4 , μ1= μ5; μ2= μ3 , μ2= μ4 , μ2= μ5; μ3= μ4 , μ3= μ5; μ4= μ5 . 因此, 当样本平均数的个数k≥3时,采用上章学习的方法进行差异显著性测验,工作量是相当大的。 2.推断的可靠性降低,犯α错误的概率增大 t测验,α=0.05时犯第一类错误的概率为0.05, 推断的可靠性为1- α =0.95。 5个处理采用t测验进行比较,α=0.05, 需进行10次两两比较,每次比较的可靠性为1- α =0.95 , 10次推断的可靠性由0.95降到0.5987, 犯第一类错误的概率则由0.05上升0.4013. 3.误差估计的精确性和检验的灵敏性降低 采用t测验法,每次只能利用两组观察值估计试验误差,与利用全部观察值估计的试验误差相比,精确性低,误差的自由度也低,从而使检验的灵敏度也降低,容易掩盖差异的显著性,增大犯第二类错误的可能。 因此对多个处理平均数进行差异显著性测验,不宜采用t测验,而需采用——方差分析法。 二、方差分析的作用 ●解决多个处理的比较问题,充分利用资料的全部信息,提高分析的精确度。 1、在单因素试验中,可以分辨出最优的水平。 2、在多因素试验中,可以分辨出最优的水平组合。 &7.2 方差分析及基本原理 方差分析的概念: 将试验数据的总变异分解为不同来源的变异,从而评定不同变异来源的相对重要性的一种统计方法。 一、数据结构与变异来源的分解 设有k个处理,每个处理有n个观察值,则共有nk个观察值,其数据结构和符号如表7.1。

第七章 方差分析

第七章方差分析 第一节方差分析的意义 ?3个以上平均数间的差异进行显著性检验,若仍采用t检验法两两检验,将存在以下三方面的缺陷:?其一,检验过程非常烦琐。 ?其二,不能充分利用试验资料的全部信息,精度不高。 ?其三,随着k的增大,犯第一类错误的概率也将增加。 第二节方差分析的步骤 ?一、自由度和平方和的分解 ?方差是平方和除以自由度的商。因此,方差分析的第一步就是进行自由度和平方和的分解。?设有k个处理,每个处理皆含有n个重复观察值的完全随机试验资料,其数据结构见表7.1。 表7.1 k个处理每处理n个重复观察值的完全随机试验数据符号表 表7.1 nk个观察值的单向分组资料模式 ?总变异平方和 ?总变异是nk个观察值的变异, ?受条件的限制,自由度为n T=nk-1 ?总变异平方和可以分解为处理内和处理间两个部分 ?处理内(即误差)变异为各处理内观察值与处理平均数的变异,因每处理具有自由度(n– 1)和平方和 ?而资料共有k个处理,故处理内自由度为: ?df e=k(n– 1) ?处理内平方和SS e为: ?处理平均数间的平方和 ?具自由度n t=k-1,注意 ?为了正确地进行F测验,必须使它们都估计着同一参数s2,。因而,样本间的平方和应为: 总变异的=处理间的+处理内的 平方和 SS T = SS t + SS e 自由度 (nk-1) = (k-1) + k(n-1) 进而得: 样本间的均方 样本内的均方 ?〔例7.1〕研究A、B、C、D、E共5个饲草品种的鲜草产量差异,E为对照,盆栽试验,每品种3盆,完全随机放置于同一网室内。以对照E孕穗期作为刈割日期,测得各品种单株鲜重(g)见表7.2,试分解其自由度和平方和。 表7.2 不同饲草品种单株鲜重的结果(g) ?解: ?总变异自由度df T=nk-1=3?5-1=14 ?处理(品种)间自由度df t=k-1=5-1=4 ?品种内(误差)自由度df e=k(n-1)=5?(3-1)=10 ?矫正数

相关主题
文本预览
相关文档 最新文档