第4章 方差分析
- 格式:ppt
- 大小:1.44 MB
- 文档页数:66
第4章方差分析(ANOV A)实验设计和分析Catherine Potvin4.1生态学问题弄懂生态学问题需要将各种环境因子的影响分开,生态工作者用实验来解决这个问题。
不论在野外还是在控制环境条件下,可控实验都可以让生态工作者们只变化一个因子来检验其影响。
例如,生长箱能使生物体生长在完全相同的温度而不同的光周期的条件下,或相同的光强而不同温度条件下的实验成为可能。
在控制实验中,通常最希望的情况是环境‘背景’,即所有的影响因子, 不是自由地变化,而是精确地得到控制,这样就能够保证在改变目标变量时,观测的反应不会受到其它因素的影响。
因而控制环境条件, 例如使用生长箱和温室,成为植物生态学的一个常用的方法,如同动物生态学中使用的生长柜和水族槽一样。
本章第一部分,我要讲一下作为实验生态学基本工具的方差分析(ANOV A)。
本章重点放在实验设计上。
虽然人们一般认为生长箱会提供同一环境条件,但不论在一个生长箱内还是生长箱间都存在环境异质性(Lee和Rawlings 1982;Potvin等1990a),因而能够充分处理环境异质性的实验设计将在本章中述及。
尽管我的论述主要是以生长箱实验为基础,其原理在其它类型的控制或野外环境的实验研究中同样适用(第5,15和16章)。
我还要讨论错误实验设计的代价。
本章应视为实验设计的起步点,这个起步点就是要考虑各种影响因素。
实验者通常进行的实验比这里展开的要复杂。
但是一旦懂得了基本原理,讨论各种实验设计就相对简单一些。
更详细的论述请见Cochran & Cox(1957)和Winter(1991)。
4.2 统计问题:环境变化与统计分析正如Underwood(1997)建议的一样,生态实验设计的第一步是建立一个线性模型使研究者能够将感兴趣的变量(因素)独立出来。
由于实验设计支配误差项,建立线性模型取决于所研究的因子以及具体的实验设计。
在任何一个实验开始时,最基本的是要检验空间与时间变化的格局。
第四章 方差分量线性回归模型本章考虑的线性模型不仅有固定效应、随机误差,而且有随机效应。
我们先从随机效应角度理解回归概念,导出方差分量模型,然后研究模型三种主要解法。
最后本章介绍关于方差分量模型的两个前沿研究成果,是作者近期在《应用数学学报》与国际数学杂志《Communications in Statistics 》上发表的。
第一节 随机效应与方差分量模型一、随机效应回归模型前面所介绍的回归模型不仅都是线性的,而且自变量看作是固定效应。
我们从资料对npi i i X X Y 11},,{ 出发建立回归模型,过去一直是把Y 看作随机的,X 1,…,X p 看作非随机的。
但是实际上,自变量也经常是随机的,而并不是我们可以事先设计好的设计矩阵。
我们把自变量也是随机变量的回归模型称为随机效应回归模型。
究竟一个回归模型的自变量是随机的还是非随机的,要视具体情况而定。
比如一般情况下消费函数可写为)(0T X b C C(4.1.1)这里X 是居民收入,T 是税收,C 0是生存基本消费,b 是待估系数。
加上随机扰动项,就是一元线性回归模型)(0T X b C C(4.1.2)那么自变量到底是固定效应还是随机效应?那要看你采样情况。
如果你是按一定收入的家庭去调查他的消费,那是取设计矩阵,固定效应。
如果你是随机抽取一些家庭,不管他收入如何都登记他的收入与消费,那就是随机效应。
对于随机效应的回归模型,我们可以从条件期望的角度推导出与最小二乘法则等价的回归函数。
我们希望通过X 预测Y ,也就是要寻找一个函数),,()(1p X X M X M Y ,当X 的观察值为x 时,这个预测的误差平均起来应达到最小,即22)]([min )]([X L Y E X M Y E L(4.1.3)这里min 是对一切X 的可测函数L(X)取极小。
由于当)|()(X Y E X M(4.1.4)时,容易证明0)]()()][([ X L X M X M Y E(4.1.5)故当)|()(X Y E X M 时,222)]()([)]([)]([X L X M E X M Y E X L Y E(4.1.6)要使上式左边极小,只有取)|()()(X Y E X M X L 。
方差分析一.方差分析的概念及意义方差分析,又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著检验。
由于各种因素的影响,研究所得的数据呈现波动状。
造成波动的原因可分成两类,一是不可控的随机因素,另一是研究种施加的对结果形成影响的可控因素。
方差分析的意义,工业生产中产品质量优劣,农业生产中产量高低,由诸多因素造成。
如农业生产中,肥料,浇灌,良种,管理等;化工生产中,原料成分,催化剂,剂量,反应温度,压力,溶液,机器设备与操作人员水平。
每种因素的改变,可影响产品质量与数量,那么在诸因素中找出对质量的某种指标有显著影响的因素,还要弄清这些显著因素在什么状态下(水平)起的作用大。
方差分析就是根据试验结果进行分析,鉴别各个因素对试验结果影响的有效方法。
二.方差分析的基本思想根据实验设计的类型及研究目的,将全部观察值之间所表现出来的总变异,分解为两个或多个部分。
除随机误差作用外,其余每个部分的变异均可由某个因素的作用加以解释。
通过比较不同变异来源的均方(MS),借助F分布做出统计推断,从而推断研究因素对试验结果有无影响三.方差分析的假定条件及假设检验3.1方差分析的假定条件为:(1)各处理条件下的样本是随机的。
(2)各处理条件下的样本是相互独立的,否则可能出现无法解析的输出结果。
(3)各处理条件下的样本分别来自正态分布总体,否则使用非参数分析。
(4)各处理条件下的样本方差相同,即具有齐效性。
3.2方差分析的假设检验假设有K个样本,如果原假设H0样本均数都相同,K个样本有共同的方差σ,则K 个样本来自具有共同方差σ和相同均值的总体。
如果经过计算,组间均方远远大于组内均方,则推翻原假设,说明样本来自不同的正态总体,说明处理造成均值的差异有统计意义。
否则承认原假设,样本来自相同总体,处理间无差异。
四.方差分析中的常用术语4.1 因素(Factor)因素是指所要研究的变量,它可能对因变量产生影响。
如果方差分析只针对一个因素进行,称为单因素方差分析。
第四章多个样本均数比较的方差分析方差分析的基本思想是通过比较各组或处理的均值差异与各组内的个体间差异来判断是否存在显著差异。
在进行方差分析之前,需要满足一些前提条件,如对总体的抽样是简单随机抽样、各样本之间是独立的等。
这些前提条件的满足保证了方差分析的可靠性。
多个样本的方差分析是通过计算组间离差平方和(SSTr)、组内离差平方和(SSE)和总离差平方和(SST)来比较各组或处理之间的差异。
计算公式为:SSTr = Σni(x̄i - x̄)²SSE = ΣΣ(xij - x̄i)²SST=SSTr+SSE其中,n是每组或处理的样本个数,ni是第i组或处理的样本个数,x̄i是第i组或处理的样本均值,x̄是全部样本的均值,xij是第i组或处理的第j个样本值。
通过计算SSTr和SSE,可以得到均方值(MS):MStr = SSTr / (r - 1)MSE=SSE/(N-r)其中,r是组或处理的个数,N是总样本个数。
接下来,需要计算F值,用于判断各组或处理均值是否有显著差异:F = MStr / MSE根据F值和自由度,可以查找F表来确定是否存在显著差异。
如果F 计算值大于F临界值,则拒绝原假设,表示均值之间存在显著差异。
方差分析还可以进行多重比较,用于确定具体哪些组或处理之间存在显著差异。
常用的多重比较方法有Tukey的HSD(最大均值差异)和Bonferroni方法。
方差分析的优点是可以同时比较多个样本的均值差异,具有较好的统计效应。
然而,方差分析也存在一些限制,如对正态性和方差齐性的要求较高。
总之,多个样本均数比较的方差分析是一种常用的统计方法,在科学研究和实验设计中得到广泛应用。
它可以帮助研究人员确定不同处理或组之间的差异,为决策提供支持。