第8章方差分析
- 格式:pptx
- 大小:1.41 MB
- 文档页数:43
第八章方差分析与相关分析一.方差分析1.基本概念方差分析的概念:比较组间方差是否可以用组内方差来进行解释,从而判断若干组样本是否来自同一总体。
方差分析,又称为ANOVA(Analysis Of Variance)分析。
方差分析可以一次检验多组样本,避免了t检验一次只能比较两组的缺陷。
方差分析只能反映出各组样本中存在着差异,但具体是哪一组样本存在差异,无法进行判定。
考察下列例子:某厂使用四种不同颜色对产品进行包装,经过在五个城市的试销,获得销售数据如下(单观察数据的列平均值,列平均值的差异反映出不同颜色包装的销售业绩差异。
此时,需要判断这种差异与同一颜色包装在不同城市间的差异相比,是否显著。
如果不显著,则这种2.方差分析原理计算观察值的组间方差和组内方差,并计算两者的比值,如果该比值比较小,说明组间方差与组内方差比较接近,组间方差可以用组内方差来解释,从而说明组间差异不存在。
●●建立原假设“H0:各组平均数相等”●●构造统计量“F=组间方差/组内方差”●●在计算组间方差时,使用自由度为(r-1),计算组内方差时,使用自由度为(n-r)。
●●F满足第一自由度为(r-1),第二自由度为(n-r)的F分布。
●●查表,若F值大于0.05临界值,则拒绝原假设,认为各组平均数存在差异。
根据方差计算的原理,生成方差分析表如下:其中:组间离差平方和 SSA (Sum of Squares for factor A) =39.084误差项离差平方和 SSE (Sum of Squares for Error) =76.8455总离差平方和 SST (Sum of Squares for Total)=115.9295P-value值为0.000466,小于0.05,所以拒绝原假设。
3.双因素方差分析观察下列销售数据,欲了解包装方式和销售地区是否对于销售业绩有影响,涉及到双因素的方差分析。
此时需分别计算SSA、SSB与SSE之间的比值是否超过临界值。
第八章单因素方差分析8.1黄花蒿中所含的青蒿素是当前抗疟首选药物,研究不同播期对黄花蒿种子产量的影响,试验采用完全随机化设计,得到以下结果(kg/小区)[47]:重复播种期2月19日3月9日3月28日4月13日1 0.26 0.14 0.12 0.032 0.49 0.24 0.11 0.023 0.36 0.21 0.15 0.04对上述结果做方差分析。
答:所用程序及结果如下:options linesize=76 nodate;data mugwort;do date=1 to 4;do repetit=1 to 3;input yield @@;output;end;end;cards;0.26 0.49 0.360.14 0.24 0.210.12 0.11 0.150.03 0.02 0.04;run;proc anova;class date;model yield=date;means date/duncan;run;One-Way ANOVAAnalysis of Variance ProcedureClass Level InformationClass Levels ValuesDATE 4 1 2 3 4Number of observations in data set = 12One-Way ANOVAAnalysis of Variance ProcedureDependent Variable: YIELDSum of MeanSource DF Squares Square F Value Pr > F Model 3 0.18515833 0.06171944 14.99 0.0012 Error 8 0.03293333 0.00411667Corrected Total 11 0.21809167R-Square C.V. Root MSE YIELD Mean0.848993 35.48088 0.06416 0.18083DATE 3 0.18515833 0.06171944 14.99 0.0012One-Way ANOVAAnalysis of Variance ProcedureDuncan's Multiple Range Test for variable: YIELDNOTE: This test controls the type I comparisonwise error rate, notthe experimentwise error rateAlpha= 0.05 df= 8 MSE= 0.004117Number of Means 2 3 4Critical Range .1208 .1259 .1287Means with the same letter are not significantly different.Duncan Grouping Mean N DATEA 0.37000 3 1B 0.19667 3 2BC B 0.12667 3 3CC 0.03000 3 4对于方差分析表中各项内容的含义,在“SAS程序及释义”部分已经做了详细解释,这里不再重复。
第八章 方差分析与回归分析§8.1 方差分析8.1.1 问题的提出举例说明概念因子和水平。
因子:对研究对象产生影响的因素。
水平:因子所处的状态。
8.1.2 单因子方差分析的统计模型在研究中只考察一个因子则称为单因子试验,其中,记因子为A ,设其有r 个水平,记为r A A ,,1 ,在每一水平下考察的指标可以看成一个总体,现有r 个水平,故有r 个总体,假定:(1)每一总体均为正态总体,记为r i N i i ,,2,1),,(2;(2)各总体的方差相同,记222221 r ;(3)从每一总体中抽取的样本是相互独立的,即所有的试验结果ij y 都相互独立。
这些假定都可以用统计方法进行验证。
首先比较各水平下的均值是否相同,即要对如下的一个假设进行检验,不全相等r rH H ,,,::211210在不会引起误解的前提下,1H 通常可以省略不写。
若0H 成立,则称因子A 不显著,否则,称因子A 显著。
对如上的假设进行检验,需要从每一水平下的总体抽取样本,设从第i 个水平下的总体获得m 个试验结果(各个水平下相同),记ij y 表示第i 个总体的第j 次重复试验结果。
共得如下m r 个试验结果:m j r i y ij ,,1,,,1,其中r 为水平数,m 为重复数,i 为水平编号,j 为重复编号。
在水平i A 下的试验结果ij y 与该水平下的指标均值i 一般总是有差距的,记i ij ij y ,ij 称为随机误差,于是有ij i ij y上式称为试验结果ij y 的数据结构式。
把三个假定用于数据结构式就可以写出单因子方差分析的统计模型:),0(,,1,,,1,2 N m j r i y ij ij i ij 相互独立,且都服从诸为了能更好地描述数据,常引入总均值和效应的概念:总均值:诸i 的平均 ri i r r 11 ;称第i 水平下的均值i 与总均值 的差i i a ,r i ,,1为因子A 的第i 水平的主效应,简称为i A 的效应。
幻灯片1【例】调查了5个不同小麦品系的株高,结果如下。
试判断这5个品系的株高是否存在显著性差异。
5个小麦品系株高(cm)调查结果幻灯片2第八章单因素方差分析One-factor analysis of variance幻灯片3本章内容第一节方差分析简述第二节固定效应模型第三节随机效应模型第四节多重比较第五节方差分析应具备的条件幻灯片4第一节方差分析简述一、方差分析的一般概念1、概念方差分析( analysis of variance,ANOVA):是同时判断多组数据平均数之间差异显著性的统计假设检验,是两组数据平均数差异显著性t 检验的延伸。
ANOVA 由英国统计学家R.A.Fisher首创,用于推断多个总体均数有无差异。
幻灯片5单因素方差分析(一种方式分组的方差分析):研究对象只包含一个因素(factor)的方差分析。
单因素实验:实验只涉及一个因素,该因素有a个水平(处理),每个水平有n次实验重复,这样的实验称为单因素实验。
水平(level):每个因素不同的处理(treatment)。
幻灯片6方差分析Analysis of Variance (ANOVA )因素也称为处理因素(factor)(名义分类变量),每一处理因素至少有两个水平(level)(也称“处理组”)。
一个因素(水平间独立)——单向方差分析(第八章)两个因素(水平间独立或相关)——双向方差分析(第九章)一个个体多个测量值——重复测量资料的方差分析 ANOVA与回归分析相结合——协方差分析目的:用这类资料的样本信息来推断各处理组间多个总体均数的差别有无统计学意义。
幻灯片7【例】随机选取4窝动物,每窝中均有4只幼仔,称量每只幼仔的出生重,结果如下。
判断不同窝的动物出生重是否存在显著性差异。
4窝动物的出生重单位:g幻灯片82、单因素方差分析的数据格式:幻灯片9二、不同处理效应与不同模型 1、方差分析中每一观测值的描述——线性统计模型yij :在第i 水平下的第j 次观测值; μ:总平均数,是对所有观测值的一个参数;αi :处理效应,是仅限于对第i 次处理的一个参数; εij :随机误差成分。