第八章方差分析
- 格式:pdf
- 大小:2.34 MB
- 文档页数:32
第八章方差分析与相关分析一.方差分析1.基本概念方差分析的概念:比较组间方差是否可以用组内方差来进行解释,从而判断若干组样本是否来自同一总体。
方差分析,又称为ANOVA(Analysis Of Variance)分析。
方差分析可以一次检验多组样本,避免了t检验一次只能比较两组的缺陷。
方差分析只能反映出各组样本中存在着差异,但具体是哪一组样本存在差异,无法进行判定。
考察下列例子:某厂使用四种不同颜色对产品进行包装,经过在五个城市的试销,获得销售数据如下(单观察数据的列平均值,列平均值的差异反映出不同颜色包装的销售业绩差异。
此时,需要判断这种差异与同一颜色包装在不同城市间的差异相比,是否显著。
如果不显著,则这种2.方差分析原理计算观察值的组间方差和组内方差,并计算两者的比值,如果该比值比较小,说明组间方差与组内方差比较接近,组间方差可以用组内方差来解释,从而说明组间差异不存在。
●●建立原假设“H0:各组平均数相等”●●构造统计量“F=组间方差/组内方差”●●在计算组间方差时,使用自由度为(r-1),计算组内方差时,使用自由度为(n-r)。
●●F满足第一自由度为(r-1),第二自由度为(n-r)的F分布。
●●查表,若F值大于0.05临界值,则拒绝原假设,认为各组平均数存在差异。
根据方差计算的原理,生成方差分析表如下:其中:组间离差平方和 SSA (Sum of Squares for factor A) =39.084误差项离差平方和 SSE (Sum of Squares for Error) =76.8455总离差平方和 SST (Sum of Squares for Total)=115.9295P-value值为0.000466,小于0.05,所以拒绝原假设。
3.双因素方差分析观察下列销售数据,欲了解包装方式和销售地区是否对于销售业绩有影响,涉及到双因素的方差分析。
此时需分别计算SSA、SSB与SSE之间的比值是否超过临界值。
幻灯片1【例】调查了5个不同小麦品系的株高,结果如下。
试判断这5个品系的株高是否存在显著性差异。
5个小麦品系株高(cm)调查结果幻灯片2第八章单因素方差分析One-factor analysis of variance幻灯片3本章内容第一节方差分析简述第二节固定效应模型第三节随机效应模型第四节多重比较第五节方差分析应具备的条件幻灯片4第一节方差分析简述一、方差分析的一般概念1、概念方差分析( analysis of variance,ANOVA):是同时判断多组数据平均数之间差异显著性的统计假设检验,是两组数据平均数差异显著性t 检验的延伸。
ANOVA 由英国统计学家R.A.Fisher首创,用于推断多个总体均数有无差异。
幻灯片5单因素方差分析(一种方式分组的方差分析):研究对象只包含一个因素(factor)的方差分析。
单因素实验:实验只涉及一个因素,该因素有a个水平(处理),每个水平有n次实验重复,这样的实验称为单因素实验。
水平(level):每个因素不同的处理(treatment)。
幻灯片6方差分析Analysis of Variance (ANOVA )因素也称为处理因素(factor)(名义分类变量),每一处理因素至少有两个水平(level)(也称“处理组”)。
一个因素(水平间独立)——单向方差分析(第八章)两个因素(水平间独立或相关)——双向方差分析(第九章)一个个体多个测量值——重复测量资料的方差分析 ANOVA与回归分析相结合——协方差分析目的:用这类资料的样本信息来推断各处理组间多个总体均数的差别有无统计学意义。
幻灯片7【例】随机选取4窝动物,每窝中均有4只幼仔,称量每只幼仔的出生重,结果如下。
判断不同窝的动物出生重是否存在显著性差异。
4窝动物的出生重单位:g幻灯片82、单因素方差分析的数据格式:幻灯片9二、不同处理效应与不同模型 1、方差分析中每一观测值的描述——线性统计模型yij :在第i 水平下的第j 次观测值; μ:总平均数,是对所有观测值的一个参数;αi :处理效应,是仅限于对第i 次处理的一个参数; εij :随机误差成分。