第八章-方差分析
- 格式:ppt
- 大小:7.14 MB
- 文档页数:91
第八章方差分析与相关分析一.方差分析1.基本概念方差分析的概念:比较组间方差是否可以用组内方差来进行解释,从而判断若干组样本是否来自同一总体。
方差分析,又称为ANOVA(Analysis Of Variance)分析。
方差分析可以一次检验多组样本,避免了t检验一次只能比较两组的缺陷。
方差分析只能反映出各组样本中存在着差异,但具体是哪一组样本存在差异,无法进行判定。
考察下列例子:某厂使用四种不同颜色对产品进行包装,经过在五个城市的试销,获得销售数据如下(单观察数据的列平均值,列平均值的差异反映出不同颜色包装的销售业绩差异。
此时,需要判断这种差异与同一颜色包装在不同城市间的差异相比,是否显著。
如果不显著,则这种2.方差分析原理计算观察值的组间方差和组内方差,并计算两者的比值,如果该比值比较小,说明组间方差与组内方差比较接近,组间方差可以用组内方差来解释,从而说明组间差异不存在。
●●建立原假设“H0:各组平均数相等”●●构造统计量“F=组间方差/组内方差”●●在计算组间方差时,使用自由度为(r-1),计算组内方差时,使用自由度为(n-r)。
●●F满足第一自由度为(r-1),第二自由度为(n-r)的F分布。
●●查表,若F值大于0.05临界值,则拒绝原假设,认为各组平均数存在差异。
根据方差计算的原理,生成方差分析表如下:其中:组间离差平方和 SSA (Sum of Squares for factor A) =39.084误差项离差平方和 SSE (Sum of Squares for Error) =76.8455总离差平方和 SST (Sum of Squares for Total)=115.9295P-value值为0.000466,小于0.05,所以拒绝原假设。
3.双因素方差分析观察下列销售数据,欲了解包装方式和销售地区是否对于销售业绩有影响,涉及到双因素的方差分析。
此时需分别计算SSA、SSB与SSE之间的比值是否超过临界值。
第8章假设检验与方差分析【引例】重庆啤酒股份有限公司(以下简称重庆啤酒)于1990年代初斥巨资开始乙肝新药的研发,其股票被视作“生物医药”概念股受到市场热捧。
尤其是2010~2011年的两年间,在上证指数大跌1/3的背景下,重庆啤酒股价却从23元左右飙升最高至元,但公司所研制新药的主要疗效指标的初步统计结果于2011年12月8日披露后,股价连续跌停,12月22日以元报收后停牌。
2012年1月10日重庆啤酒公告详细披露了有关研究结论,复牌后股价又遭遇连续数日下跌,1月19日跌至元。
此公告明确告知:“主要疗效指标方面,意向性治疗人群的安慰剂组与 600μg组,及安慰剂组与εPA-44 900μg组之间,HBeAg/抗HBe 血清转换在统计意义上均无差异”。
通俗地说,用药与不用药(安慰剂组)以及用药多与少(900μg组与600μg 组),都没有明显差异,这意味着该公司研制的乙肝新疫苗无效。
有关数据如表所示:表乙肝新疫苗的应答率注:εP A-44为治疗用(合成肽)乙型肝炎疫苗简称。
上表数据显示,两个用药组的应答率都高于安慰剂组的应答率,但为什么说“在统计意义上均无差异”为什么说这个结论表示乙肝新疫苗无效什么叫“在统计意义上无差异”如何根据样本数据作出统计意义上有无差异的判断解答这些问题就需要本章所要介绍的假设检验。
现实中,人们经常需要利用样本信息来判断有关总体特征的某个命题是真还是伪,或对某个(些)因素的影响效应是否显著作出推断,所以假设检验和方差分析有着广泛的应用。
例如,在生物医学领域,判断某种新药是否比旧药更有效;在工业生产中,根据某批零件抽样检查的信息来判断整批零件的质量是否符合规格要求;在流通领域,鉴别产品颜色是否对销售量有显著影响等等。
这些分析研究都离不开假设检验或方差分析。
假设检验与方差分析的具体方法很多,研究目的和背景条件不同,就需采用不同的方法。
本教材介绍假设检验与方差分析的基本原理和一些基本方法。
第八章 方差分析与回归分析§8.1 方差分析8.1.1 问题的提出举例说明概念因子和水平。
因子:对研究对象产生影响的因素。
水平:因子所处的状态。
8.1.2 单因子方差分析的统计模型在研究中只考察一个因子则称为单因子试验,其中,记因子为A ,设其有r 个水平,记为r A A ,,1 ,在每一水平下考察的指标可以看成一个总体,现有r 个水平,故有r 个总体,假定:(1)每一总体均为正态总体,记为r i N i i ,,2,1),,(2;(2)各总体的方差相同,记222221 r ;(3)从每一总体中抽取的样本是相互独立的,即所有的试验结果ij y 都相互独立。
这些假定都可以用统计方法进行验证。
首先比较各水平下的均值是否相同,即要对如下的一个假设进行检验,不全相等r rH H ,,,::211210在不会引起误解的前提下,1H 通常可以省略不写。
若0H 成立,则称因子A 不显著,否则,称因子A 显著。
对如上的假设进行检验,需要从每一水平下的总体抽取样本,设从第i 个水平下的总体获得m 个试验结果(各个水平下相同),记ij y 表示第i 个总体的第j 次重复试验结果。
共得如下m r 个试验结果:m j r i y ij ,,1,,,1,其中r 为水平数,m 为重复数,i 为水平编号,j 为重复编号。
在水平i A 下的试验结果ij y 与该水平下的指标均值i 一般总是有差距的,记i ij ij y ,ij 称为随机误差,于是有ij i ij y上式称为试验结果ij y 的数据结构式。
把三个假定用于数据结构式就可以写出单因子方差分析的统计模型:),0(,,1,,,1,2 N m j r i y ij ij i ij 相互独立,且都服从诸为了能更好地描述数据,常引入总均值和效应的概念:总均值:诸i 的平均 ri i r r 11 ;称第i 水平下的均值i 与总均值 的差i i a ,r i ,,1为因子A 的第i 水平的主效应,简称为i A 的效应。
幻灯片1【例】调查了5个不同小麦品系的株高,结果如下。
试判定这5个品系的株高是不是存在显著性不同。
5个小麦品系株高(cm)调查结果幻灯片2第八章单因素方差分析One-factor analysis of variance幻灯片3本章内容第一节方差分析简述第二节固定效应模型第三节随机效应模型第四节多重比较第五节方差分析应具有的条件幻灯片4第一节方差分析简述一、方差分析的一样概念一、概念方差分析( analysis of variance,ANOVA):是同时判定多组数据平均数之间不同显著性的统计假设查验,是两组数据平均数不同显著性t 查验的延伸。
ANOV A 由英国统计学家R.A.Fisher首创,用于推断多个总体均数有无差异。
幻灯片5单因素方差分析(一种方式分组的方差分析):研究对象只包括一个因素(factor)的方差分析。
单因素实验:实验只涉及一个因素,该因素有a个水平(处置),每一个水平有n次实验重复,如此的实验称为单因素实验。
水平(level):每一个因素不同的处置(treatment)。
幻灯片6方差分析Analysis of Variance (ANOVA )幻灯片7【例】随机选取4窝动物,每窝中均有4只幼仔,称量每只幼仔的诞生重,结果如下。
判定不同窝的动物诞生重是不是存在显著性不同。
4窝动物的诞生重 单位:g幻灯片8二、单因素方差分析的数据格式:32.9 31.4 25.7 28.0 118.0 29.50027.1 23.3 27.8 26.7 104.9 26.22533.2 26.0 28.6 32.3 120.1 30.02534.7 33.3 26.2 31.6 125.8 31.4501 2 3 4 和 平均数Ⅳ Ⅲ Ⅱ Ⅰ窝 别 动物号因素也称为处理因素(factor )(名义分类变量),每一处理因素至少有两个水平(level)(也称“处理组”)。
一个因素(水平间独立) ——单向方差分析(第八章)两个因素(水平间独立或相关)——双向方差分析(第九章)一个个体多个测量值——重复测量资料的方差分析 ANOV A 与回归分析相结合——协方差分析目的:用这类资料的样本信息来推断各处理组间多个总体均数的差别有无统计学意义。