第7章 方差分析
- 格式:ppt
- 大小:981.00 KB
- 文档页数:87
第七章方差分析第一节方差分析的基本原理方差分析(Analysis of variance,简称ANOV A)是对多个总体均值是否相等这一假设进行检验的一种方法。
一、方差分析的内容1实例[例] 某饮料生产企业研制出一种新型饮料。
饮料的颜色共有四种,分别为橘黄色、粉色、绿色和无色透明。
这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。
现从地理位置相似、经营规模相仿的五家超级市场上收集了前一期该种饮料的销售量情况,见表7—1。
新型饮料在五家超市的销售情况表解:从表7—1中看到20个数据各不相同,什么原因使其不同呢?2产生的原因①是销售地点的影响;②是饮料颜色的影响。
A 有可能是抽样的随机性造成的;B 有可能是由于人们对不同颜色有所偏爱。
可以将上述问题就归结为一个检验问题——检验饮料颜色对销售量是否有影响,即要检验各个水平的均值k μμμ,,21 是否相等。
二、方差分析的原理1基本概念因素:一个独立的变量就称为一个因素。
如,颜色水平:将因素中不同的现象称为水平。
(每一水平也称为一组) 单因素方差分析:方差分析只针对一个因素进行。
多因素方差分析:同时针对多个因素进行分析。
观察值之间的差异产生来自于两个方面:①是由因素中的不同水平造成系统性差异的; ②是由于抽选样本的随机性产生的差异。
方差分析数据结构表7-2在一元情形下假设:ik i2i1X ,,X ,X ,i=1,2…n j ,j=1,2,…k,为来自总体)N(2σ,μ的随机样本。
如果假设k H μμμ=== 210:也可表达为 j j αμμ+=其中j α是第j 个水平的偏差。
如果各水平下均值相等,则可以表述为: 0:210====k H ααα对于第j 个因素有ij j ij X εαμ++=其中()2,0~σεN ij 为独立同分布随机变量。
对于观察值则有)()(j ij j ij x x x x xx -+-+=将式两端减去x 然后平方,得))((2)()()(222j ij j j ij j ij x x x x x x x x x x --+-+-=-等式两边求和,有也即如上例可以建立如下的假设:43210:μμμμ===H ;43211,,,:μμμμH 不全相等。
第七章 方差分析、统计效力方差分析原理:综合的F检验应用:两个以上平均数之间的差异检虚无假设:H0:μ1 = μ2 = μ3方差可分解,实验数据的总变异分解为若干不同来源的分变异,一般分为组内变异和组间变异组内变异:实验误差、被试差异等组间变异:不同实验条件造成的变异考察F = 组间均方/ 组内均方的显著性方差分析的前提总体正态分布变异互相独立各实验条件的方差齐性方差分析的步骤a. 求总和方、组间和方、组内和方b. 求总自由度、组间自由度、组内自由度c. 求组间均方、组内均方d. 计算F观测值e. 列方差分析表f. 查F表求F临界值g. 作判断符号系统K = 处理条件或组的数目n i = 第i 组的被试数目,若每组被试相等,则为n N = Σn i = 总被试数T i = ΣX ij = 每个组分数值的和 G = ΣX ij = 所有分数的总和 P = 每个被试的观察数目 单因素完全随机方差分析例:检验三个不同的学习方法的效应。
将学生随机分配到3个处理组 方法 A :让学生只读课本, 不去上课. 方法 B :上课,记笔记,不读课本.方法 C :不读课本,不去上课, 只看别人的笔记解:虚无假设H 0:μ1 = μ2 = μ3 ,三种方法学习效果没有差异 备择假设:至少有一个组和其他不同G=30, N=15, 215G ==, 2106,3XK ==∑SS 总= ΣX 2 - G 2 / N =106 – 900 / 15 = 106 – 60 = 46 SS 组内= SS 1 + SS 2 + SS 3 = 6 + 6 + 4 = 16SS组间= Σ(T2/n i) - G2/N = 52/5 + 202/5 + 52/5 - 302/15 = 5 + 80 + 5 –60 = 30实际SS组间可以用SS总- SS组内快速求得,但不推荐df总= N – 1 = 15 -1 = 14df组内= N –K = 15 - 3 = 12df组间= K – 1 = 3 – 1 = 2MS组内= SS组内/ df组内= 16/12 = 1.333MS组间= SS组间/ df组间= 30/2 = 15F obs = MS组间/ MS组内= 15 / 1.333 = 11.25F0.05(2, 12) = 3.88F obs = 11.25 > F0.05(2, 12) = 3.88所以拒绝H0,至少有一组和其他不同事后检验N-K检验HSD检验Scheffe检验……注意:不能用两两之间t检验,P = 1 - (1 - α)n,例如本例P = 1 - (1 –0.05)3 = 0.143随机区组设计的方差分析又称重复测量方差分析,单因素组内设计,相关组设计,被试内设计解:G = 305.5,N = 32,ΣX2 = 2934.91,K = 4, n = 8SS总= ΣX2 - G2 / N = 2934.91 –305.52 / 32 = 18.33SS组内= SS1 + SS2 + SS3 + SS4 = 2.8 + 3.14 + 1.535 + 1.429 = 8.894SS组内= SS被试间+ SS误差SS被试间=Σ(P2/K) - G2/N = 1544.49/4 + 1482.25/4 + 1584.04/4 + 1310.44/4 + 1303.21/4 + 1444/4 + 1755.61/4 + 1274.49/4 - 305.52/32 = 8.062SS误差= SS组内- SS被试间= 8.894 - 8.062 = 0.832SS组间= Σ(T2/n i) - G2/N = 80.82/8 + 79.62/8 + 75.42/8 + 69.72/8 –305.52/32 = 816.08 + 792.02 + 710.645 + 607.261 –2916.57 = 9.436df总= N – 1 = 32 -1 = 31df组内= N –K = 32 - 4 = 28df组间= K – 1 = 4 – 1 = 3df被试= n – 1 = 8 – 1 = 7df误差= df组内–df被试= 28 –7 = 21MS误差= SS误差/ df误差= 0.832/21 = 0.040MS组间= SS组间/ df组间= 9.436/3 = 3.145F obs = MS组间/ MS误差= 3.145 / 0.040 = 78.63F0.01(3, 21) = 4.87F obs = 78.63 > F0.01(3, 21) = 4.87所以拒绝H0,至少有一组和其他不同事后检验:略协方差分析在某些实际问题中,有些因素在目前还不能控制或难以控制,如果直接进行方差分析,会因为混杂因素的影响而无法得出正确结论。
第7章 方差分析7.2单因素方差分析(单因变量单因素方差分析)基本描述:设影响某个指标的因素只有一个A ,相应的水平为A 1, A 2, …,A k ,假设各个水平所对应的总体服从正态分布,方差相等.单因素方差分析的目的之一就是检验012:k H μμμ=== .若拒绝原假设,则认为至少有两个水平间存在着差异,到底是那些水平间存在差异呢?这时可以进行多重比较,一致性子集检验(把均值间不存在差异的水平划分为一类).若不知方差是否相等,还可以进行方差齐性检验.方差分析是对总平方和进行分解,分解为因素的平方和,残差平方和, 然后在此基础上构造统计量, 从而对原假设进行检验功能:分析一个因素的各个水平之间是否存在差异;进行多重比较,一致性子集检验;进行方差齐性检验。
方法:Analyze →Compare Means →ANOV A注1:在数据文件时,因变量(即指标)只有一个,各个水平下的观测量通过分类变量来区分.注2:因变量一般要求服从正态分布。
对照:12342μμμμ++= 例:data07-01.sav 例:data07-02.sav7.3单因变量多因素方差分析基本描述:设影响某个指标的因素有多个,假设各个水平组合所对应的总体服从正态分布,方差相等.单因变量多因素方差分析的目的之一就是检验0:H某个因素的各个水平之间无差异。
或0:H某些因素间不存在交互作用。
主效应: 反映一个因素对指标的影响性的一个度量.主效应的作用可通过相应的平方和来体现.交互效应: 两个以上因素间的相互作用对指标的影响性的一个度量.方差分析是对总平方和进行分解,分解为各个因素的平方和,交互作用的平方和,残差平方和, 然后在此基础上构造统计量, 从而对原假设进行检验功能:分析一个变量是否受多个因素影响?检验因素之间是否存在交互作用;进行协方差分析。
要求:(1)因变量和协变量(或伴随变量):数值型变量。
二者之间存在线性关系。
(2)因子变量:分类变量。