7方差分析
- 格式:ppt
- 大小:1.23 MB
- 文档页数:74
第七章方差分析第一节方差分析的基本原理方差分析(Analysis of variance,简称ANOV A)是对多个总体均值是否相等这一假设进行检验的一种方法。
一、方差分析的内容1实例[例] 某饮料生产企业研制出一种新型饮料。
饮料的颜色共有四种,分别为橘黄色、粉色、绿色和无色透明。
这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。
现从地理位置相似、经营规模相仿的五家超级市场上收集了前一期该种饮料的销售量情况,见表7—1。
新型饮料在五家超市的销售情况表解:从表7—1中看到20个数据各不相同,什么原因使其不同呢?2产生的原因①是销售地点的影响;②是饮料颜色的影响。
A 有可能是抽样的随机性造成的;B 有可能是由于人们对不同颜色有所偏爱。
可以将上述问题就归结为一个检验问题——检验饮料颜色对销售量是否有影响,即要检验各个水平的均值k μμμ,,21 是否相等。
二、方差分析的原理1基本概念因素:一个独立的变量就称为一个因素。
如,颜色水平:将因素中不同的现象称为水平。
(每一水平也称为一组) 单因素方差分析:方差分析只针对一个因素进行。
多因素方差分析:同时针对多个因素进行分析。
观察值之间的差异产生来自于两个方面:①是由因素中的不同水平造成系统性差异的; ②是由于抽选样本的随机性产生的差异。
方差分析数据结构表7-2在一元情形下假设:ik i2i1X ,,X ,X ,i=1,2…n j ,j=1,2,…k,为来自总体)N(2σ,μ的随机样本。
如果假设k H μμμ=== 210:也可表达为 j j αμμ+=其中j α是第j 个水平的偏差。
如果各水平下均值相等,则可以表述为: 0:210====k H ααα对于第j 个因素有ij j ij X εαμ++=其中()2,0~σεN ij 为独立同分布随机变量。
对于观察值则有)()(j ij j ij x x x x xx -+-+=将式两端减去x 然后平方,得))((2)()()(222j ij j j ij j ij x x x x x x x x x x --+-+-=-等式两边求和,有也即如上例可以建立如下的假设:43210:μμμμ===H ;43211,,,:μμμμH 不全相等。
第7章 方差分析7.2单因素方差分析(单因变量单因素方差分析)基本描述:设影响某个指标的因素只有一个A ,相应的水平为A 1, A 2, …,A k ,假设各个水平所对应的总体服从正态分布,方差相等.单因素方差分析的目的之一就是检验012:k H μμμ=== .若拒绝原假设,则认为至少有两个水平间存在着差异,到底是那些水平间存在差异呢?这时可以进行多重比较,一致性子集检验(把均值间不存在差异的水平划分为一类).若不知方差是否相等,还可以进行方差齐性检验.方差分析是对总平方和进行分解,分解为因素的平方和,残差平方和, 然后在此基础上构造统计量, 从而对原假设进行检验功能:分析一个因素的各个水平之间是否存在差异;进行多重比较,一致性子集检验;进行方差齐性检验。
方法:Analyze →Compare Means →ANOV A注1:在数据文件时,因变量(即指标)只有一个,各个水平下的观测量通过分类变量来区分.注2:因变量一般要求服从正态分布。
对照:12342μμμμ++= 例:data07-01.sav 例:data07-02.sav7.3单因变量多因素方差分析基本描述:设影响某个指标的因素有多个,假设各个水平组合所对应的总体服从正态分布,方差相等.单因变量多因素方差分析的目的之一就是检验0:H某个因素的各个水平之间无差异。
或0:H某些因素间不存在交互作用。
主效应: 反映一个因素对指标的影响性的一个度量.主效应的作用可通过相应的平方和来体现.交互效应: 两个以上因素间的相互作用对指标的影响性的一个度量.方差分析是对总平方和进行分解,分解为各个因素的平方和,交互作用的平方和,残差平方和, 然后在此基础上构造统计量, 从而对原假设进行检验功能:分析一个变量是否受多个因素影响?检验因素之间是否存在交互作用;进行协方差分析。
要求:(1)因变量和协变量(或伴随变量):数值型变量。
二者之间存在线性关系。
(2)因子变量:分类变量。
第七章方差分析(Analysis of Variance, ANOVA)7.1 方差分析概述7.2 单因素方差分析7.3 无重复双因素方差分析7.4 可重复双因素方差分析7.5 案例研究7.6 试验设计初步7-17.1 方差分析概述⒈方差分析的概念⒉方差分析中的基本术语⒊ANOVA:对比多个总体的均值⒋方差分析中的基本假定7-27-3方差分析的概念方差分析:通过检验多个总体均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
解决:①A 、B 、C 是否Y 的重要影响因素;②如果为重要影响因素,最优水平?研究系统A B C分类型自变量Y数值型因变量A (a 1,a 2,a 3,…)B (b 1,b 2,b 3,…)C (c 1,c 2,c 3,…)7-4方差分析中的基本术语第1周第9周第14周第2周第7周第16周第4周第12周第17周第5周第10周第13周第3周第8周第18周第6周第11周第15周AB品牌底部中部顶部货架位置因素因素水平实验单元:“一周”响应变量:“每周销售量”处理:品牌—货架位置组合随机安排试验例:一项市场营销研究。
考察品牌和货架位置对咖啡周销售量的影响。
试验单元(experiment unit )、响应变量(responsevariable )、因素(factor )、因素水平(factor level )、处理(treatment )。
ANOVA:对比多个总体的均值佣金固定薪金佣金加固定薪金165120140981151561309022021012611219510713418715523524080总平均样本均值175.00113.29166.17151.48三类报酬构成的推销人员的月销售额(千美元)问题:(1)三种报酬类型销售人员的销售业绩是否存在显著差异?(2)如果存在差异,哪类销售人员的业绩最佳?三个总体的均值是否相等?7-57-6散点图佣金固定薪金佣金+固定薪金50100150200250300分类型自变量销售业绩均值差异分析:(1)同一总体内部的差异(随机差异)?(2)不同总体之间的差异(随机差异+系统差异)?(3)两类差异大小分析?7-71x 2x 3x ()f x x31x 2x 3x ()f x x2 1 H 0为真时,样本均值的抽样分布H 0为假时,样本均值的抽样分布方差分析中的基本假定•基本假定:•(1)每个总体均服从正态分布;•(2)每个总体的方差相等;•(3)来自每一总体的样本都是独立随机样本三个总体均值是否相等?012311::H H 23,,不全相等7.2 单因素方差分析(One-way Analysis of Variance)⒈基本概念与数据结构表⒉ANOVA:k个总体均值的检验⒊ANOVA表:单因素方差分析⒋最佳方案的选择7-87-9基本概念与数据结构研究一个分类型自变量对一个数值型因变量的影响。