- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
xij i ij
⑴提出假设
4.2
, r不全相等
H0 : 1 2
r , H1 : 1 , 2 ,
或H 0 : 1 2
⑵构造检验F统计量 1.计算均值
r =0, H1 : 1 , 2 , , r 不全为0
r ni
1 xi. ni
因素的同一水平(总体)下,样本各观测值之间的差异. ●比如,同一种颜色的饮料在不同超市的销售量是不同的 ●这种差异可以看成是随机因素的影响,称为随机误差.
●
系统误差 ●因素的不同水平(不同总体)下,各观测值之间的差异. ●比如,同一家超市,不同颜色的销售量也是不同的 ●这种差异可能是由于抽样的随机性所造成的,也可能是 由于颜色本身所造成的,后者所形成的误差是由系统性 因素造成的,称为系统误差. 数据的误差用平方和表示,称为方差. 组内方差:来自水平内部的数据方差,只包含随机误差. 组间方差:来自不同水平之间的数据方差,组间方差既包括 随机误差,也包括系统误差.
要研究的问题
总体1,μ1 (无色) 总体2,μ2 (粉色) 总体3,μ3 (橘黄色) 总体4,μ4 (绿色)
样本1
2 x1, s1
样本2
2 x2 , s2
样本3
2 x3 , s3
样本4
2 x4 , s4
1 2 3 4 ??
研究方法:两样本的t检验?
• 用t检验比较两个均值:
– 每次只能比较两个均值,要解决上述问题需要进行6 次t检验. – 即使每对都进行了比较,并且都以95%的置信度得出每 对均值都相等的结论,但是由此要得出4种颜色的饮料
LSD t
2
1 1 MSE ( ) ni n j
3.作决策
若 t t ,则拒绝原假设;若 t t ,则不能拒绝原假设.
2
2
若
xi. x j . LSD ,则拒绝原假设.
若 xi. x j . LSD ,则接受原假设.
在SPSS中作单因素方差分析
例4.2 在SPSS19.0中用例4.1的数据作单因素方差分析,数 据格式如下图4-1所示.
6.交互作用:如果一个因素的效应大小在另一个因素不同 水平下明显不同,则称为两因素间存在交互作用. 当存在交互作用时,单纯研究某个因素的作用是没有意义 的,必须分另一个因素的不同水平研究该因素的作用大小. 所有单元内至少有两个元素才能测出相互作用. 7.方差分析:ANOVA就是通过检验各总体的均值是否相等 来判断分类型自变量对数值型因变量是否有显著影响. 4.1.2 方差分析的基本思想和原理 方差分析是通过对数据误差来源的分析判断不同总体的 均值是否相等. 1.两种误差 随机误差
第四章
本章讲授的内容 • 方差分析的基本问题
• 单因素方差分析 本章学习目标
方差分析
1.掌握方差分析的基本思想和原理.
2.掌握单因素方差分析的步骤,会用Excel软作单因素方差 分析. 3.理解方差分析中的多重比较(LSD法).
§4.1 方差分析的基本问题
方差分析问题的提出 例4.1 某饮料企业研制出一种新型饮料.饮料的颜色共有四 种,分别为橘黄色、粉色、绿色和无色透明.这四种饮料的 营养含量、味道、价格、包装等可能影响销售量的因素 全部相同.现从地理位置相似、经营规模相仿的五家超市 收集了前一时期的销售情况,见表4.1.试分析饮料的颜色是 否对销售量产生影响? 表4.1 该饮料在五家超市的销售情况
4.1.3 方差分析的三个基本假定 (1)每个总体都服从正态分布;
(2)各个总体的方差都相等(方差齐性);
(3)各个观测值之间是相互独立的.
§4.2 单因素方差分析
4.2.1 单因素方差分析的数据结构
其中因素A有r个水平分别用 A1 , A2 , 用 xij i 1,2, , r; j 1,2, , k 表示. 4.2.2 单因素方差分析的步骤
图4-1 饮料颜色和销售量关系数据格式
解:依次单击菜单“分析→比较均值→单因素ANOVA”
图4-2 单因素方差分析的主设置界面
图4-3 两两比较的设置
下面是SPSS输出结果
书面作业 课本P262 10.5 P263 10.7
3.水平:因素的不同表现. 因素的每一个水平(组合)可以看作是一个总体. 只有一个因素的方差分析称为单因素方差分析. 研究多个因素对因变量的影响的方差分析称为多因素方 差分析,其中最简单的情况是双因素方差分析. 4.单元:因素水平之间的组合. 在双因素方差分析中,若因素A有r个水平,因素B有s个水平, 则在此试验中共有rs个单元. 5.元素:指用于测量因变量的最小单位. 元素实际上是每次 试验的观测值. 一个单元里可以只有一个元素,也可以有多个元素.
在例4.1中,取显著性水平 0.05 ,试在Excel中做单因素 方差分析.
Excel输出结果
4.2.3 方差分析中的多重比较
1.提出假设
H0 : i j , H1 : i j
t xi. x j . 1 1 MSE ( ) ni n j
2.计算检验统计量
引起方差的独立变量的个数,称作“自由度”. 检验因子影响是否显著的统计量是一个F统计量:
组间均方差 F 组内均方差
F统计量越大,越说明组间方差是主要方差来源,因子影响 越显著;F越小,越说明随机方差是主要的方差来源,因子 的影响越不显著.
3.方差分析的基本思想 通过分析研究不同来源的变异对总变异的贡献大小,从而 确定可控因素对研究结果影响力的大小.
2.方差分析的原理 (1)方差分解 总离差平方和=组内方差+组间方差 如果组间方差明显高于组内方差,说明样本数据波动的 主要来源是组间方差,因素是引起波动的主要原因,可以 认为因素对实验的结果存在显著的影响;反之,如果波动的 主要部分来自组内方差,则因素的影响就不明显,没有充足 理由认为因素对实验或抽样结果有显著作用. (2)均方差与自由度 因素或因素间“交互作用”对观测结果的影响是否显著,关 键要看组间方差与组内方差的比较结果.当然,产生方差的 独立变量的个数对方差大小也有影响,为了消除独立变量 个数对方差大小的影响,我们用方差除以独立变量个数,得 到“均方差(Mean Square)”,作为不同来源方差比较的基础.
i 1 j 1 i 1
2
2
三个平方和之间的关系为
SST SSE SSA
3.计算均方差
4.构造检验统计量
⑶统计决策
MSA F= ~F r 1, n r MSE
若Fobs F 则拒绝原假设 , r 1, n r
若 Fobs F r 1, n r 则不能拒绝原假设.Biblioteka xj 1ni
ij
x
x
i 1 j 1 r i 1
ij
n
i
2.计算各离差平方和
总离差平方和
SST xij x
i 1 j 1
r
ni
2
误差项离差平方和
r
SSE xij xi.
i 1 j 1
ni
r
ni
r
2
水平项离差平方和
SSA xi. x ni xi. x
的销售量的均值都相等,置信度仅为(0.95)6=0.735
方差分析可以用来比较多个均值 方差分析简称ANOVA(Analysis of Variance),该统计分析 方法能一次性地检验多个总体均值是否存在显著差异.
可以看作t检验的扩展,只比较两个均值时与t检验等价. 20世纪20年代由英国统计学家费希尔(R. A. Fisher)最早提 出的,开始应用于生物和农业田间试验,以后在许多学科中 得到了广泛应用. 4.1.1 方差分析中的几个基本概念 1.自变量: 作为原因的、把观测结果分成几个组以进行比 较的变量. 在方差分析中,自变量也被称为因素( factor). 在进行试验时,可以控制的试验条件就是因素. 2.因变量: 我们实际测量的、作为结果的变量. 例如:要分析不同销售方式对销售量是否有影响, 因此,销 售量是因变量,而销售方式是可能影响销售量的因素.
, Ar表示,每个观测值
假设在水平 Ai 下的观测值 xij 服从 N i , 2 ,在水平 Ai 下 做了 n 次试验,则单因素方差模型如下
i
xij i ij
4.1
其中随机误差 ij 相互独立,都服从 N 0, 2 分布. 1 r 若记 i , 称为一般水平或平均水平. i i r i 1 称为因素A的第i个水平的效应.则单因素方差模型变为