- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
单因素方差分析
(三)数学模型
设控制变量A有k个水平,每个水平均有ni个数据,在 水平Ai下第j个数据xij可以分解为:
i为水平Ai下的理论指标值,ij为误差,服从正态分布(0,σ2)
xij=i+ij
k 1 k i ai i , i 1,2,...k xij ai ij 且 ai 0 K i 1 i 1 ˆ x作为的无偏估计 , xi x作为 i的无偏估计
第六章 方差分析
方差分析概述
一、问题的提出 最优方案的设计 如何获得最佳的产品销售量 哪些因素是影响销售量的主要因素 哪些因素的那种情况更利于提高销售量 哪些因素的组合更利于提高销售量 可以利用方差分析的方法来实现
方差分析概述
二、方差分析 目的:方差分析从分析数据的差异入手,分析哪些因素 是影响数据差异的众多因素中的主要因素。 相关概念:
单因素方差分析中的多重比较
(一)目的
如果各总体均值存在差异,F检验不能说 明哪个水平造成了观察变量的显著差异。 多重比较将对每个水平的均值逐对进行比 较检验。
(二)几种常用的多重比较方法
LSD(Least significant Difference)最小显著性差异法 T(Tukey)方法
单因素方差分析中的多重比较
多因素方差分析
(二)基本思路 SST=SSA+SSB+SSAB+SSE
A有p个水平,B有q个水平,每组有r个样本
SST ( xijk x )
SSA qr ( x x )
i 1 j 1 k 1 p A i i 1
2
p
q
r
2
SSB pr ( x jB x )2 SSE ( xijk xij )2
多因素方差分析:
协方差分析:
在尽量排除其他因素的影响下,分析单个或多个控 制因素对观测变量的影响。(引入协变量)
单因素方差分析
(一)目的 检验某一个控制因素的改变是否会给观察变量
带来显著影响。
例如:应用面很广(科学试验,社会经济问题)
考察不同肥料对某农作物亩产量是否有显著差异; 考察不同温度下某化工产品的合格率; 考察妇女生育率在不同地区是否有显著差异;
多因素方差分析
(二)基本思路
认为观测变量的变动是由各控制变量独立作用、它们 的交互作用、以及随机因素造成的。 以两个控制变量的方差分析为例:
SST=SSA+SSB+SSAB+SSE
(main effects) (N-way 交互) (Residual) (explained)
其中:SAB表示两个控制变量交互影响带来的变差
i为水平Ai对试验结果产生的影响,称为水平Ai的效应。如果A对观测变量 没有影响,则各水平的效应全为0,否则不全为0。于是有: H0:α1= α 2骤 (1)菜单选项: analyze->compare means->one-way ANOVA (2)选择一个或多个变量作为观察变量到dependent list 框
方差分析概述
观测变量 控制因素
亩产量 Xxx,xxx,xxx,xxx Xxx,xxx,xxx,xxx Xxx,xxx,xxx Xxx,xxx,xxx,xxx Xxx,xxx,xxx,xxx Xxx,xxx
施肥量 10 公斤 15 公斤 20 公斤
三个水平
方差分析概述
三、核心问题
从数据差异角度看: 观测变量的数据差异=控制因素造成+随机因素造成
协方差分析
(一)目的 将无法或很难控制的因素作为协变量,在排除 协变量影响的条件下更精确地分析控制变量对 观察变量的影响。 例如:
体重增量 xxx,xxx,xxx xxx,xxx xxx,xxx, xxx,xxx,xxx xxx,xxx,xxx xxx,xxx,xxx
501 502 503 10公斤 503 501 502 15公斤 502 503 501 20公斤
608 510 521 10公斤 510 601 524 15公斤 604 501 530 20公斤
方差分析概述
四、方差分析的类型
单因素方差分析:
只考虑一个控制因素的影响 考虑两个以上的控制因素和它们的交互作用对观测 变量的影响
(三)实现方式
post hoc选项
单因素方差分析中的先验对比
(一)目的
先凭经验确定各水平均值之间的对比系数,然后判定这两 组均值的线性组合是否存在显著差异。如:
1/3 (k1+k2+k3)=1/2 (k4+k5)
H0:两组均值的线性组合无显著差异。
(二)实现方式
Contrasts选项,在Coefficients框中输入每个水平均值的 系数值和正负符号。 注意:
当控制因素对实验结果有显著影响时,和随机因素共同作 用必然使观测变量产生显著变动;反之,观测变量的变动
较小,将归结为随机性造成的(这里指抽样误差造成的)。
方差分析概述
观察以下三组数据: 500 500 500 10公斤 600 600 600 15公斤 700 700 700 20公斤 • 方差分析正是要分析观测变量 的变动主要是由控制因素造成的 还是由随机因素造成的,以及控 制变量的各个水平是如何对观测 变量造成影响的。
(二)几种常用的多重比较方法
LSD(Least significant Difference)最小显著性差异法
t xi x j 1 1 MSE( ) ni n j ~ t (n k )其中n为总样本数
t
xi x j 2MSE r
~ t (n k )其中r为各水平下的样本数
特点: 利用了全部样本数据,而不仅是所比较的两组的 数据,且认为各水平均是等方差的 与其他方法相比,其检验敏感度最高 在一定程度上克服了放大犯一类错误的问题
即:不同水平下控制因素的影响不显著。
单因素方差分析
(二)基本思路 (4) 构造F统计量
因为:总变差=组间差异+组内差异 可证明:SST= SSA+SSE(设:k个水平,每个水平有 ni个数据)
nj 2
SST ( xij x )
i 1 j 1
k
SSA ni ( xi x )
i 1
k
2
SSE ( xij xi ) 2
i i j 1
k
nj
考察平均的组间差异与平均的组内差异的比值,于 是: SSA/(k 1) MSA F ~F(k-1,n-k)
SSE /(n k ) MSE
单因素方差分析
(二)基本思路 (5)结论:
F值较大,F值的相伴概率p值小于或等于用户给定的 显著性水平a,则拒绝H0,认为不同水平下各总体均 值有显著差异; F值较小,F值的相伴概率p值大于用户给定的显著性 水平a,则不能拒绝H0,可以认为不同水平下各总体 均值无显著差异。
小城市 小型广告 XX,XX, XX,XX 中型广告 XX,XX, XX,XX 大型广告 XX,XX 中等城市 XX,XX, XX,XX XX,XX, XX,XX XX,XX, XX,XX 大城市 XX,XX XX,XX, XX,XX XX,XX, XX 特大城市 XX,XX XX,XX XX,XX XX,XX, XX,XX
单因素方差分析中的多重比较
(二)几种常用的多重比较方法
T(Tukey)法
MSE 特点: r 利用了全部样本数据,而不仅是所比较的两 组的数据,且认为各水平均是等方差的
t
xi x j
~ q(k , n k )其中 : r为各水平下的样本数
q分布平缓些,克服了扩大犯错的可能性, 但不如LSD方法敏感 适合各水平下样本数均相同的情况
输入系数的顺序与控制变量水平值的升序一一对应 系数的和为0
单因素方差分析中的趋势检验
(一)目的
将组间平方和分解成线性、二次、三次或更高 次的多项式,检验观测变量是否随控制变量呈 不同次幂变化。
(二)实现方式
Contrasts选项, polynomial框
多因素方差分析
(一)目的 测试若干个控制因素的不同水平的交叉变化是否给观 察变量带来了显著影响。 例如:
(3)选择一个变量作为控制变量到factor框
(4) option中的statistics项:
descriptive:输出观察变量不同水平下的描述统计量
单因素方差分析
(五)进一步的分析 前提的检验:各水平下方差齐性检验,即各水 平下方差是否相等的检验。 实现方法:
H0:各水平下各总体方差无显著差异。 option中的statistics:Homogeneity-of-variance, 检验各水平下各总体方差是否齐性。
(1)观测变量:作为观测的对象(如:亩产量、推销量等)。 (2)控制因素:人为可以控制的因素(如:施肥量、品种、推销策略、 价格、包装方式等),在方差分析中称为控制因素。将控制变量 的不同情况称为控制变量的不同水平。 (3)随机因素:人为很难控制的因素(如:气候、推销人员的形象、 抽样误差等),方差分析中主要指抽样误差。
多因素方差分析
(三)说明 多因素方差分析的核心内容:
检验在不同控制变量的不同交叉水平下,各交叉分组下样本数据 所来自的总体均值,有无显著差异。 进而判断多个因素是否对观 测变量产生了显著影响,但等方差一般不再非常强调
H0:各交叉水平下的总体均值均无显著差异。 数学模型:以双因素为例
xijk ai bi (ab)ij ijk