- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章 方差分析
§5.1
单因素方差分析 §5.2 多重比较 §5.3 两因素方差分析
§5.1 单因素方差分析
方差分析(analysis of variance,简称ANOVA)是用来对多个总 体的均值作比较检验的统计方法。 例子: (1)四种不同商标的同一类型产品其某一质量指标是否一致。 (2)对同样的商品,采用三种不同的销售方式是否会导致明显 不同的销售量。 (3)五个不同居民区居民的购买力是否存在明显差异。 这些例子中的商标、销售方式、居民区等称为因素(factor), 因素所处的状态称为水平(level)或处理(treatment)。 通常我们用大写字母A,B,C等表示因素,因素A的水平用 A1,A2,⋯等表示。
1 1 t0.00833 15 MSE 3.0365 3.5667 / 3 3.3109 6 6 由例5.2.1中的计算结果知,
x1 x2 23.167 25.333 2.167 x1 x3 23.167 21.333 1.834 x2 x3 25.333 21.333 4 *
§5.2 多重比较
在进行单因素方差分析时,如果检验拒绝了原假设,则我们 有时还需进一步检验到底哪些均值之间存在差异,把同时比 较任意两个水平下的总体均值有无显著差异的问题称为多重 比较问题。 假定在显著性水平α下通过方差分析拒绝了原假设H0: μ1=μ2=⋯=μk,现欲对μ1,μ2,⋯,μk进行两两比较检验。 对于假设检验问题 H0:μi=μj,H1:μi≠μj 检验统计量 xi x j t 1 1 MSE n n j i 当H0为真时,t~t(n−k)。
2.4 3.2 x2
4
4.8 μ 3
5.6 6.4 7.2
μ4
图5.1.1 当H0不真时各正态总体分布的示意图
称
yij i ij,j 1, 2, , ni,i 1, 2, , k 2 各 独 立同分布于 N 0, ij
为一般平均,其中n ni 。令 i 1 αi = μi− μ, i=1,2,⋯,k 称αi为因素A的第i个水平的效应。效应间满足如下关系:
§5.3 两因素方差分析
一、重复试验的两因素方差分析 二、无重复试验的两因素方差分析
一、重复试验的两因素方差分析
例5.3.1 为研究影响合成纤维抗断强度的因素,表5.3.1记录 了三位操作员用同一批产品的纤维在四台生产机器上试验的 数据。
表5.3.1
机 器 甲 操作员 1 2 3 109,110 110,112 116,114 110,115 110,111 112,115 108,109 111,109 114,119 110,108 114,112 120,117 乙 丙 丁
§5.2 多重比较
一、费希尔LSD法 二、邦弗伦尼法
一、费希尔LSD法
费希尔(Fisher)最小显著差异(least significant difference,LSD) 法是将所有配对检验的显著性水平均设定为α。对假设(5.2.1) 的显著性水平α下的拒绝规则为: 若|t|≥tα/2(n−k),则拒绝H0
k k P Eij P Eij 2 2 1i j k 1i j k
从而能满足总的显著性水平为α的要求。
例5.2.2 例5.1.2中,在α=0.05下使用邦弗伦尼法做多重比较 。 k 比较性显著性水平为: , 0.05/3=0.0167, 2
合成纤维抗断强度的试验数据
1.数学模型
设因素A有a个水平A1,A2,⋯,Aa,因素B有b个水平B1,B2,⋯,Bb, 水平组合(Ai,Bj)下的总体分布为N(μij,σ2)。从各(Ai,Bj)下的总 体中各自独立地抽取一个容量为r(≥2)的样本yij1, yij2, ⋯, yijr(i=1,2,⋯,a,j=1,2,⋯,b),因而有 yijk ~N(μij,σ2), k=1,2,⋯,r,i=1,2,⋯,a,j=1,2,⋯,b 记εijk=yijk−μij,则 εijk~ N(0,σ2), k=1,2,⋯,r,i=1,2,⋯,a,j=1,2,⋯,b 且各εijk相互独立。令
二、邦弗伦尼法
我们常常需要将两两比较检验的总的犯第一类错误概率控制 在α以内,称α为总的(或试验性)显著性水平。邦弗伦尼 (Bonferroni)法是将每个配对检验的比较性显著性水平设定为 k ,利用(5.2.7)式: P Eij 2 1i j k 总的犯第一类错误的概率
x1 x2 3.3109,
x1 x3 3.3109,
x2 x3 3.3109
故多重比较的结论与例5.2.1相同。 邦弗伦尼法很好地控制了总的犯第一类错误的概率,但不易 发现总体均值之间的差异,且检验的功效相对较低(即犯第 二类错误的概率相对较高),它是一种比较保守的多重比较
相应地可将上述假设等价地写为 H0: α1=α2=⋯=αk=0,H1: α1,α2,⋯,αk不全为零
二、显著性检验
令
k
SST yij y
ni i 1 j 1
ni
2
k 1 k 其中 y yij , n ni,称SST为总平方和,它反映了 n i 1 j 1 i 1 各yij的总差异程度。再令 1 ni yi yij , i 1, 2, , k ni j 1 SST可作如下的平方和分解:
一、费希尔LSD法
上式等价于如下拒绝规则: 若 xi x j LSD,则拒绝H0
其中
1 1 LSD t /2 (n k ) MSE n n j i xi x j t 1 1 MSE n n j i
如果各样本容量相等,则LSD对所有的配对将是同一个值。
例5.2.1 例5.1.2中,在α=0.05下使用费希尔LSD法做多重比 较。
三个水平的样本均值是
x1 23.167, x2 25.333, x3 21.333
样本均值之差是
x1 x2 23.167 25.333 2.167 x1 x3 23.167 21.333 1.834 x2 x3 25.333 21.333 4*
一、数学模型
设因素A有k个水平A1,A2,⋯,Ak,在水平Ai下的总体分布为 N(μi,σ2),从水平 Ai下的总体中抽取一个容量为ni的样本 0.6 (i=1,2,⋯,k) ,这k个样本相互独立。欲检验 H0:μ1=μ2=⋯=μk,H1: μ1,μ2,⋯,μk不全相等
0.4 密 度 0.2
0
0 0.8 1.6 μ 1 μ2
所需时间
22 25 26 24 23 27 22 26
yi∙
139 152
丙
19
22
21
25
21
20
128
y∙∙=419
输出5.1.1 单因素方差分析
源 模型 误差 C 合计 自由度 2 15 17 方差分析 平方和 均方 48.1111 24.0556 53.5000 3.5667 101.6111 F 统计量 6.74 Pr > F 0.0081
为处理均方,称
MSE
为误差均方。
SSE nk
构造检验统计量
MSTR F MSE 当H0为真时, F~F(k−1,n−k)。拒绝规则为: 若F>Fα(k−1,n−k),则拒绝H0
表5.1.2
来 源
因素A 误差 总 计
方差分析表
平方和
SSTR SSE SST
自由度
k−1 n−k n−1
均方
MSTR MSE SSTR k 1 SSE nk
最小显著差异
1 1 LSD t0.025 (15) MSE 2.1315 3.5667 / 3 2.324 6 6
“*”表示那对总体均值有显著差异。故乙和丙型号的机器混 合一批原料所需平均时间有显著差异,而甲和乙、丙均没 有显著差异。
k 对μ1,μ2,⋯,μk进行两两比较检验,要检验的假设共有 2 个: H0ij:μi=μj,H1ij:μi≠μj,1≤i<j≤k 在讨论多重比较方法时,我们把上式中单个假设检验的犯第 一类错误的概率称为比较性犯第一类错误的概率,对应的显 著性水平称为比较性显著性水平。此外,我们也常常关注在 所有的两两比较检验中,至少有一次犯第一类错误的概率, 并把这一概率称为总的(或试验性)犯第一类错误的概率。 在费希尔LSD法中,比较性犯第一类错误的概率为α,令 Eij={μi与μj配对检验犯了第一类错误},1≤i<j≤k 则总的犯第一类错误的概率为 P Eij 1i j k 费希尔LSD法较容易发现总体均值之间的差异,但总的犯第 一类错误概率可能较大,不易控制。
ni yi y yij yi
2 i 1 i 1 j 1
k
k
ni
2
记
SSTR ni yi y
i 1 k ni k 2
SSE yij yi
i 1 j 1
2
则
SST= SSTR+SSE 称SSTR和SSE分别为处理(或组间)平方和及误差(或组内)平 方和,SST,SSTR和SSE分别具有自由度(n−1),(k−1)和(n−k)。 SSTR反映了各总体的样本均值之间的差异,也基本反映了 μ1, μ2,⋯, μk之间的差异程度,SSE反映了随机误差的大小。 称 SSTR MSTR k 1
例5.1.1 为检验甲、乙、丙三种型号的机器混合一批原料所 需平均时间是否相同,某管理人员得到了混合原料所需时间 的如表5.1.1 所示的数据。