第四章 方差分析
- 格式:doc
- 大小:248.00 KB
- 文档页数:7
§4 方差分析¾问题的提出[引例1] 为研究光照条件对某种有机物降解速度的影响,在人工控制的六种不同光强条件下,测定了该有机物24小时内的降解速度。
光强条件重复测定结果117.724.827.925.224.3219.422.62722.123320.72120.518.818.6417.319.419.116.920.851719.49.111.915.8614.312.411.811.614.2光照条件是否影响该有机物的降解速度?-不同的光照条件下降解速度是否存在显著性差异?单因素方差分析¾问题的提出[引例2] 为比较3种松树在4个不同地区的生长情况有无差别,在每个地区对每种松树随机地选取5株,测量它们的胸径。
在不同地区松树的胸径是否存在显著性差异?双因素等重复方差分析¾问题的提出[引例3]为研究3种不同作物对污泥中镉吸收能力的差别,选择了4个地块进行栽培试验。
将每一个地块划分成三个小区,三种作物随机地分种在每个地块的三个小区上。
在所有地块上施用同等数量的污泥,作物收获后分别测定了其中镉的积累量(ug/kg):不同作物对镉的吸收是否有显著性差异?不同地块下作物对镉的吸收是否有显著性差异?双因素无重复方差分析§4 方差分析¾研究论文¾利用t 检验进行2个以上总体均值比较的弊端¾检验过程烦琐¾无统一的试验误差,犯第I类错误的概率增大=2510C ααα−10.4’10=0.05=(1-)=¾方法的提出英国统计学家R.A.Fisher于1923年提出方差分析方法(analysis of variance,ANOVA)。
方差分析的基本思想是:把全部数据关于总均值的离差平方和分解成几部分,每一部分表示某因素诸水平作用所产生的效应,将各部分均方与误差均方相比较,从而确认或否认某些因素或交互作用的重要性。
方差分析可用于多个样本均值的比较、分析多个因素的交互作用、方差的同质性检验、回归方程的显著性检验。
第4章方差分析(ANOV A)实验设计和分析Catherine Potvin4.1生态学问题弄懂生态学问题需要将各种环境因子的影响分开,生态工作者用实验来解决这个问题。
不论在野外还是在控制环境条件下,可控实验都可以让生态工作者们只变化一个因子来检验其影响。
例如,生长箱能使生物体生长在完全相同的温度而不同的光周期的条件下,或相同的光强而不同温度条件下的实验成为可能。
在控制实验中,通常最希望的情况是环境‘背景’,即所有的影响因子, 不是自由地变化,而是精确地得到控制,这样就能够保证在改变目标变量时,观测的反应不会受到其它因素的影响。
因而控制环境条件, 例如使用生长箱和温室,成为植物生态学的一个常用的方法,如同动物生态学中使用的生长柜和水族槽一样。
本章第一部分,我要讲一下作为实验生态学基本工具的方差分析(ANOV A)。
本章重点放在实验设计上。
虽然人们一般认为生长箱会提供同一环境条件,但不论在一个生长箱内还是生长箱间都存在环境异质性(Lee和Rawlings 1982;Potvin等1990a),因而能够充分处理环境异质性的实验设计将在本章中述及。
尽管我的论述主要是以生长箱实验为基础,其原理在其它类型的控制或野外环境的实验研究中同样适用(第5,15和16章)。
我还要讨论错误实验设计的代价。
本章应视为实验设计的起步点,这个起步点就是要考虑各种影响因素。
实验者通常进行的实验比这里展开的要复杂。
但是一旦懂得了基本原理,讨论各种实验设计就相对简单一些。
更详细的论述请见Cochran & Cox(1957)和Winter(1991)。
4.2 统计问题:环境变化与统计分析正如Underwood(1997)建议的一样,生态实验设计的第一步是建立一个线性模型使研究者能够将感兴趣的变量(因素)独立出来。
由于实验设计支配误差项,建立线性模型取决于所研究的因子以及具体的实验设计。
在任何一个实验开始时,最基本的是要检验空间与时间变化的格局。
第四章 t检验和单因素方差分析命令与输出结果说明·单因素方差分析单因素方差分析又称为Oneway ANOVA,用于比较多组样本的均数是否相同,并假定:每组的数据服从正态分布,具有相同的方差,且相互独立,则无效假设。
原假设:H0:各组总体均数相同。
在STATA中可用命令:oneway 观察变量分组变量[, means bonferroni]其中子命令bonferroni是用于多组样本均数的两两比较检验。
例:测定健康男子各年龄组的淋巴细胞转化率(%),结果见表,问:各组的淋巴细胞转化率的均数之间的差别有无显著性?健康男子各年龄组淋巴细胞转化率(%)的测定结果:11-20 岁组:58 61 61 62 63 68 70 70 74 7841-50 岁组:54 57 57 58 60 60 63 64 6661-75 岁组:43 52 55 56 60用变量x 表示这些淋巴细胞转化率以及用分组变量group=1,2,3分别表示11-20岁组,41-50岁组和61-75岁组,即:数据表示为:x 58 61 61 62 63 68 70 70 74 78 54 57 group 1 1 1 1 1 1 1 1 1 1 2 2x 57 58 60 60 63 64 66 43 52 55 56 60 group 2 2 2 2 2 2 2 3 3 3 3 3则用 STATA 命令:oneway x group, mean bonferroni| Summary of xgroup | Mean ①-------------+------------1 | 66.52 | 59.8888893 | 53.2------+------------Total | 61.25 ②Analysis of VarianceSource SS df MS F Prob > F-------------------------------------------------------------------------------Between groups 616.311111③ 2 ④ 308.155556⑤ 9.77⑥ 0.0010⑦Within groups 662.188889⑧ 21⑨ 31.5328042⑴-------------------------------------------------------------------------------Total 1278.50 23 55.586956(2)Bartlett's test for equal variances:chi2(2) = 2.1977 (3)Prob>chi2=0.333Comparison of x by group(Bonferroni)Row Mean- |Col Mean | 1 2-------------- --|--------------------------------------2 | -6.61111 (4)| 0.054 (5)|3 | -13.3 (6) -6.68889(8)| 0.001 (7) 0.134 (9)①对应三个年龄组的淋巴细胞转化率的均数;②三组合并在一起的总的样本均数;③组间离均差平方和;④组间离均差平方和的自由度;⑤组间均方和(即:⑤=③/④);⑧组内离均差平方和;⑨组内离均差平方和的自由度;(1)组内均方和(即:(1)=⑧/⑨);⑥为F 统计值(即为⑤/(1));⑦为相应的p值;(2)为方差齐性的Bartlett检验;(3)方差齐性检验相应的p值;(4)第二组的淋巴细胞转化率样本均数—第一组的淋巴细胞转化率的样本均数的差;(5)第二和第一组均数差的显著性检验所对应p 值;(6)第三组的淋巴细胞转化率样本均数—第一组的淋巴细胞转化率的样本均数的差;(7)第三和第一组均数差的显著性检验所对应的 p 值;(8)第三组的淋巴细胞转化率样本均数—第二组的淋巴细胞转化率的样本均数的差;(9)第三和第二组均数差的显著性检验所对应的p 值。
第四章多个样本均数比较的方差分析方差分析的基本思想是通过比较各组或处理的均值差异与各组内的个体间差异来判断是否存在显著差异。
在进行方差分析之前,需要满足一些前提条件,如对总体的抽样是简单随机抽样、各样本之间是独立的等。
这些前提条件的满足保证了方差分析的可靠性。
多个样本的方差分析是通过计算组间离差平方和(SSTr)、组内离差平方和(SSE)和总离差平方和(SST)来比较各组或处理之间的差异。
计算公式为:SSTr = Σni(x̄i - x̄)²SSE = ΣΣ(xij - x̄i)²SST=SSTr+SSE其中,n是每组或处理的样本个数,ni是第i组或处理的样本个数,x̄i是第i组或处理的样本均值,x̄是全部样本的均值,xij是第i组或处理的第j个样本值。
通过计算SSTr和SSE,可以得到均方值(MS):MStr = SSTr / (r - 1)MSE=SSE/(N-r)其中,r是组或处理的个数,N是总样本个数。
接下来,需要计算F值,用于判断各组或处理均值是否有显著差异:F = MStr / MSE根据F值和自由度,可以查找F表来确定是否存在显著差异。
如果F 计算值大于F临界值,则拒绝原假设,表示均值之间存在显著差异。
方差分析还可以进行多重比较,用于确定具体哪些组或处理之间存在显著差异。
常用的多重比较方法有Tukey的HSD(最大均值差异)和Bonferroni方法。
方差分析的优点是可以同时比较多个样本的均值差异,具有较好的统计效应。
然而,方差分析也存在一些限制,如对正态性和方差齐性的要求较高。
总之,多个样本均数比较的方差分析是一种常用的统计方法,在科学研究和实验设计中得到广泛应用。
它可以帮助研究人员确定不同处理或组之间的差异,为决策提供支持。
第四章 方差分析
一、填空题
1、方差分析就是通过对实验数据进行分析,检验方差 时,各正态总体的 是否相等,以判断各因素对试验指标的影响是否相等。
2、单因素方差分析的数学模型为 。
3、在单因素方差分析中,总偏差平方和分解公式为 。
4、对于具有s 个水平的单因素A 实验方差分析(水平i A 对应的总体为),(2σμi N (i =1,2,…,s ),现取样,设各水平下的样本容量之和为n ,以T e A S S S ,,分别表示因素A 的效应平方和、误差平方和、总偏差平方和,则 (1)T e A S S S ,,之间的关系是___________; (2)在s μμ==...1成立的条下,
~)
/()
1/(s n S s S E A --___________;
(3)在显著性水平α下,假设“s H μμ==...:10,s H μμ,...,:11不全相等”的拒绝域形式是_________
4、方差分析的目的是_______ .
解:推断各因素对试验结果影响是否显著.
5、在一个单因子试验中,因子A 有4个水平,每个水平下重复次数分别为:5,7,6,8 那么误差平方和的自由度 ,因子A 的平方和的自由度为 。
6、单因素试验方差分析的数学模型含有的三个基本假定是_______ . 解:正态性、方差齐性、独立性.
二、简述题
1、简述方差分析解决什么问题。
2、单因素方差分析的数学模型是什么?
3、单因素方差分析中的总偏差平方和分解公式是什么?
4、单因素方差分析中,总偏差平方和、组间偏差平方和(因子平方和)、组内偏差平方和(误差平方和)分别是由什么引起的?
5、方差分析的检验一般用什么检验法?
6、方差分析的目的及思想(结合单因素)。
三、单选题
1、方差分析是一个( )问题。
A 、假设检验
B 、参数估计
C 、随机试验
D 、参数检验
2、在方差分析中,( )反映的是样本数据与其组平均值的差异 A 总离差 B 组间误差 C 组内误差 D A,B,C 全错
3、∑∑==-s
i n j i ij i
X X 112)(是( )
A 组内平方和
B 组间平方和
C 总离差平方和 D
4、单因素方差分析中,数据i ij n j r i X ,,2,1;,,2,1, ==可以看作是取自( )。
A 、一个总体),(~2σμN X
B 、r 个总体r i N X i i ,,2,1),,(~2 =σμ
C 、r 个总体r i N X i i ,,2,1),,(~2 =σμ
D 、n 个总体i i i n j r i N X ,,2,1;,,2,1),,(~2 ==σμ
四、计算题
1、为了改进录音效果,今比较三种不同磁粉的录音带的放音效果,用这三种不同的磁粉(记为321,,A A A )的录音带录音,假设),(~211σμN A ,),(~222σμN A ,
),(~233σμN A ,得到的数据已汇总成方差分析表如下
(1)(2)问这三种磁粉的平均放音效果有无显著差异(0.05α=)?
2、我校硕士研究生《数理统计》课实行选课、考教分离制,由全校统一命题进行考试,试卷批改也是集体阅卷、流水进行,成绩出来以后要进行多项分析,现从参加该课程考生中随机选取部分学生作为样本, 对任课教师的教学效果进行评价,抽样数据如下:
经计算:∑∑===11
1517i j ij x ,85.75=x ,∑∑===11
2
115851
i j ij x 设各成绩值总体服从同方差的正态分布,试仅从学生成绩角度用方差分析法检验各个教师的教学水平是否有明显差异(0.05)α=?
3、养鸡场要检验四种饲料配方对小鸡增重是否相同,用每一种饲料分别喂养了6只同一品种同时孵出的小鸡,共饲养了8周,每只鸡增重数据如下:(克) 配方:370,420,450,490,500,450
配方:490,380,400,390,500,410 配方:330,340,400,380,470,360
配方:410,480,400,420,380,410
问:四种不同配方的饲料对小鸡增重是否相同?(05.0=α,
1.3)20,3(05.0=F ,部分数据的计算结果为83.14245,83.58195
==A T Q Q )
4、有三台机器生产规格相同的铝合金薄板,为检验三台机器生产薄板的厚度是否相同,随机从每台机器生产的薄板中各抽取了5个样品,测得结果如下: 机器1:0.236,0.238,0.248,0.245,0.243 机器2:0.257,0.253,0.255,0.254,0.261 机器3:0.258,0.264,0.259,0.267,0.262
问:三台机器生产薄板的厚度是否有显著差异?要列出方差分析表
(05.0=α,部分数据计算结果为000192.0,001053.0,001245.0===e A T Q Q Q )
5、为研究蒸馏水的PH 值和硫酸铜溶液浓度对化验血清中的白蛋白与球蛋白的影响,对蒸馏水的PH 值(A )取了四个不同的水平,对硫酸的浓度(B )取了三个不同水平,在不同的组合水平(,)i j A B 下,各测一次白蛋白与球蛋白之比,对其结果进行运算得以下方差分析表的部分数据:
(1)(2).检验两个因素不同水平下的化验结果是否有明显差异(05.0=α,
26.7)6,2(,76.4)6,3(95.095.0==F F ).
6、一批由同一种原料织成的布,用不同的印染工艺处理,然后进行缩水处理。
假设采用A 、B 、C 三种不同的工艺,每种工艺处理4块布样,测得缩水率(单
位:%)的数据如表1所示。
根据这些数据,完成下列问题:
填写下列未完成的方差分析表(表2),并根据方差分析表以显著水平05.0=α来判断不同的工艺对布的缩水率的影响是否有显著差异?
解:(1)完成方差分析表如上 4分(其中F 值1分,其他每空格0.5分) 由05.0=α知26.4)9,2(=αF , F= 5.366>26.4)9,2(=αF , 5分 可认为有显著差异.
6分
7、灯丝四种配料方案如下表:
给定显著性水平下分布表分位数22.39.0F =,方差分析确定四种灯丝配料方案在使用寿命上有无显著差异?(不做正态性和方差齐性检验)
(提示数据:54.195711=T S ,7.44360=A S )
8、设有三台机器A 、B 、C 制造同一种产品。
对每台机器观察5天的日 产量。
记录如下(单位:件) A : 41,48, 41, 57, 49 B : 65,57, 54 ,72, 64 C : 45,51, 48, 56, 48
试问:在日产量上各台机器之间是否有显著差异?(05.0=α), 已知:79.3)12,2(05.0=F
9、车间里有5名工人,3台不同型号的机器生产同一种产品,现在让每个工人轮流在3台机器上操作,记录其日产量结果如下:
试?
)84.3)8,4
(,46.4)8,2(,05.0(05.005.0===F F α
10、某数理统计教师随机地选取18名学生把他们分为3组,每一组各采用一种特殊的教学方法,期末进行统考,各组成绩如下:
假设学生成绩服从正态分布,试问:在显著水平下这三种教学方法的教学效果有无显著差异?哪种教学效果最好? 注:70.2)15,2(05.0=F
11、考察4种不同类型的电路对计算机的响应时间的影响,测得数据如下:
经计算:∑∑===4
11
386i n j ij i
x ,∑∑===4
11
2
8992i j ij i
x
设各测量值总体服从同方差的正态分布,试用方差分析法检验各类型电路对响应时间有无显著影响)05.0(=α?
12、为研究蒸馏水的PH 值和硫酸铜溶液浓度对化验血清中的白蛋白与球蛋白的影响,对蒸馏水的PH 值(A )取了四个不同的水平,对硫酸的浓度(B )取了三个不同水平,在不同的组合水平
(,)
i j A B 下,各测一次白蛋白与球蛋白之比,
对其结果进行运算得以下方差分析表的部分数据:
2.检验两个因素不同水平下的化验结果是否有明显差异(05.0=α)。
给定05.0=α,查出,26.7)6,2(,76.4)6,3(05.005.0==F F。