i第八章单因素方差分析 (1)
- 格式:doc
- 大小:165.00 KB
- 文档页数:16
单因素方差分析步骤:对于只有一种因素影响的资料,例如本例只检测血型这一种变量是否影响肺活量。
我们先确立假设和确立检验标准H0:假设不同血型的人的肺活量是有差异的H1:假设不同血型的人的肺活量是没有差异的。
第一步:选择检验方式第二步:确定比较方式第三布:在选项里选择描述方式第四步:得出结果:由本图可知,p》0.05,可知肺活量的总体方差无差异,方差齐则可做方差分析再有下图可知:p= 0.789是大与0.05的,所以不是小概率事件,不拒绝H0,所以认为不同血型的人的肺活量是没有差异的。
随机区组设计资料的方差分析2.如果对四种饲料对猪体重增加量有无差异进行分析,则可将猪随机分组,本例中以a代表分组,b代表饲料,x代表体重增加量如图:对于这种资料分析,应选用单变量方差分析,主要是影响因素是多样的,主要描述的是体重增加量。
那么我们首先应1、确定假设:对于处理组:H0,假设三种处理方式体重增加量是相等的H1,假设三种处理方式体重增加量是不等的。
对于区组:H0,假设三组之间体重增加量是相等的H1,假设三组之间体重增加量是不等的。
2、确立检验标准a=0.053、计算统计量F F1=MS处理/MS误差F2=MS区组/MS误差4、确定p值,做出推断结论。
第一步:选择分析方式第二步:选择确立因变量,本题描述的是体重增加量,故选用x,确立区间,处理措施。
如图:第三步:确定模型,本题为确定区组a与处理措施b的交互作用,因此选用a,b交互模式。
如图:如需作图比较分组a 与处理措施b 的交互作用对体重影响有无差异可添加对比组,如图:确定观察均值的两两比较,主要针对与各分组的均值比较,及各处理方式的均值比较:在选项里设定输出,描述统计及方差齐性检验,显示分组及处理方式的均值。
最后得出结果:有本图可知F<3,p>0.05,可知各组间方差齐,可做方差检验。
如下图所示,可知p≥0.05,统计无差异,所以可知,三种处理方式对体重增加是无差异的。
单因素⽅差分析(one-wayANOVA)单因素⽅差分析(⼀)单因素⽅差分析概念是⽤来研究⼀个控制变量的不同⽔平是否对观测变量产⽣了显著影响。
这⾥,由于仅研究单个因素对观测变量的影响,因此称为单因素⽅差分析。
例如,分析不同施肥量是否给农作物产量带来显著影响,考察地区差异是否影响妇⼥的⽣育率,研究学历对⼯资收⼊的影响等。
这些问题都可以通过单因素⽅差分析得到答案。
(⼆)单因素⽅差分析步骤第⼀步是明确观测变量和控制变量。
例如,上述问题中的观测变量分别是农作物产量、妇⼥⽣育率、⼯资收⼊;控制变量分别为施肥量、地区、学历。
第⼆步是剖析观测变量的⽅差。
⽅差分析认为:观测变量值的变动会受控制变量和随机变量两⽅⾯的影响。
据此,单因素⽅差分析将观测变量总的离差平⽅和分解为组间离差平⽅和和组内离差平⽅和两部分,⽤数学形式表述为:SST=SSA+SSE。
第三步是通过⽐较观测变量总离差平⽅和各部分所占的⽐例,推断控制变量是否给观测变量带来了显著影响。
(三)单因素⽅差分析原理总结在观测变量总离差平⽅和中,如果组间离差平⽅和所占⽐例较⼤,则说明观测变量的变动主要是由控制变量引起的,可以主要由控制变量来解释,控制变量给观测变量带来了显著影响;反之,如果组间离差平⽅和所占⽐例⼩,则说明观测变量的变动不是主要由控制变量引起的,不可以主要由控制变量来解释,控制变量的不同⽔平没有给观测变量带来显著影响,观测变量值的变动是由随机变量因素引起的。
(四)单因素⽅差分析基本步骤1、提出原假设:H0——⽆差异;H1——有显著差异2、选择检验统计量:⽅差分析采⽤的检验统计量是F统计量,即F值检验。
3、计算检验统计量的观测值和概率P值:该步骤的⽬的就是计算检验统计量的观测值和相应的概率P值。
4、给定显著性⽔平,并作出决策(五)单因素⽅差分析的进⼀步分析在完成上述单因素⽅差分析的基本分析后,可得到关于控制变量是否对观测变量造成显著影响的结论,接下来还应做其他⼏个重要分析,主要包括⽅差齐性检验、多重⽐较检验。
11-第8章单因素方差分析仅供学习与交流,如有侵权请联系网站删除 谢谢140+第八章 单因素方差分析第一节 方差分析的基本问题一、方差分析要解决的问题t 检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验;而多个平均数间的差异显著性检验,必须用方差分析法。
1、检验过程繁琐一试验包含5个处理,采用t 检验法要进行25C 10=次两两平均数的差异显著性检验;若有k 个处理,则要作k (k-1)/2次类似的检验。
2、无统一的试验误差,误差估计的精确性和检验的灵敏性低 12X -X s如表8-1,试验有5个处理,每个处理重复6次,共有30个观测值。
进行t 检验时,每次只能利用两个处理共12个观测值估计试验误差,误差自由度为2(6-1)=10;若利用整个试验的30个观测值估计试验误差,显然估计的精确性高,且误差自由度为5(6-1)=25。
可见在用t检法进行检验时,由于估计误差的精确性低,误差自由度小,使检验的灵敏性降低,容易掩盖差异的显著性。
3、推断的可靠性低,检验的I型错误率大用t检验法进行多个处理平均数间的差异显著性检验,由于没有考虑相互比较的两个平均数的秩次问题,因而会增大犯I型错误的概率,降低推断的可靠性。
假设每一对检验接受零假设的概率都是1-α=0.95,而且这些检验都是相互独立的,那么10对检验都接受概率是(0.95)10=0.60,犯错误的概率α׳=1-0.60=0.40犯I型错误的概率明显增加。
由于上述原因,多个平均数的差异显著性检验不宜用t检验,须采用方差分析法。
二、方差分析的几个概念方差分析(analysis of variance)是由英国统计学家R.A.Fisher于1923年提出的。
这种方法是将a个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。
幻灯片1【例】调查了5个不同小麦品系的株高,结果如下。
试判断这5个品系的株高是否存在显著性差异。
5个小麦品系株高(cm)调查结果株号品系ⅠⅡⅢⅣⅤ12345和平均数64.665.364.866.065.8326.565.364.565.364.663.763.9322.064.467.866.367.166.868.5336.567.371.872.170.069.171.0354.070.869.268.269.868.367.5343.068.6幻灯片2第八章单因素方差分析One-factor analysis of variance幻灯片3本章内容第一节方差分析简述第二节固定效应模型第三节随机效应模型第四节多重比较第五节方差分析应具备的条件幻灯片4第一节方差分析简述一、方差分析的一般概念1、概念方差分析( analysis of variance,ANOVA):是同时判断多组数据平均数之间差异显著性的统计假设检验,是两组数据平均数差异显著性t 检验的延伸。
幻灯片5单因素方差分析(一种方式分组的方差分析):研究对象只包含一个因素(factor)的方差分析。
单因素实验:实验只涉及一个因素,该因素有a个水平(处理),每个水平有n次实验重复,这样的实验称为单因素实验。
水平(level):每个因素不同的处理(treatment)。
幻灯片6方差分析Analysis of Variance (ANOVA )ANOV A 由英国统计学家,用于推断多个总体均数有无差异。
幻灯片7【例】随机选取4窝动物,每窝中均有4只幼仔,称量每只幼仔的出生重,结果如下。
判断不同窝的动物出生重是否存在显著性差异。
4窝动物的出生重 单位:g幻灯片82、单因素方差分析的数据格式:因素也称为处理因素(factor )(名义分类变量),每一处理因素至少有两个水平(level)(也称“处理组”)。
一个因素(水平间独立) ——单向方差分析(第八章)两个因素(水平间独立或相关)——双向方差分析(第九章)一个个体多个测量值——重复测量资料的方差分析 ANOV A 与回归分析相结合——协方差分析目的:用这类资料的样本信息来推断各处理组间多个总体均数的差别有无统计学意义。
32.9 31.4 25.7 28.0 118.0 29.50027.1 23.3 27.8 26.7 104.9 26.22533.2 26.0 28.6 32.3 120.1 30.02534.7 33.3 26.2 31.6 125.8 31.4501 2 3 4 和 平均数Ⅳ Ⅲ Ⅱ Ⅰ窝 别 动物号幻灯片9二、不同处理效应与不同模型 1、方差分析中每一观测值的描述 ——线性统计模型yij :在第i 水平下的第j 次观测值;μ:总平均数,是对所有观测值的一个参数;αi :处理效应,是仅限于对第i 次处理的一个参数; εij :随机误差成分。
幻灯片102、①固定效应:由固定因素所引起的效应。
②固定因素:所研究因素各个水平是经过特意选择的,这样的因素称为固定因素。
固定因素的水平可以严格地人为控制,在水平固定之后,它的效应值也是固定的。
③固定模型:处理固定因素所用的模型。
幻灯片113、①随机效应:由随机因素所引起的效应。
②随机因素:所研究因素各个水平是从该因素水平总体中随机抽出的,这样的因素称为随机因素。
随机因素的水平是不能严格人为控制的,在水平确定之后,它的效应值并不固定。
③随机模型:处理随机因素所用的模型。
... yi1 yi2 yi3 ... yij (i)Yi … ya1 ya2 ya3 … yaj … yany31 y32 y33 ... y3j (3)y21 y22 y23 ... y2j (2)y11 y12 y13 ... y1j (1)1 2 3 … j … n平均数Ya Y3 Y2 Y1•1y •2y •3y •i y •a y 在固定模型中,方差分析所得到的结论只适合于选定的那几个水平,不能将结论扩展到未加考虑的其它水平上。
幻灯片12第二节 固定效应模型 一、线性统计模型要检验a 个处理效应的相等性,就要判断各αi 是否为0。
H0:α1= α2 =……= αa =0HA :αi ≠ 0 (至少有1个i )若接受H0,则不存在处理效应,每个观测值是由总平均数加上随机误差构成;若拒绝H0,则存在处理效应,每个观测值是由总平均数、处理效应及误差三部分构成。
幻灯片13● 总变异是测量值yij 与总的均数间的差异。
● 处理间变异是由处理效应引起的变异。
● 处理内变异是由随机误差引起的变异。
用离均差平方和的平均(均方、方差)反映变异的大小 幻灯片14二、平方和与自由度的分解1. 总平方和(total sum of squares, SST): 每个测量值与总平均数离差的平方和的总和,反应了一组数据总的变异程度。
计算公式为:dfT=N-1=an-1校正项(校正系数,correction): 幻灯片152. 处理间平方和(sum of squares among treatments, SSA): 各个处理组的平均数与总平均数离差的平方和,SSA 反映了各处理组均数的变异程度。
计算公式为:dfA=a-1(含有误差成分)处理均方(treatment mean square ,MSA):处理间平方和除以自由度。
在随机模型中,方差分析所得到的结论,可以推广到这个因素的所有水平上,是对水平总体的推断。
处理间 (组间)变异总变异误差或处理内 (组内)变异SST = SSA + SSedfT = dfA + dfe处理内变异:随机误差处理间变异:处理因素+随机误差幻灯片18One-Factor ANOVAPartitions of Total VariationTotal Variation SSTVariation Due to Treatment SSBVariation Due to Random Sampling SSW=+●Commonly referred to as:●Sum of Squares Within, or●Sum of Squares Error, or●Within Groups Variation●Commonly referred to as:●Sum of Squares Among, or●Sum of Squares Between, or●Sum of Squares Model, or●Among Groups Variation幻灯片19均方差,均方(mean square,MS)幻灯片20三、检验统计量F,做F单侧上尾检验当F<Fα时,接受零假设H0:α1=α2=……=αa=0,各处理平均数之间差异不显著,认为MSA与MSe差异不大,产生的变异是由随机误差造成的;当F>Fα时,拒绝零假设,处理平均数间差异显著,MSA显著高于MSe,产生的变异是由处理因素造成的。
幻灯片21F 值与F分布,四、方差分析表单因素固定效应模型方差分析表F均方自由度平方和变差来源处理间MSA/ MSeMSAa-1SSAa(n-1)MSe误差或处理内SSena-1SST总和幻灯片23五、方差分析的指导思想与基本原理方差分析的指导思想:是将所有测量值间的总变异按照其变异的来源分解为多个部分,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。
幻灯片24方差分析的基本原理:将总平方和分解为处理平方和和误差平方和,根据相应的自由度,得到相应的均方;处理均方反映处理因素所造成的方差的大小,误差均方反映随机因素(误差)所造成的方差的大小;处理均方除以误差均方反映处理效应的显著性。
幻灯片25六、单因素方差分析与成组数据t检验的异同单因素方差分析成组数据 t 检验相同平均数差异显著性检验平均数差异显著性检验两个平均数差异的检验多个平均数差异的分析不同利用平均数的差利用平均数的方差计算统计量t计算统计量F七、实例【例8.1】调查了5个不同小麦品系的株高,结果如下。
试判断这5个品系的株高是否存在显著性差异。
株号品系ⅠⅡⅢⅣⅤ12345和平均数64.665.364.866.065.8326.565.364.565.364.663.763.9322.064.467.866.367.166.868.5336.567.371.872.170.069.171.0354.070.869.268.269.868.367.5343.068.6解:①列出方差分析计算表:(编码法 -65)序号品系ⅠⅡⅢⅣⅤ1 2 3 4 5 -0.40.3-0.21.00.81.52.251.93-0.50.3-0.4-1.3-1.1-3.09.003.42.81.32.11.83.511.5132.2529.436.87.15.04.16.029.0841.00174.464.23.24.83.32.518.0324.0068.06总和57.01308.50277.28幻灯片28③列出方差分析表:不同小麦品系株高方差分析表F均方自由度平方和变差来源42.2332.940.78 4 20 131.74 15.58 品系间 误 差﹡﹡24 147.32 总 和﹡α=0.05 ﹡﹡α=0.01F4,20,0.05=2.866 F4,20,0.01=4.431 F>F0.01 ④ 结论:选定的5个不同小麦品系的株高差异极显著。
幻灯片29 下结论注意:当组数为2时,完全随机设计的方差分析结果与两样本均数比较的t 检验结果等价,对同一资料,有: 幻灯片30第三节 随机效应模型一、随机效应模型的方差分析1、方差分析的程序与固定效应模型方差分析的程序一样。
2、随机效应模型方差分析所得结论适用于水平的总体,固定效应模型方差分析所得结论只适用于所选定的a 个水平。
幻灯片31 二、实例【例8.2】随机选取4窝动物,每窝中均有4只幼仔,称量每只幼仔的出生重,结果如下。
判断不同窝的动物出生重是否存在显著性差异。
4窝动物的出生重 单位:g32.9 31.4 25.7 28.0 118.0 29.50027.1 23.3 27.8 26.7 104.9 26.22533.2 26.0 28.6 32.3 120.1 30.02534.7 33.3 26.2 31.6 125.8 31.4501 2 3 4 和 平均数Ⅳ Ⅲ Ⅱ Ⅰ窝 别 动物号幻灯片32 解:① 列出方差分析计算表 (-30) :② 计算各项平方和: 幻灯片33③ 列出方差分析表: 动物出生重方差分析表F3,12,0.05=3.49 F<F0.05 ④ 结论:不同窝别动物的出生重没有显著差异。