生物统计学-单因素方差分析
- 格式:ppt
- 大小:3.02 MB
- 文档页数:43
单因素方差分析(one-wayANOVA)单因素⽅差分析(one-wayANOVA)单因素⽅差分析(⽅)单因素⽅差分析概念是⽅来研究⽅个控制变量的不同⽅平是否对观测变量产⽅了显著影响。
这⽅,由于仅研究单个因素对观测变量的影响,因此称为单因素⽅差分析。
例如,分析不同施肥量是否给农作物产量带来显著影响,考察地区差异是否影响妇⽅的⽅育率,研究学历对⽅资收⽅的影响等。
这些问题都可以通过单因素⽅差分析得到答案。
(⽅)单因素⽅差分析步骤第⽅步是明确观测变量和控制变量。
例如,上述问题中的观测变量分别是农作物产量、妇⽅⽅育率、⽅资收⽅;控制变量分别为施肥量、地区、学历。
第⽅步是剖析观测变量的⽅差。
⽅差分析认为:观测变量值的变动会受控制变量和随机变量两⽅⽅的影响。
据此,单因素⽅差分析将观测变量总的离差平⽅和分解为组间离差平⽅和和组内离差平⽅和两部分,⽅数学形式表述为:SST=SSA+SSE。
第三步是通过⽅较观测变量总离差平⽅和各部分所占的⽅例,推断控制变量是否给观测变量带来了显著影响。
(三)单因素⽅差分析原理总结在观测变量总离差平⽅和中,如果组间离差平⽅和所占⽅例较⽅,则说明观测变量的变动主要是由控制变量引起的,可以主要由控制变量来解释,控制变量给观测变量带来了显著影响;反之,如果组间离差平⽅和所占⽅例⽅,则说明观测变量的变动不是主要由控制变量引起的,不可以主要由控制变量来解释,控制变量的不同⽅平没有给观测变量带来显著影响,观测变量值的变动是由随机变量因素引起的。
(四)单因素⽅差分析基本步骤1、提出原假设:H0——⽅差异;H1——有显著差异2、选择检验统计量:⽅差分析采⽅的检验统计量是F统计量,即F值检验。
3、计算检验统计量的观测值和概率P值:该步骤的⽅的就是计算检验统计量的观测值和相应的概率P值。
4、给定显著性⽅平,并作出决策(五)单因素⽅差分析的进⽅步分析在完成上述单因素⽅差分析的基本分析后,可得到关于控制变量是否对观测变量造成显著影响的结论,接下来还应做其他⽅个重要分析,主要包括⽅差齐性检验、多重⽅较检验。
研究生《生物统计学》课程第五讲方差分析主要内容:一、单因素方差分析二、两因素方差分析三、多因素方差分析一、单因素方差分析[Analyze]=>[Compare Means]=>[ One-Way ANOV A](1)建立数据文件,在Variable Vew中定义变量“饲料”、“增重”,“饲料”小数位数为0,用1、2、3、4分别代表甲、乙、丙、丁4种饲料。
输入数据。
(2)方差分析:[Analyze]=>[Compare Means]=>[ One-Way ANOVA],打开[One-Way ANOVA]主对话框。
选定“增重”使之进入[Dependent List](样本观测值)框,选定“饲料”使之进入[Factor](因素)框(3)单击[Options]进入“选项”对话框,选择[Descriptive]要求输出描述统计量,[Homogeneity of Variance tese](方差齐性检验),[Continue]返回;(4)单击[Post Hoc]打开[One-Way ANOV A: Post Hoc Multiple Comparisions](单因素方差分析:验后多重比较)对话框,可选择确定多重比较方法,如LSD法、Duncan 法,[Continue]返回;(5)单击[OK],运行单因素方差分析。
结果显示:方差分析表:(P=0.005<0.01 不同饲料对鱼增重的作用差异极显著)多重比较:LSD法(解释:甲与其他三种饲料都具有显著差异,乙、丙、丁间差异不显著)Duncan法(解释:用Duncan法划分的相似性子集,在显著性水平为0.05的情况下,第一组包括丙乙丁,组内相似的概率为0.123;第二组包括甲,说明甲的均值与其他三个具有显著性差异)2、练习:某灯泡厂用四种配料方案制成的灯丝生产了四批灯泡,在每批灯泡中作随机抽样,测量其使用寿命(单位:小时),数据如下:问不同灯丝制成的灯泡的使用寿命是否有显著差异,存在差异则做多重比较。
生物统计(4)-单因素方差分析方差分析的基本思想在进行科学研究时,有时要按实验设计将所研究的对象分为多个处理组进行不同的处理,其中处理因素(treatment)至少有两个水平(level)。
这类科研资料的统计分析,是通过所获得的样本信息来推断各处理组均数间的差别是否有统计学意义,即处理是否有影响。
常用采用的分析方法就是方差分析(ANOVA,analysis of variance),这是由英国统计学家R.A.Fisher首创,以F命名,故方差分析又称为F 检验。
设处理因素有g(g>= 2)个不同水平,实验对象随机分为g组,分别接受不同水平的干预,第i(i=1,2,...,g)组的样本含量为n_{i},第i处理组的第j(j=1,2,…ni个观测值用Xij来表示,其计算结果可能可以整理成以下面的形式,如下所示:方差分析的目的就是在成立的条件下,通过分析各处理组均数之间的差别大小,推断g 个总体均数之间有无差别,从面说明处理因素的效应是否存在。
记总均数为各处理组均数为总例数为其中,g为处理组数。
实验数据有三个不同的变异:1. 总变异。
全部观测值大小不同,这种变异称为总变异。
总变异的大小可能用离均差平方和(sum of squares of deviations from eman,SS)来表示,即各观测值与总均数X差值的平方和,记为。
公式略。
2. 组间变异。
各处理组由于接受处理的水平不同,各组的样本均数也大小不等,这种变异称为组间变异,其大小用各组均数与总均数的离均差平方和表示,记为SS组间,计算公式略。
各组均数之间相关越悬殊,它们与总均数的差值越在在,就越大,反之就越小。
反应了各组均数的变异,存在这种变异的原因有:①随机误差;②处理的不同水平可能对实验结果的影响。
3. 组内变异。
在同一处理组中,虽然每个实验对象接受的处理相同,但观测值仍各不相同,这种变异称为组内变异(误差)。
组内变异用组内各观测值与其所在组的均数的差值的平方和表示,记为,表示随机误差的影响。
第三节单因素⽅差分析试验中要考察的指标称为试验指标,影响试验指标的条件称为因素(分类变量),因素所处的状态称为⽔平,若试验中只有⼀个因素改变则称为单因素试验,若有两个因素改变则称为双因素试验,若有多个因素改变则称为多因素试验。
⽅差分析就是对试验数据进⾏分析,检验⽅差相等的多个正态总体均值是否相等,进⽽判断各因素对试验指标的影响是否显著,根据影响试验指标条件的个数可以区分为单因素⽅差分析、双因素⽅差分析和多因素⽅差分析。
如果有4组的均数需要⽐较,如果使⽤t检验进⾏两两⽐较,那需要进⾏6次。
⽽每次t检验不犯第⼀类错误的概率为0.95,6次都不犯的概率即是0.95的6次⽅,所以如果使⽤t检验进⾏两两⽐较,6次t检验⾄少有⼀次犯第⼀类错误的概率为0.2469,将被放⼤。
如果仍然要使⽤两两的t 检验,就需要控制总的犯第⼀类错误的概率各组内部变异(组内变异):反映个体差异(随机变异)的⼤⼩各组均数差异(组间变异):反映了个体差异(随机效⽤)的影响与可能存在的处理因素的影响之和总变异=组内变异+组间变异F检验统计量: F=(SSA/(k-1))/(SSE/(n-k))=MSA/MSE前提条件:独⽴性,正态性,⽅差齐性()如果得出的结论是多组均数间存在差异,则需要进⾏事后的两两⽐较两两⽐较中会遇到的⼀类错误CER:⽐较误差,即每做⼀次⽐较犯⼀类错误的概率EERC:在完全⽆效假设下的试验误差率,即在H0成⽴时做完全⽐较所犯的⼀类错误的概率,⽅差分析检验/卡⽅检验本⾝控制的就是EERCMEER:最⼤试验误差率,即在任何完全或者部分⽆效假设下,做完全部⽐较所犯的⼀类错误的最⼤概率值,适⽤范围更⼴控制⼀类错误 直接校正P值: sidak校正,当⽆效假设实际成⽴,即各组均数⽆差别时,完全两两⽐较犯第⼀类错误的概率为1-0.95^(k(k-1)/2),次即EERC,通过控制总的EERC=0.05反向推导没⼀个检验犯第⼀类错误的概率,统计软件直接往往将每个检验的屁p值放⼤(最⼤放⼤为1),⽽固定每个⽐较的α⽔准仍为0.05⽅便阅读 bonferroni校正:⼤多数实际问题中,都是有些组均数相同,有些不同,因此使⽤MEER更合适,通过控制CER,使得MEER被控制在所设定的⽔准内,计算公式为CER=α/c(需要进⾏⽐较的次数) 直接校正的缺陷:将两两⽐较分别进⾏,不仅使⽤⿇烦,也增加了误差的影响,因为每次两两⽐较只会⽤到这⼀组的数据⽽利⽤不到所有的数据,联合检验可解决此类问题,⽽且对⼀类错误的控制太严格,结果往往是偏保守的 联合检验:LSD-t检验,LSD最⼩显著差异,t检验的⼀个变形,在标准误和⾃由度的计算上利⽤了全部样本信息,使得结果更为准确,t 检验的标准误和⾃由度的计算只利⽤了相应的两组的信息。