统计-完全随机设计资料的方差分析(多个样本均数间的两两比较)
- 格式:doc
- 大小:311.50 KB
- 文档页数:12
实习三方差分析(analysis of variance--- ANOV A )一、目的要求1、掌握方差分析的应用条件2、掌握方差分析的基本思想3、掌握方差分析的用途4、掌握常用方差分析的方法(完全随机设计、随机区组设计方差分析)5、掌握多个样本均数间的两两比较方法(a. 两两比较:SNK法(q检验);b.对照组与各处理组比较:LSD法)。
二、完全随机设计的方差分析(One-Way ANOVA)One-Way ANOVA过程用于进行两组及多组样本均数的比较,即完全随机设计(成组设计)的方差分析,如果做了相应选择,还可进行随后的两两比较。
P432第8题:某职业病防治院对某石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,结果如下表所示。
问三组石棉矿工的用力肺活量有无差别?三组石棉矿工的用力肺活量(L)石棉肺患者可疑患者非患者1.82.3 2.91.42.13.21.52.1 2.72.1 2.1 2.81.92.6 2.71.72.5 31.82.33.41.92.4 31.82.43.41.8 3.32.03.5建库:1、点击Variable View: 定义分类变量(组别)和应变量(用力肺活量)2、点击Data View,输入数据:3、分析过程界面说明:【Dependent List框】(选入应变量)选入需要分析的变量,可选入多个结果变量(应变量)。
【Factor框】(因素,即选入一个分类变量)选入需要比较的分组因素,只能选入一个。
【Contrasts钮】(线性组合比较,如检验均数之间差异大小的关系,均数间的线性趋势等)【Post Hoc钮】(各组均数的多重比较)弹出Post Hoc Multiple Comparisons(多重比较)对话框,用于选择进行各组间两两比较的方法,有:Equal Variances Assumed复选框组一组当各组方差齐时可用的两两比较方法,共有14中种这里不一一列出了,其中最常用的为LSD和S-N-K法。
方差分析中均值比较的方法最近看文献时,多数实验结果用到方差分析,但选的方法不同,主要有LSD,SNK-q,TukeyHSD法等,从百度广库里找了一篇文章,大概介绍这几种方法,具体公式不列了,软件都可以计算。
这几种方法主要用于方差分析后,对均数间进行两两比较。
均数间的两两比较根据研究设计的不同分为两种类型:一种常见于探索性研究,在研究设计阶段并不明确哪些组别之间的对比是更为关注的,也不明确哪些组别问的关系已有定论、无需再探究,经方差分析结果提示“ 概括而言各组均数不相同”后,对每一对样本均数都进行比较,从中寻找有统计学意义的差异:另一种是在设计阶段根据研究目的或专业知识所决定的某些均数问的比较.常见于证实性研究中多个处理组与对照组、施加处理后的不同时间点与处理前比较。
最初的设计方案不同.对应选择的检验方法也不同.下面分述两种不同设计均数两两比较的方法选择。
1.事先计划好的某对或某几对均数间的比较:适用于证实性研究。
在设计时就设定了要比较的组别,其他组别间不必作比较。
常用的方法有: Dunnett-t 检验、LSD-t 检验(Fisher ’s least significant difference t test) 。
这两种方法不管方差分析的结果如何——即便对于 P稍大于检验水平α进行所关心组别间的比较。
1.1 LSD-t检验即最小显著法,是Fisher于1935年提出的,多用于检验某一对或某几对在专业上有特殊探索价值的均数间的两两比较,并且在多组均数的方差分析没有推翻无效假设H0时也可以应用。
该方法实质上就是 t检验,检验水准无需作任何修正,只是在标准误的计算上充分利用了样本信息,为所有的均数统一估计出一个更为稳健的标准误,因此它一般用于事先就已经明确所要实施对比的具体组别的多重比较。
由于该方法本质思想与 t 检验相同,所以只适用于两个相互独立的样本均数的比较。
LSD法单次比较的检验水准仍为α,因此可以认为该方法是最为灵敏的两两比较方法.另一方面,由于LSD法侧重于减少第Ⅱ类错误,势必导致此法在突出组间差异的同时,有增大I类错误的倾向。
一、均数间的多重比较(Multipie Comparison)方法的选择:1、如两个均数的比较是独立的,或者虽有多个样本的均数,但事先已计划好要做某几对均数的比较,则不管方差分析的结果如何,均应进行比较,一般采用LSD法或Bonferroni 法;2、如果事先未计划进行多重比较,在方差分析得到有统计意义的F检验值后,可以利用多重比较进行探索性分析,此时比较方法的选择要根据研究目的和样本的性质。
比如,需要进行多个实验组和一个对照组比较时,可采用Dunnett法;如需要进行任意两组之间的比较而各组样本的容量又相同时,可采用Tukey法;若各组样本的容量不相同时,可采用Scheffe法;若事先未计划进行多重比较,且方差分析结果未有显著差别,则不应进行多重比较;3、有时候研究者事先有对特定几组均值比较的考虑,这时可以不用Post hoc进行几乎所有均值组合的两两比较,而是通过Contrasts中相应的设置来实现;4、最后需要注意的是,如果组数较少,如3组、4组,各种比较方法得到的结果差别不会很大;如果比较的组数很多,则要慎重选择两两均值比较的方法。
5、LSD法:即最小显著差法;是最简单的比较方法之一,它其实只是t检验的一种简单变形,未对检验水准做任何校正,只是在标准误计算上充分利用了样本信息。
它一般用于计划好的多重比较;6、Sidak法:它是在LSD法上加入了Sidak校正,通过校正降低每次两两比较的一类错误率,达到整个比较最终甲类错误率为α的目的;7、Bonferroni法:它是Bonferroni校正在LSD法上的应用。
8、Scheffe法:它实质上是对多组均数间的线性组合是否为0做假设检验(即所谓的Contrasts),多用于各组样本容量不等时的比较;9、Dunnett法:常用于多个实验组与一个对照组间的比较,因此使用此法时,应当指定对照组;10、S-N-K法:它是根据预先制定的准则将各组均数分为多个子集,然后利用Studentized Range分布进行假设检验,并根据均数的个数调整总的犯一类错误的概率不超过α;11、Tukey法:这种方法要求各组样本容量相同,它也是利用Studentized Range分布进行各组均数间的比较,与S-N-K法不同,它是控制所有比较中最大的一类错误(即甲类错误)的概率不超过α;12、Duncan法:思路与S-N-K法相似,只不过检验统计量服从的是Duncan′s MultipleRange分布;13、还需注意的是,SPSS同时给出了方差不齐性时的4种检验方法,但从接受程度和稳定性看,方差不齐性时尽量不做多重比较。
多个样本均数比较的方差分析练习题一、最佳选择题1. 完全随机设计资料的方差分析中,必然有( )A.SSm 间>SSm内B.MS 组间<MS组内C.MS=MS 组间+MS组内D.SS=SSm 间+SS 内E.V 组间>V组内2. 随机区组设计资料的方差分析中,对其各变异关系表达正确的是( )A.SSg =SS组间+SS组内B.MSg=MS 组间+MS组内C.SSg=SS 处理+SS区组+SS识差D.MS=MS 灶理+MSK组+MS退差E.SS=SS 处理+SS区组+MS误差3. 当组数等于2时,对于同一资料,方差分析结果与t 检验结果 ( )A. 完全等价且F=√iB. 方差分析结果更准确C.t 检验结果更准确D. 完全等价且t=√FE. 理论上不一致4.方差分析结果,F处理>Foos,(cy2》,则统计推论是( )A. 各总体均数不全相等B. 各总体均数都不相等C. 各样本均数都不相等D. 各样本均数间差别都有统计学意义E. 各总体方差不全相等5. 完全随机设计方差分析中的组间均方是( )的统计量A. 表示抽样误差大小B. 表示某处理因素的效应作用大小C. 表示某处理因素的效应和随机误差两者综合影响的结果D. 表示N 个数据的离散程度E. 表示随机因素的效应大小6. 配对设计资料,若满足正态性和方差齐性。
要对两样本均数的差别作比较,可选择( )A. 随机区组设计的方差分析B.u 检验C. 成组t 检验D.x²检验E. 秩和检验第四章多个样本均数比较的方差分析7.k 个组方差齐性检验有统计学意义,可认为()A.o}、σ2、…o²不全相等B.μ₁、μ₂、…μ₄不全相等C.S₁、S₂、…S₄不全相等D.X, 、X₂、…x 不全相等E.o} 、o2 、…σ²全不相等二、简答题1. 方差分析的基本思想和应用条件是什么?2. 完全随机设计方差分析变异分解中“MS=MS 画+MSm内”成立吗?为什么?3. 随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不同?4. 如何确定应用于实验的拉丁方?5. 为什么在方差分析的结果为拒绝H₀、接受H, 之后,对多个样本均数的两两比较要用多重比较的方法?三、计算分析题1. 研究动物被随机分成3个组来比较对3种不同刺激的反应时间(秒),问动物在3种不同刺激下的反应时间是否有差别?刺激I 16 14 14 13 13 12 12 17 17 17 19 14 15 20刺激Ⅱ 6 7 7 8 4 8 9 6 8 6 4 9 55刺激Ⅲ8 10 9 10 6 7 10 9 11 11 9 10 9 52. 为研究某药物的抑癌作用,使一批小白鼠致癌后,按完全随机设计的方法随机分为4 组,A、B、C 三个实验组和一个对照组,分别接受不同的处理,A、B、C3 个实验组,分别注射0.5ml、1.0ml和1.5ml30% 的注射液,对照组不用药。
单因素多个均数比较的方差分析(完全随机设计资料的方差分析)方差分析的基本思想是:将全部观察值的总变异按影响实验结果的诸因素分解为若干部分变异,构造出反映各部分变异作用的统计量,之后构造假设检验统计量F,实现对总体均数的判断。
方差分析的应用条件:各样本相互独立,且均来自总体方差具有齐性的正态分布。
完全随机设计是一种将研究对象随机地分配到处理因素各水平组的单因素设计方法。
其研究目的是推断处理因素不同水平下的试验结果的差异有否统计学意义,即该处理因素是否对试验结果有本质影响。
下面以一个实例来说明完全随机设计方差分析的基本思想和假设检验步骤。
例:为研究烫伤后不同时期切痂对肝脏ATP(u/L)含量的影响,将30只大鼠随机分3组,每组10只,分别接受不同的处理,试根据下表资料说明大鼠烫伤后不同时期切痂对其肝脏的ATP(u/L)含量是否有影响?大鼠烫伤后不同时期切痂肝脏ATP含量(u/L)烫伤对照组24h切痂组96h切痂组合计7.76 11.14 10.857.71 11.60 8.588.43 11.42 7.198.47 13.85 9.3610.30 13.53 9.596.67 14.16 8.8111.73 6.94 8.225.78 13.01 9.956.61 14.18 11.266.97 17.728.68合计(∑X)80.43 127.55 92.49 300.47(∑∑X ij)例数(n)10 10 10 30(N)均数(X)8.04 12.76 9.25 10.02平方和(∑X2)676.32 1696.96 868.93 3242.21(∑∑X ij2)1.建立检验假设,确定检验水准:H0:u1=u2=u3,3个总体均数全相等,即3组大鼠肝脏的ATP含量值无差别;H1:u1,u2,u3,3个总体均数不相等.即3组大鼠肝脏的ATP含量值有差别;a=0.052.计算检验统计量并列出方差分析表:①.计算离均数差平方和SS:首先计算每一组的合计、均数、平方和,再计算综合计数(∑X ij2),由表得:∑∑X ij=300.47 ∑X ij2=3242.21 N=30总的离均数差平方和SS总=∑X ij2 - (∑X ij)2n= 3242.21-300.47230=232.8026SS组间=∑ (∑X ij)2n i-(∑X ij)2n=80.43210+127.55210+92.49210-300.47230=119.8314SS组内=SS总-SS组间= 232.8026-119.8314=112.9712 ②.计算均方MS:MS组间= SS组间k-1(k为组数) =119.83143-1= 59.916MS组内= SS组内N-k(N为总例数) =112.971230-3= 4.184③.求F值F = MS组间MS组内=59.9164.184= 14.32将上述计算结果列成方差分析表,如下:变异来源平方和SS 自由度v 均方MS F值总变异232.8026 29组间变异119.8314 2 59.916 14.32 组内变异(误差) 112.9712 27 4.184(注:自由度:v总= N-1 = 30-1= 29;v组间= k-1 = 3-1 = 2; v组内=N -k = 30-3= 27)利用SPSS作方差分析时,会得到类似于以下的方差分析表:DescriptivesTest of Homogeneity of VariancesANOVA3.查表确定P值,并作出统计推断:V组间= 2,v组内=27, 得界限值Fα(2,27)为F0.05(2,27)= 3.35, 则F= 14.32> F0.05(2,27),则P<0.05,按0.05水准,拒绝H0,可以认为3个总体均数不全相同,即3组大鼠肝脏的ATP含量值有差别。
多个样本均数间的两两比较均数间的两两比较根据研究设计的不同分为两种类型:一种常见于探索性研究,在研究设计阶段并不明确哪些组别之间的对比是更为关注的,也不明确哪些组别问的关系已有定论、无需再探究,经方差分析结果提示“概括而言各组均数不相同”后,对每一对样本均数都进行比较,从中寻找有统计学意义的差异:另一种是在设计阶段根据研究目的或专业知识所决定的某些均数问的比较.常见于证实性研究中多个处理组与对照组、施加处理后的不同时间点与处理前比较。
最初的设计方案不同.对应选择的检验方法也不同.下面分述两种不同设计均数两两比较的方法选择。
1、事先计划好的某对或某几对均数间的比较:适用于证实性研究。
在设计时就设定了要比较的组别,其他组别间不必作比较。
常用的方法有:Dunnett-t 检验、LSD-t 检验(Fisher ’s least significant difference t test) 。
这两种方法不管方差分析的结果如何——即便对于P稍大于检验水准,也可进行所关心组别间的比较。
即最小显著差法.是1935年提出的,多用于检验某一对或某几对在专业上有特殊探索价值的均数间的两两比较,并且在多组均数的方差分析没有推翻无效假设时也可以应用。
式中和为两个对比组第i 组与第j 组的样本均数和样本含量。
统计量将两独立样本t 检验的均方部分( 计算统计量时的分母) 进行适当的调整,和自由度通过方差分析中的误差均方和来估计,而两独立样本的t检验中用合并方差,自由度来计算,然后根据t界值来确定P值,作出统计推断。
该方法实质上就是t检验,检验水准无需作任何修正,只是在标准误的计算上充分利用了样本信息,为所有的均数统一估计出一个更为稳健的标准误,因此它一般用于事先就已经明确所要实施对比的具体组别的多重比较。
由于该方法本质思想与t 检验相同,所以只适用于两个相互独立的样本均数的比较。
LSD 法单次比较的检验水准仍为,因此可以认为该方法是最为灵敏的两两比较方法.另一方面,由于LSD法侧重于减少第Ⅱ类错误,势必导致此法在突出组间差异的同时,有增大I类错误的倾向。
Duncan 1955年在Newman及Keuls的复极差法(muhiple range method)基础上提出,该方法与Tukey法相类似。
适用于个试验组与一个对照组均数差别的多重比较,多用于证实性研究。
Dunnett-t统计量的计算公式与LSD-t 检验完全相同。
实验组和对照组的样本均数和样本含量。
需特别指出的是Dunnett—t检验有专门的界值表,不同于t检验的界值表。
一般认为,比较组数k≥3时,任何两个样本的平均数比较会牵连到其它平均数的对比关系,而使比较数再也不是两个相互独立的样本均数的比较.这是LSD-t无法克服的缺点。
Dunnett—t针对这一问题提出.在同一显著水平上两个均数的最小显著差数随着这二个平均数在多个平均数中所占的极差大小而不同,根据不同平均数间的对比关系来调整相应的显著差别(critical range)的大小。
2、多个均数的两两事后比较:适用于探索性研究,即各处理组两两问的对比关系都要回答,一般要将各组均数进行两两组合,分进行检验。
常用的方法有:SNK-q(Student-Newman-Keuls q)法、Duncan法、Tukey法和Scheffe法。
值得注意的是,这几种方法对数据有具体的要求和限制。
对于SNK-q检验,检验的统计量是q,所以又称为q检验。
该检验统计量的计算公式为:个对比组第i组与第j组的样本均数和样本含量。
SNK-q检验的原理是根据所包含不同数目的平均数的极差调整各自的显著性水准,限制了实验的误差.保证在做所有比较时,不易犯第1类错误。
Tukey法(Tukey’S Honestly Significant Diference Tukey’s HSD)的原理与SNK-q检验基本相同,但是,该方法要求各比较组样本含量相同,它将所有对比组中I类错误最大者控制在之内。
其检验统计量的计算公式如下:是学生化极差统计量(可以通过查表获得),是误差均方,n是每组的样本含量。
给出检验结果时,是基于比较组均数的差值与计算所得计量的对比。
研究显示:这种方法有较高的检验效能(与LSD法比较),具有很好的稳定性,适用于大多数场合下的两两比较,计算简便。
但是,Tukey法是基于比较组全部参与比较这一假设下进行的,因此在只比较指定的某几组总体均数时并不适用,建议选择Dunnett法或者是Bonferroni方法,因为这两种方法会给出较高效能的检验结果。
与一般的多重比较不同,Scheffe法的实质是对多组均数间的线性组合是否为0进行假设检验,多用于对比组样本含量不等的资料。
在单因素的多重比较问题中,除了要逐对比较因素水平的平均效应之外,有时还有可能要比较因素水平平均效应的线性组合。
例如将有基本相同的因素水平平均效应的几个组,构成一个综合组。
因此可能检验这样的假设:,显然,前面讨论的参数的两两比较属于一类特殊的对比。
Scheffe法可以同时检验所有可能的对比,即同时检验任何一组对比。
Sch6ffe法的优点是可以检验任意的线性对比。
在这方面,Tukey法不如Scheffe法。
但是在单纯作逐对因素效应均值的比较时,Schefe法的效率不如Tukey法高。
也就是说,Schefe法更易于将显著的差异判定为不显著(Tukey法认为)。
在实际场合,当单纯作逐对均值比较时,建议用Tukey法;而当要做多个一般的线性对比检验时。
就要用Scheffe 法。
Scheffe法检验实质上对F值进行了简单的校正,将比较的组数纳入考虑的范畴: 该方法的检验统计量代表了最大可能的累积I类错误的概率。
遗憾的是,由于控制I类错误时的“矫枉过正”.会最终导致较大的Ⅱ类错误的概率。
3、探索性研究和证实性研究均适用的检验方法:Bonferroni t检验的基本思想是:如果三个样本均数经ANOVA检验差异有统计学意义(=0.05),需对每两个均数进行比较,共需比较的次数为:,由于每进行一次比较犯I类错误的概率是=0.05,那么比较3次至少有一次犯I类错误的概率就是:。
因此,要使多次比较犯I类错误的概率不大于原检验水准,现有的检验水准应该进行调整,用作为检验水准的调整值,两两比较得出的P值与其进行比较。
该方法的思想适用于所有的两两比较,并且该方法的适用范围很广,不仅仅限于方差分析,例如相关系数的检验和卡方检验也适用。
Bonferroni t检验的方法和思想容易理解,操作简便,但是严格地控制了I类错误的同时增大了Ⅱ类错误的发生概率,在结论的给出方面是一种比较保守的方法。
该方法通过校正降低每次两两比较的I类错误概率,以达到最终整个比较的I类错误发生率不超过的目的。
Bonferroni t检验与检验相似,Bon.ferroni t检验是检验的近似计算,但是由于Bonferroni t检验在计算上容易实现,所以应用较广。