析因设计方差分析
- 格式:ppt
- 大小:2.32 MB
- 文档页数:36
方差分析当影响观察结果的影响因素(原因变量或分组变量)的水平数大于2或原因变量的个数大于1个,一元时常用F检验(也称一元方差分析),多元时用多元方差分析(最常用Wilks’∧检验)。
方差分析概述方差分析(analysis of variance)又称变异数分析,可简记为ANOVA,主要用于检验计量资料中的两个或两个以上均值间差别显著性的方法。
当欲比较几组均值时,理论上抽得的几个样本,都假定来自正态总体,且有一个相同的方差,仅仅均值可以不相同。
还需假定每一个观察值都由若干部分累加而成,也即总的效果可分成若干部分,而每一部分都有一个特定的含义,称之谓效应的可加性。
所谓的方差是离均差平方和除以自由度,在方差分析中常简称为均方MS(mean square)。
方差分析的基本思想根据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都与某一种效应相对应,总自由度也被分成相应的各个部分,各部分的离均差平方除以相应部分的自由度得出各部分的均方,然后列出方差分析表算出值,作出统计推断。
方差分析的关键是总离均差平方和的分解,分解越细致,各部分的含义就越明确,对各种效应的作用就越了解,统计推断就越准确。
方差分析表的一般形式见表25.1所示:表25.1 方差分析表形式变异来源source 离差平方和SS 自由度df 均方MS F统计量F P概率值P 效应S1 SS1 df1 MS1 SS1/df1 F1 df1, dfe MS1/ MSe P1效应S2 SS2 df2 MS2 SS2/df2 F2 df2, dfe MS2/ MSe P2 …………………………效应Sm SSm dfm MSm SSm/dfm Fm dfm, dfe MSm/ MSe Pm 误差Se SSe dfe MSe SSe/dfe 总变异ST SST SS1+ SS2+…+ SSm+ SSe dfT df1+ df2+…+ dfm + dfe MST SST/dfT FT dfT, dfe MST/ MSe PT表中变异来源一栏,可分为总变异(total),误差(residual),各个效应(effect)相对应的项。
SAS析因设计⽅差分析contrast语句的使⽤SAS进⾏两两⽐较的语句有两种,⼀种是⽤means语句对主效应进⾏检验,当交互作⽤A*B有显著性,需要固定某因素的某⽔平对另⼀因素的各⽔平进⾏两两⽐较,这时最常⽤的是使⽤contrast语句,它可以完成means语句对主效应的检验,也可以对所有的单独效应或感兴趣的单独效应进⾏检验。
例如:某析因设计,a因素有3个⽔平,b因素有4个⽔平,主要研究兴趣为a因素各⽔平间的差异。
data dat;do a=1 to 3;do b=1 to 4;do r=1 to 3;input x@@;output;end;end;end;cards;15.13 15.32 15.2317.91 18.05 17.9821.24 21.54 21.2324.54 24.88 24.6415.24 15.38 15.4718.32 18.15 18.2921.35 21.58 21.4024.38 24.79 24.9726.48 26.25 26.3430.12 29.89 30.0835.21 34.68 34.9936.94 35.59 36.46;run;proc anova data=dat;class a b;model x= a b a*b;means a*b;run;模型有统计学差异,且交互作⽤a*b有统计学差异,此时不应再看主效应,⽽要分析单独效应proc glm data=dat;class b a;model x=b a b*a/ss3;contrast '(a1 vs a2)/b1' a 1 -1 0 b*a 1 -1 0 0 0 0 0 0 0 0 0 0;contrast '(a1 vs a2)/b2' a 1 -1 0 b*a 0 0 0 1 -1 0 0 0 0 0 0 0;contrast '(a1 vs a2)/b3' a 1 -1 0 b*a 0 0 0 0 0 0 1 -1 0 0 0 0;contrast '(a1 vs a2)/b4' a 1 -1 0 b*a 0 0 0 0 0 0 0 0 0 1 -1 0;contrast '(a1 vs a3)/b1' a 1 0 -1 b*a 1 0 -1 0 0 0 0 0 0 0 0 0;contrast '(a1 vs a3)/b2' a 1 0 -1 b*a 0 0 0 1 0 -1 0 0 0 0 0 0;contrast '(a1 vs a3)/b3' a 1 0 -1 b*a 0 0 0 0 0 0 1 0 -1 0 0 0;contrast '(a1 vs a3)/b4' a 1 0 -1 b*a 0 0 0 0 0 0 0 0 0 1 0 -1;run;上述程序是控制b因素各⽔平对a因素各⽔平之间进⾏⽐较,contrast语句中引号('')内的语句为⽤户设定的语句,以区分控制因素和⽐较因素的不同⽔平,a有3个⽔平,所以后⾯有3个数值,要⽐较的⽔平按照顺序分别为1和-1其余为0,注意合计也要为0。
2×2析因设计资料的方差分析用A药和B药治疗高胆固醇患者,并考虑是否患糖尿病对结果的影响,故把高胆固醇患者分成糖尿病且高胆固醇组和单纯高胆固醇组,每一种病情组又随机分为两组:一组用A药,一组用B药,经过一个疗程后,观察患者的总胆固醇下降的幅度,具体数据列表如下,对该资料做统计分析。
不同病情不同疗法治疗高胆固醇患者的总胆固醇下降值(mmol/L)本例中,以总胆固醇下降幅度为疗效指标,以高血脂患者为研究对象,主要的研究问题是评价A药和B药降低总胆固醇的幅度,由于该研究考虑了研究对象是否患有糖尿病的因素,所以要回答两个药的疗效差别如何。
根据最终结果,研究者有时可以直接称A药疗效优于B药,或者B药疗效优于A药,或者两个药疗效相同;但研究者往往不能这样简单地评价两个药的疗效,因为最终结果往往有多种可能的答案,可以归纳为下列三大类的情况。
1)A药和B药的疗效相同或不同,但两个药的疗效差异与是否患糖尿病无关。
2)无糖尿病的患者而言,两个药的疗效相同,对于糖尿病患者而言,两种药物的疗效不同。
3)对于糖尿病患者而言,两种药物的疗效相同,无糖尿病的患者而言,两个药的疗效不同。
如果资料符合方差分析的条件,可以用两因素方差分析进行统计分析,方差分析中的交互作用概念正是反映了上述第2种和第3种答案,即:交互作用是指某个因素对效应指标的作用与另一个因素处于何种水平状态有关(本例中治疗方案因素对疗效的作用与患者是否患糖尿病有关)。
因此如果本例中治疗方案因素对疗效的作用与患者是否患糖尿病无关,则称治疗方案与是否患糖尿病对效应指标(降低总胆固醇)没有交互作用。
先考虑无交互作用的方差分析模型如下:糖尿病的高血脂患者用B药治疗一个疗程后,总胆固醇平均下降µ(mmol/L),糖尿病的高血脂患者用A药治疗一个疗程后,总胆固醇平均下降µ+β1(mmol/L),即糖尿病的高血脂患者用A药和用B药治疗一个疗程,两种药的疗效:总胆固醇下降幅度的平均差异为β1(mmol/L);无糖尿病的高血脂患者用B药治疗一个疗程后,总胆固醇平均下降µ+β2(mmol/L),即同样用B药,有糖尿病的高血脂患者和无糖尿病的高血脂患者的总胆固醇下降幅度平均相差β2(mmol/L);无糖尿病的高血脂患者用A药治疗一个疗程后,总胆固醇平均下降µ+β1+β2(mmol/L),即同样用A药,有糖尿病的高血脂患者和无糖尿病的高血脂患者的总胆固醇下降幅度平均相差β2(mmol/L)。