最新3.2两因素方差分析汇总
- 格式:ppt
- 大小:1.83 MB
- 文档页数:92
两因素方差分析一、两因素方差分析中的基本概念1. 例1-1(pp1):四种疗法治疗缺铁性贫血后红细胞增加数服用A药,则A=2,否则A=1;服用B药,则B=2,否则B=1两因素Stata数据输入格式命令anova x a b a*b其中a 表示A药疗效的主效应,b表示B药疗效的主效应,a*b表示A药与B药对疗效的交互作用结果如下结果表明:对于 =0.05而言H10:没有交互作用并且A药和B药疗效的主效应都没有差异H11:有交互作用或A药主效应有差异或B药主效应有差异F Model=98.75,P值<0.05,因此认为模型是有效的(或有交互作用或有主效应)。
H20:没有交互作用H21:有交互作用F A×B=36.75,P值=0.0003<0.05,因此A药与B药的疗效有交互作用,并且有统计意义。
H30:A药没有差异H31:A药主效应有差异F A=168.75,P值<0.05,A药的主效应有统计意义H40:B药没有差异H41:B药主效应有差异F B =90.75,P 值<0.05,B 药的主效应也有统计意义。
问题:模型是什么? 模型:..()ab a b ab μμαβαβ=+++其中μab 是x 的总体均数,αa 称为A 因素的主效应,βb 称为B 因素的主效应,(αβ)ab 称为A 因素和B 因素对因变量x(观察指标变量)的交互作用。
2. 主效应的意义A 药B 药平均A 主效应表示未服用服用 未服用 μ11μ1211121.2μμμ+=1...1μμα=+服用 μ21 μ22 21222.2μμμ+= 2...2μμα=+ 平均1121.12μμμ+= 1222.22μμμ+= 11122122..4μμμμμ+++= B 主效应 .1..1μμβ=+ .2..2μμβ=+称α1和α2为A 因素的主效应,β1和β2为B 因素的主效应。
并且可以验证:α1+α2=0(即:α1=-α2)以及β1+β2=0(β1=-β2) 若α1=α2(即α1=α2=0),则对应A 因素的主效应没有作用。
⽅差分析2(双因素⽅差分析、多元⽅差分析、可视化)1 双因素⽅差分析1.1 双因素⽅差分析的实战dat<-ToothGrowthdatattach(dat)table(dat$supp,dat$dose)aggregate(len,by=list(dat$supp,dat$dose),FUN=mean)解释:根据投⽅式(橙汁OJ,维C素VC)supp和剂量dose来对⽛齿的长度len进⾏求均值dose<-factor(dose)解释:为了避免把dose变量认为是数值变量,⽽是把dose认为成分组变量,所以设置成因⼦类型factorfit<-aov(dat$len~dat$supp*dat$dose)解释:aov()做⽅差分析,把 + 换成了 * ,这两项dat$supp和dat$dosee就变成了交互项summary(fit)结果分析:可以看出P值很⼩,三个P值都⼩于0.05,说明不同的投喂⽅式supp对⽛齿的⽣长长度len是有显著影响的;说明不同的剂量dose对⽛齿的⽣长长度len是有显著影响的;说明在两种投喂⽅式下,不同的投喂⽅式supp和剂量dose的交互效应对⽛齿的⽣长长度len是有显著影响的1.2 可视化⽅法1interaction.plot(dat$dose,dat$supp,dat$len,type = "b",col=c("red","blue"),pch=c(16,18),main="XX")1.3 可视化⽅法2library(gplots)plotmeans(dat$len~interaction(dat$supp,dat$dose,sep=" "),connect=list(c(1,3,5),c(2,4,6)),col=c("red","blue"),main="XX",xlab="xlab")1.4 可视化⽅法3library(HH)interaction2wt(dat$len~dat$supp*dat$dose)2 重复测量⽅差分析dat<-CO2CO2$conc<-factor(CO2$conc)w1b1<-subset(CO2,Treatment=="chilled")uptake是植物光合作⽤对⼆氧化碳的吸收量,是因变量y,type是组间因⼦,是互斥的,表⽰的是两个不同地区的植物类型,要么是加拿⼤的植物,要么是美国的植物,不可能两个地⽅都是,conc是不同的⼆氧化碳的浓度,每⼀种植物都在所有的⼆氧化碳浓度下,所以conc是组内因⼦研究不同地区的植物作⽤,在某种⼆氧化碳的浓度作⽤下,对植物的光合作⽤效果有没有影响2.1 含有单个组内因⼦w和单个组间因⼦B的重复测量ANOVAfit<-aov(uptake~conc*Type+Error(Plant/(conc)),w1b1)summary(fit)结果分析:⼆氧化碳浓度和类型对植物光合作⽤都有显著影响2.2 可视化图形呈现(1)⽅式⼀par(las=2)par(mar=c(10,4,4,2))with(w1b1,interaction.plot(conc,Type,uptake,type = "b",col=c("red","blue"),pch=c(16,18)))(2)⽅式⼆boxplot(uptake~Type*conc,data=w1b1,col=c("red","blue"))3 多元⽅差分析library(MASS)attach(UScereal)dat<-UScerealshelf<-factor(shelf)y<-cbind(calories,fat,sugars)fit<-manova(y~shelf)summary(fit)结果分析:不同的货架shelf上,⾷物的热量calories,脂肪含量fat和含糖量sugars是⾮常显著不同的3.1 多元正态性center<-colMeans(y)n<-nrow(y) #⾏数p<-ncol(y) #列数cov<-cov(y) #计算⽅差d<-mahalanobis(y,center,cov)coord<-qqplot(qchisq(ppoints(n),df=p),d) #画图abline(a=0,b=1) #画参考线identify(coord$x,coord$y,labels = s(UScereal)) #给出交互式标出离群点3.2 稳健多元⽅差分析install.packages("rrcov")library(rrcov)wilks.test(y,shelf,method="mcd")结果分析:P值⼩于0.05,说明结果是显著性的,即不同货架上⾷物的热量calories,脂肪含量fat和含糖量sugars是⾮常显著不同的4 ⽤回归来做ANOVAlibrary(multcomp)dat<-cholesterollevels(dat$trt)fit.aov<-aov(response~trt,data=dat)summary(fit.aov)结果分析:aov⽅差分析,trt对response的影响⾮常显著fit.lm<-lm(response~trt,data=dat)summary(fit.lm)结果分析:lm回归分析,trt对response的影响⾮常显著,并且trt的每⼀项都显⽰出来了。
例题:笔画数和字频是影响汉字识别时间的重要变量,一项研究综合考察了这两个变量对汉字识别的影响。
研究者设计了3*2两因素设计的实验。
第一个因素笔画数有三个水平,分别为多笔画字(12画以上)、中等笔画数(6画-13画)和少笔画字(1到6画);第二个因素字频有两个水平,分别为高频字和低频字。
两因素各个实验水平交叉后形成6个条件单元。
研究者使用的实验材料是60个汉字,每个条件单元中有10个汉字。
参加实验的被试来自某高校随机抽取的60名本科生,他们被随机分为6组,每组10人,每一组被试仅对一组实验材料进行命名。
问:笔画数和字频对汉字命名有什么影响?。
多因素方差分析公式了解多因素方差分析的计算公式多因素方差分析公式——了解多因素方差分析的计算公式多因素方差分析是一种统计方法,用于分析多个因素对观察结果的影响。
它通过比较不同因素水平下的观察值差异来判断这些因素对实验结果的影响程度。
在多因素方差分析中,我们需要了解与计算一些重要的公式。
1. 多因素方差分析的总平方和(SS_total)公式:SS_total = SS_between + SS_within其中,SS_total是总平方和,表示所有观测值与总均值之间的偏离程度;SS_between是组间平方和,表示不同因素水平下的观测值与总均值之间的偏离程度;SS_within是组内平方和,表示同一因素水平下的观测值与该水平下的均值之间的偏离程度。
2. 多因素方差分析的组间平方和(SS_between)公式:SS_between = ∑(ni * (μi - μ)²)其中,ni是第i组的观测值个数,μi是第i组观测值的均值,μ为所有观测值的总均值。
3. 多因素方差分析的组内平方和(SS_within)公式:SS_within = ∑∑((Xij - μi)²)其中,Xij表示第i组的第j个观测值,μi为第i组观测值的均值。
4. 多因素方差分析的组间平均平方(MS_between)公式:MS_between = SS_between / (k - 1)其中,k为不同因素水平的个数。
5. 多因素方差分析的组内平均平方(MS_within)公式:MS_within = SS_within / (N - k)其中,N为总观测值的个数。
6. 多因素方差分析的F统计量公式:F = MS_between / MS_withinF统计量用于判断不同因素水平的均值之间的差异是否显著。
若F 值大于某个临界值,则认为不同因素水平的均值存在显著差异。
通过以上公式,我们可以计算出组间平方和、组内平方和、组间平均平方、组内平均平方和F统计量,从而进行多因素方差分析。
双因素方差分析一、双因素方差分析的含义和类型(一)双因素方差分析的含义和内容在实际问题的研究中,有时需要考虑两个因素对实验结果的影响。
例如上一节中饮料销售量的例子,除了关心饮料颜色之外,我们还想了解销售地区是否影响销售量,如果在不同的地区,销售量存在显著的差异,就需要分析原因,采用不同的推销策略,使该饮料品牌在市场占有率高的地区继续深入人心,保持领先地位,在市场占有率低的地区,进一步扩大宣传,让更多的消费者了解,接受该产品。
在方差分析中,若把饮料的颜色看作影响销售量的因素A,饮料的销售地区看作影响因素B。
同时对因素A和因素B进行分析,就称为双因素方差分析。
双因素方差分析的内容包括:对影响因素进行检验,究竟一个因素在起作用,还是两个因素都起作用,或是两个因素的影响都不显著。
双因素方差分析的前提假定:采样地随机性,样本的独立性,分布的正态性,残差方差的一致性。
(二)双因素方差分析的类型双因素方差分析有两种类型:一个是无交互作用的双因素方差分析,它假定因素A 和因素B的效应之间是相互独立的,不存在相互关系;另一个是有交互作用的双因素方差分析,它假定因素A和因素B的结合会产生出一种新的效应。
例如,若假定不同地区的消费者对某种品牌有与其他地区消费者不同的特殊偏爱,这就是两个因素结合后产生的新效应,属于有交互作用的背景;否则,就是无交互作用的背景。
有交互作用的双因素方差分析已超出本书的范围,这里介绍无交互作用的双因素方差分析。
1.无交互作用的双因素方差分析。
无交互作用的双因素方差分析是假定因素A和因素B的效应之间是相互独立的,不存在相互关系;2.有交互作用的双因素方差分析。
有交互作用的双因素方差分析是假定因素A和因素B的结合会产生出一种新的效应。
例如,若假定不同地区的消费者对某种颜色有与其他地区消费者不同的特殊偏爱,这就是两个因素结合后产生的新效应,属于有交互作用的背景,否则,就是无交互作用的背景。
二、数据结构方差分析的基本思想:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。