巢式嵌套设计的方差分析
- 格式:doc
- 大小:45.00 KB
- 文档页数:4
巢式嵌套设计的方差分析本页仅作为文档封面,使用时可以删除This document is for reference only-rar21year.March巢式嵌套设计的方差分析嵌套设计被称为巢式设计(nested design)或系统分组(hierarchal classification)的资料,有些教科书上称这类资料为组内又分亚组的分类资料。
根据因素数的不同,套设计可分为二因素(二级)、三因素(三级)等套设计。
将全部k个因素按主次排列,依次称为1级,2级… k级因素,再将总离差平和及自由度进行分解,其基本思想与一般方差分析相同。
所不同的是分解法有明显的区别,它侧重于主要因素,并且,第i级因素的显著与否,是分别用第i级与第i+1级因素的均方为分子和分母来构造F统计量,并以F测验为其理论根据的。
嵌套试验设计应用:(1)情形一受试对象本身具有按其隶属关系进行分组再分组的各种因素。
比如:选取某种植物3个品种(A),在每一株内选取两片叶子(B)(嵌套在植株因素下的第二个因素),用取样器从每一片叶子上选取同样面积的两个样本(两次重复),称取湿重。
不是把B因素的2个水平简单地看作是与A因素3个水平的全面组合,而是分别嵌套在A1、A2、A3三个水平之下,相当于B因素有6个水平,但它们所产生的离差平和中又包含了A因素的作用,一般来说,它大于模型所提供的总误差,用它作为度量A因素作用大小的误差项,是严格考核A因素的一种措施。
部数据之总和为T,全部数据之平方和为W,校正数为C,Qi为系统分组分到第i级因素时,各小组数据之和的平方均值的和。
W=∑2ijk x C=nab T2 Q1=nb1∑2..i T Q2=n1∑2.ij T(2)情形二受试对象本身并非具有分组再分组的各种分组因素,而是各之间在专业上有主次之分。
区分嵌套设计与析因设计的关键是看因素之间的地位是否平等,因素的地位平等则属于析因设计,不平等则属于嵌套设计。
巢式病例对照研究(Nested case-contro l study)特点及常见问题解答作者:MedSci来源:MedSci巢式病例对照研究(nested case contro l study,NCCS)又被译做嵌入式病例对照研究,也称队列内病例对照研究(case contro l studywithin a cohort),是在全队列内套用病例对照设计。
这一设计方案于1973年由美国流行病学家M antel最早提出,称其为综合性病例对照研究(synthe tic case contro l study),1982年正式提出巢式病例对照研究(nested case-contro l study ),这是将队列研究与病例对照研究相结合的一种研究方法。
它在国际流行病学协会出版的《流行病学词典》(John st主编,1988)中的定义为:N CCS 是这样一种病例对照研究,它的病例和对照人群都从一个全队列(即通常所说的队列研究)中选取。
因为病例和对照的某些资料已经存在,一些潜在混杂因素的影响就能被减少或避免。
如病例和对照的暴露资料等均在疾病或死亡未发生前获得,故不存在暴露与疾病的时间顺序问题,观察偏倚也能得到很好地控制。
1.概念:是在队列内套用病例对照研究的一种设计,其研究对象是在队列研究的基础上确定的,以队列中所有的病例作为病例组,再根据病例发病时间,在研究队列的非病例中随机匹配一个或多个对照,组成对照组。
但是其研究方法和分析方法仍与病例对照研究相同(主要是配比病例对照研究)。
此种研究设计尤其适合于研究因素包括有复杂的化学或生化分析的前瞻性研究。
2.研究类型:由于巢式病例对照研究是在队列研究的基础上设计和实施的,因此也有前瞻性,回顾性,双向性三类。
巢式设计及其分析一巢式设计的目的与基本步骤(一)巢式设计的试验目的了解总体的变异情况,获得有代表性的总体参数,如平均数的估计值。
(二)巢式设计的基本步骤1 把调查对象分成若干级别的抽样单元2 每一级别的抽样都是在更高级别的抽样单元内进行3 每一级别的抽样都是随机抽样(三)巢式设计的实验方案的特点如果把高级抽样单元作为处理,则处理是随机选择的,而不是人为规定的。
二巢式设计的基本种类(一)一级巢式设计举例100个玉米果穗(二)二级巢式设计举例81株系-----50株/系;15棵----10果/树(三)三级和更多级的巢式设计举例10场----5窝/场----3头/窝;10样点----4钻/点----2份土/钻----2份液/土三巢式设计与其它设计的复合类型一、二级巢式设计分析方法与步骤(一)整理资料已知:b表示B级抽样单元的个数,a表示A级抽样单元的个数/B级抽样单元。
显然,A级单元总数= 数据总个数= a×b。
计算(1)B级单元总和数:T B = 同一B单元全部数据之和。
(2)T = 资料总和数;(3)。
(二)分解平方和与自由度平方和与自由度的分解公式为:下标B表示B级抽样单元间的变异项,下标A(B)表示B级单元内A级单元间的变异项(三)F检验二级巢式设计的方差分析表if F>Fa, then B单元之间的变异大于A单元之间的变异,B单元之间差异显著。
if F<Fa, then B单元之间的变异等于A单元之间的变异,B单元之间差异不显著。
(四)估计各级单元的总体方差B单元的总体方差之估计为12 若MS B < MS A(B),则取。
B内A单元的总体方差之估计为(五)估计平均数的标准误例子各级单元的总体方差其中,植株的总体方差分量田间位置的总体方差分量由于方差不可能为负数,故取其值为0。
总体方差估计值平均数的标准误。
用方差分析,linear或mixed models
选择需要分析的因子
点Model
巢式分析,其实就是一个从属的关系,这里se从属与bagedian,所以先从class里选se,添加入fixed effects
再选中class里的bagedian,按nest
这个分析时同时考虑se 与bagedian两个因素,并且考虑了se 与bagedian的从属关系
如果不是从属关系,就用交互cross,而不点nest
一般的模型,还要再加入bagedian(只考虑bagedian),这样才考虑的全面点。
这样模型建好,OK. 模型建好后,还需对多重比较的参数进行设置,否则分析结果就只是对模型的可用性进行检验,
选means,
将effects里的,需要进行多重比较分析的选项选进ls mean
并勾选compute pairvise,选择method,一般选tukey , OK 只用到bagedian1 se value三列。
SPSS嵌套设计资料的分析研究杜海平【摘要】Nested design has been widely applied in agriculture, while the analysis of its test data is rather complex, involving the decomposition type of sum-of-squares and the treatment effect of experimental factors, as well as the order of experimental factors in the software use. This paper analyzed the decomposition methods of sum-of-squares about nested design data, and F value calculation methods of fixed model and random model, and the correct methods to use SPSS to analyze nested design data, and gave the detailed solution steps through two cases, so as to achieve the purpose of correctly using mathematical statistics methods and statistical software.%目前,嵌套设计在农业上应用较多,但是分析其试验数据比较复杂,涉及到平方和的分解类型、试验因素的处理效应,以及软件使用中试验因素的前后顺序。
本文针对嵌套设计资料的平方和分解方法、固定模型和随机模型的F值计算方法以及正确使用SPSS分析嵌套设计资料的方法进行剖析,并通过两个案例给出了详细的解决步骤,以达到正确使用数理统计方法和统计软件的目的。
SPSS分析:嵌套式两因素方差分析(单变量)1、数据输入格式⑴定义变量:国家品种最大光能转换效率注意:对圈红色的部分进行设定⑵输入数据:在Excel中编制下列格式数据,复制粘贴到SPSS中美国M56 0.842美国M56 0.829美国M56 0.83美国M56 0.834美国M49 0.849美国M49 0.844美国M49 0.851美国M49 0.839美国M5 0.822美国M5 0.82美国M5 0.822美国M5 0.817美国M34 0.849美国M34 0.852美国M34 0.853美国M34 0.844美国M64 0.865美国M64 0.855美国M64 0.862美国M64 0.852美国M73 0.853美国M73 0.856美国M73 0.851中国红运0.849中国红运0.849中国红运0.853中国香妃0.859中国香妃0.856中国香妃0.859中国香妃0.86中国新铁0.845中国新铁0.844中国新铁0.84中国新铁0.859中国新重瓣红0.837中国新重瓣红0.848中国新重瓣红0.854中国新重瓣红0.855中国新重瓣红0.856中国新重瓣红0.854中国交5 0.839 中国交5 0.834 中国交5 0.832 中国交5 0.834中国泽州1号0.845中国泽州1号0.832中国泽州1号0.835中国泽州1号0.8512、命令顺序:按下面图示选择后按“继续”键,进行其它设定选择继续后,按“确定”键即可弹出结果页面,导出为word文档即可。
UNIANOVA 最大光能转换效率 BY 国家品种 /METHOD=SSTYPE(1) /INTERCEPT=EXCLUDE /POSTHOC=国家品种(SNK DUNCAN LSD) /CRITERIA=ALPHA(0.05) /DESIGN=国家品种.。
巢式嵌套设计的方差分析
嵌套设计被称为巢式设计(nested design)或系统分组(hierarchal classification)的资料,有些教科书上称这类资料为组内又分亚组的分类资料。
根据因素数的不同,套设计可分为二因素(二级)、三因素(三级)等套设计。
将全部k个因素按主次排列,依次称为1级,2级…k级因素,再将总离差平和及自由度进行分解,其基本思想与一般方差分析相同。
所不同的是分解法有明显的区别,它侧重于主要因素,并且,第i级因素的显著与否,是分别用第i级与第i+1级因素的均方为分子和分母来构造F统计量,并以F 测验为其理论根据的。
嵌套试验设计应用:
(1)情形一
受试对象本身具有按其隶属关系进行分组再分组的各种因素。
比如:选取某种植物3个品种(A),在每一株内选取两片叶子(B)(嵌套在植株因素下的第二个因素),用取样器从每一片叶子上选取同样面积的两个样本(两次重复),称取湿重。
不是把B因素的2个水平简单地看作是与A因素3个水平的全面组合,而是分别嵌套在A1、A2、A3三个水平之下,相当于B因素有6个水平,但它们所产生的离差平和中又包含了A因素的作用,一般来说,它大于模型所提供的总误差,用它作为度量A因素作用大小的误差项,是严格考核A因素的一种措施。
方差分析表:
注:A因素有a个水平,B因素有b个水平,重复n次,总样本含量为nab,全部数据之总和为T,全部数据之平方和为W,校正数为C,Qi为系统分组分到第i级因素时,各小组数据之和的平方均值的和。
W=∑2ijk x C=nab T2Q1=nb1∑2..i T Q2=n1∑2.ij T
(2)情形二
受试对象本身并非具有分组再分组的各种分组因素,而是各之间在专业上有主次之分。
区分嵌套设计与析因设计的关键是看因素之间的地位是否平等,因素的地位平等则属于析因设计,不平等则属于嵌套设计。
比如:为了研究某种抗菌药的效果,对小白鼠进行试验。
考虑3个试验因素,因素A(用此抗菌药与否)可分为A1(对照组不用抗菌药)、A2(试验组用抗菌药);因素B(小白鼠代次)可分为B1(第1代)、B2(第2代)、B3(第3代);因素C(性别)可分为C1(雄性)、C2(雌性)。
让第1代小白鼠被这种细菌感染,按雌雄分别统计对照组和试验组小白鼠的存活率,让存活的小白鼠分别在各自的组内(指对照组和试验组)生产第二代,对于第2代重复上面的试验,……,3因素各水平搭配下都重复2次试验,每次都有足够数量的小白鼠(因为观测指标是存活率),有人进行了如下的设计并收集到如下的试验数据。
由专业知识得知:3因素的主次顺序为A→B→C。
试分析3因素对小白鼠存活率的影响。
方差分析表:
注:A因素有a个水平,B因素有b个水平,C因素有c个水平,重复n次,总样本含量为nab,全部
T2,Qi为系统分组分到第i级因素时,各小组数据之总和为T,全部数据之平和为W,校正数为C=
nabc
数据之和的平方均值的和。
注意:由于在嵌套设计中,两个因素之间不能自由交错地组成各种处理组合,因而,不能考察因素之间地交互作用。
所以,凡是交互作用比较重要的试验,都不应采用这种设计。
进行嵌套设计的方差分析的过程:nested、anova或GLM,过程nested过程更简单一些,但它受数据中读取分组变量先后顺序的影响很大,应先用SORT过程按因素重要程度进行排序整理;过程anova 或GLM不需要排序整理,且容易进行均值比较。
平衡资料用过程nested、anova或GLM三种过程做结果是一样的;若不是平衡资料,必须用过程GLM。
例1选取某种植物3个品种(Plant),在每一株内选取两片叶子(Leaf)(嵌套在植株因素下的第二个因素),用取样器从每一片叶子上选取同样面积的两个样本(两次重复),称取湿重。
对以上结果进行方差分析。
(固定效应Plant+随机效应Leaf)
解:SAS程序如下:
Data Nested;
Input plant $ leaf wt @@;
Cards;
a 1 a 1
b 1 b 1
c 1 c 1
a 2 a 2
b 2 b 2
c 2 c 2
;
Proc Anova;
Class plant leaf ;
Model wt = plant leaf(plant);
Test H = plant E = leaf(plant);
Means plant / Duncan E = leaf(plant);
Run;
Proc Sort;
By plant leaf;
Run;
Proc Nested;
Class plant leaf;
Var wt;
Run;
输出结果见示例。
例2在室内用4种培养液培养某植物,每种培养液培养3盆,每盆4株,一个月后测定其株高生长量(mm)。
试对以上结果进行方差分析。
(固定效应+随机效应)
Data amm;
Do a =1 to 4;
Do b = 1 to 3;
Do rep = 1 to 4;
Input y @@;
Output;
End;
End;
End;
Cards;
50 55 40 35 35 35 30 40 45 40 40 50
50 45 50 45 55 60 50 50 55 45 65 55
85 60 90 85 65 70 80 65 70 70 70 70
60 55 35 70 60 85 45 75 65 65 85 75
;
Proc Sort;
By a b rep;
Run;
Proc nested;
Class a b;
Var y;
Run;
Proc anova; /*均数的多重比较*/
Class a b;
Model y=a b(a);
Test h=a e=b(a);
Means a /duncan e=b(a);
Run;
结果:
例3为了研究某种抗菌药的效果,对小白鼠进行试验。
考虑3个试验因素,因素A(用此抗菌药与否)可分为A1(对照组不用抗菌药)、A2(试验组用抗菌药);因素B(小白鼠代次)可分为B1(第1代)、B2(第2代)、B3(第3代);因素C(性别)可分为C1(雄性)、C2(雌性)。
让第1代小白鼠被这种细菌感染,按雌雄分别统计对照组和试验组小白鼠的存活率,让存活的小白鼠分别在各自的组内(指对照组和试验组)生产第二代,对于第2代重复上面的试验,……,3因素各水平搭配下都重复2次试验,每次都有足够数量的小白鼠(因为观测指标是存活率),有人进行了如下的设计并收集到如下的试验数据。
由专业知识得知:3因素的主次顺序为A→B→C。
试分析3因素对小白鼠存活率的影响。
DATA abc;
DO r=1 to 2;
DO a=1 to 2;
DO b=1 to 3;
DO c=1 to 2;
INPUT p @@;
y=ARSIN(SQRT(p/100));
OUTPUT;
END;
END;
END;
END;
CARDS;
28 33 15 26 26 18 56 62 48 66 70 49
19 27 11 22 20 11 51 60 44 61 65 55
;
PROC SORT;
BY a b c r;
RUN;
PROC NESTED;
CLASS a b c;
VAR y;
RUN;
PROC GLM;
CLASS a b c;
MODEL y=a b(a) c(a b);
TEST H=a E=b(a);
TEST H=b(a) E=c(a b);
Means a/duncan E=b(a);
RUN;
例4 鸡的试验《试验统计学》P134-区靖祥。