(整理)sas第九章 t检验和方差分析.
- 格式:doc
- 大小:198.00 KB
- 文档页数:18
第九章 方差分析教学目的:理解方差分析的一般原理;掌握完全随机设计和随机区组设计方差分析的步骤;熟悉事后检验方法。
教学重点:完全随机化设计和随机区组设计类型的方差分析,事后检验。
教学时数:8学时Z 、t 检验用于两组样本平均差异的显著性检验,是通过检验两组样本平均值间的差异来推论各自代表的两总体均值的差异。
但在实际工作中,我们有时需要同时对多于两个的总体平均数有无显著性差异作出检验,如下例:例:某研究者设计了三种不同的教学方法,为比较三种方法有无优劣之分,他随机抽取了三组被试,每组6人,各组分别接受一种教法的教学,学习同一种材料,学完之后进行统一测试,测得结果如下,问这样的结果是否支持三种教学方法有无优劣之分。
对于这样一种多个总体平均数差异的显著性检验问题,似乎可用Z 、t 检验分别两两成对比较,但是我们不能忘记统计决策是有犯错误的风险的,在对两个总体平均数作检验时,犯弃真错误(Ho 为真,拒绝)的概率为α,结论正确的概率为1-α,比较次数会随着总体的增多而迅速增大,如此例,323==C n ,那第连续三次都正确的概率为3)1(α-,结论出错的概率为3)1(1α--,这个值>α,不符合我们希望在一次检验中犯弃真错误的概率为α的要求了。
因此,在对多个总体平均数作显著性检验时,采用Z 、t 检验两两逐对比较并不是一种理想的方法,另外,从检验工作量来说,平均数个数增多,两两比较次数迅速增多,工作量增大。
本章所介绍的方差分析,又称作变异数分析(Analysis of Variance ,缩写为ANOV A ),就是一种用于多个总体平均数差异显著性检验,既不增加犯错误的概率,又不加大工作量的一次性通盘检验方法。
因对平均数的检验是通过对方差的分析比较进行的,故称方差分析。
方差分析是统计学中一种独特的假设检验方法,多个总体平均数差异显著性检验是其基本功能,但其功能不仅仅如此,还可以用于两种以上实验处理的数据分析(包括同时在多个不同方向上分别进行各向内多个平均数之间的比较,还可侦查不同方向因素之间有无交互作用)。
统计学中的方差分析与t检验的比较统计学是研究收集、整理、分析和解释数据的一门学科。
在统计学中,方差分析和t检验是两种常见的统计方法,用于比较不同样本或处理之间的差异。
本文将对方差分析和t检验进行比较,包括原理、适用场景和统计结果的解释。
一、方差分析方差分析(Analysis of Variance,简称ANOVA)是一种用于比较两个或多个样本均值是否存在显著性差异的方法。
它将总体方差拆解为组内方差和组间方差,然后通过比较组间方差与组内方差的大小来判断样本均值是否存在显著性差异。
方差分析适用于多个组之间的比较。
例如,一个实验研究了三种不同肥料对植物生长的影响,将植物分为三组分别使用不同的肥料,然后通过比较植物生长的指标来确定肥料是否有显著影响。
方差分析的统计结果通常包括F值、P值和自由度。
F值表示组间方差与组内方差的比值,P值则用于判断差异是否显著。
如果P值小于设定的显著性水平(通常是0.05),则可以拒绝原假设,即认为样本均值之间存在显著性差异。
二、t检验t检验(t-test)是一种用于比较两个样本均值是否存在显著性差异的方法。
它通过计算两个样本的均值差异与其标准误差的比值,来判断样本均值之间是否存在统计学上的显著性差异。
t检验适用于两个组之间的比较。
例如,一个实验想要比较男性和女性在某种认知任务上的得分是否存在显著差异,可以使用t检验来进行分析。
与方差分析不同,t检验的统计结果通常包括t值、P值和自由度。
t 值表示样本均值差异与标准误差的比值,P值用于判断差异是否显著。
同样地,如果P值小于设定的显著性水平(通常是0.05),则可以拒绝原假设,认为样本均值之间存在显著性差异。
三、方差分析与t检验的比较方差分析和t检验都是用于比较不同样本或处理之间差异的统计方法,但适用场景和分析过程略有不同。
首先,方差分析适用于多个组之间的比较,而t检验适用于两个组之间的比较。
当只有两个组时,可以选择使用方差分析或t检验,但一般情况下,t检验更常见。
第九章方差分析前面介绍了两个样本均数比较的t检验,那么多个样本均数的比较应该采用什么方法?方差分析(analysis of variance, ANOV A)是20世纪20年代发展起来的一种统计方法,由英国著名统计学家R.A.Fisher提出,又称F检验,是通过对数据变异的分析来推断两个或多个样本均数所代表总体均数是否有差别的一种统计学方法。
本章首先介绍方差分析的基本思想和应用条件,然后结合研究设计类型分别介绍各类方差分析方法。
第一节方差分析的基本思想和应用条件一、方差分析的基本思想方差分析的基本思想是把全部观察值间的变异按设计类型的不同,分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。
例9.1 为研究大豆对缺铁性贫血的恢复作用,某研究者进行了如下实验:选取已做成贫血模型的大鼠36只,随机等分为3组,每组12只,分别用三种不同的饲料喂养:不含大豆的普通饲料、含10%大豆饲料和含15%大豆饲料。
喂养一周后,测定大鼠红细胞数(×1012/L),试分析喂养三种不同饲料的大鼠贫血恢复情况是否不同?表9.1 喂养三种不同饲料的大鼠红细胞数(×1012/L)普通饲料10%大豆饲料15%大豆饲料合计X 4.78 4.65 6.80 4.65 6.92 5.913.984.447.284.04 6.167.51 3.445.997.51 3.776.677.743.65 5.298.194.91 4.707.154.795.058.185.316.01 5.534.055.677.795.16 4.688.03in12 12 12 36 (n)i X ∑ 52.53 66.23 87.62 206.38(X ∑)i X4.385.52 7.30 5.73 (X ) 2i X ∑ 234.2783373.2851647.73121255.2946(2X ∑)表9.1按完全随机设计获得的36个数据(X )中包含以下三种变异: 1. 总变异 36只大鼠喂养一周后测定红细胞数X 各不相同,即X 与总均数X 不同,这种变异称为总变异(total variation)。
使用SAS进行数据分析的基础知识一、SAS数据分析简介SAS(Statistical Analysis System)是一套全面的数据分析软件工具,它具备强大的数据处理和统计分析能力。
它适用于各种领域的数据分析,包括市场调研、金融分析、医疗研究等。
二、数据准备在进行SAS数据分析之前,首先要进行数据准备。
这包括数据的收集、整理和清洗。
收集数据可以通过调查问卷、实地观察、数据库查询等方式。
整理数据即将数据格式统一,包括去除重复数据、统一变量命名等。
清洗数据则是去除异常值、缺失值处理等。
三、SAS基础语法1. 数据集(Data set)的创建和导入SAS中的数据以数据集的形式存在,可以使用DATA步骤创建数据集,也可以从外部文件导入数据集。
导入数据可使用INFILE 语句指定文件位置,并使用INPUT语句将数据导入到数据集中。
2. 数据操作和处理SAS提供了多种数据操作和处理函数,如排序、合并、拆分等。
常用的函数有SUM、MEAN、COUNT、MAX、MIN等,它们可以对数据集中的变量进行统计和计算。
3. 数据可视化SAS提供了多种可视化方式,用于更直观地展示数据。
可以使用PROC SGPLOT语句进行绘图,如折线图、散点图、柱状图等。
还可以使用PROC TABULATE语句生成数据报表。
四、统计分析SAS强大的统计分析功能是其独特的优势之一。
以下为几种常用的统计分析方法:1. 描述统计分析描述统计分析用于对数据进行概括和描述。
可以使用PROC MEANS进行均值、中位数、标准差等统计指标的计算,使用PROC FREQ进行频数分析。
2. t检验t检验用于比较两组样本均值的差异是否显著。
可以使用PROC TTEST进行t检验分析,根据t值和显著性水平判断差异是否显著。
3. 方差分析方差分析用于比较两个或多个样本均值的差异是否显著。
可以使用PROC ANOVA进行方差分析,根据F值和显著性水平判断差异是否显著。
第九章 t 检验和方差分析在科研中,我们往往是根据样本之间的差异,去推断其总体之间是否有差异。
样本差异可能是由抽样误差所致,也可能是由本质的不同所致。
应用统计学方法来处理这类问题,称为“差异的显著性检验”。
若已知总体为正态分布,进行差异的显著性检验,称为“参数性检验”,SAS 中M EANS 、TTEST 、ANOVA 、GLM 等均属此类检验;若未知总体分布,进行差异的显著性检验,称为“非参数性检验”,SAS 中采用NPAR 1WAY 过程。
第一节 t 检验9.1.1 简介t 检验是用于两组数据均值间差异的显著性检验。
它常用于以下场合: 1.样本均值与总体(理论)均值差别的显著性检验检验所测得的一组连续资料是否抽样于均值已知的总体 根据大量调查的结果或以往的经验,可得到某事物的平均数(例如生理生化的正常值),以此作总体均值看待。
SAS 中采用MEAN S 过程,计算出观察与总体均值的差值,再对该差值的均值进行t 检验。
2.同一批对象实验前后差异的显著性检验(自身对照比较)或配对资料差异的显著性检验(配对比较检验)比如,在医学研究中,我们常常对同一批病人治疗前后的某些生理生化指标(如血压、体温等)进行测量,以观察疗效;或对同一批人群进行预防接种,以观察预防效果;或把实验对象配成对进行测定,比较其实验结果。
SAS 中采用MEAN S 过程,计算出两样本观察的差值(如治疗前、后实验数据的差值),再对该差值的均值进行t 检验。
3.两样本均值差异的显著性检验作两样本均值差异比较的两组原始资料各自独立,没有成对关系。
两组样本所包含的个数可以相等,也可以不相等。
每组观测值都是来自正态总体的样本。
设与为两样1X 2X 本的均值,1n 与为两样本2n 数,21s ,22s 为两样本方差,分两种情形,其数学模型为:(1)方差齐(相等)时:)/1/1(21221n n s x x t +-=)2/(])1()1[(212222112-+-+-=n n s n s n s(2)方差不齐时: 22212121//n s n s x x t +-=SAS 中采用TTES T 过程,先作方差齐性检验(F 检验),然后根据方差齐(EQUAL )和方差不齐(UNEQU AL)输出t 值和P 值以及基本统计量。
SPSS中的卡⽅检验、t检验和⽅差分析
⾸先要明⽩两个概念:
计数资料和计量资料
(1)计数资料⼜称为定性资料:是分类型的,统计每个类型有多少数量。
(2)计量资料⼜称为定量资料:⽐如年龄,是有具体的数值。
根据数据的类型,使⽤不同的⽅法:
(1)对于计量资料。
秩和检验在国内的⽂章中很少见到。
当数据只有两组进⾏对⽐的时候,使⽤t检验和⽅差分析都可以。
但是有两组或者两组以上的时候,使⽤⽅差检验。
(2)对于计数资料,使⽤卡⽅分析,卡⽅分析⽤于⽐较,不同组之间,不同数量是否有差异。
⽐如,⽐较两组,男⽣⼈数和⼥⽣⼈数是否有差距。
独⽴样本t检验:两独⽴样本t检验就是根据样本数据对两个样本来⾃的两独⽴总体的均值是否有显著差异进⾏推断;进⾏两独⽴样本t检验的条件是,两样本的总体相互独⽴且符合正态分布;
⽐如:A组和B组,⽐较A组⼈的⾝⾼和B组⼈的⾝⾼是否有差异。
配对样本t检验-:配对样本是指对同⼀样本进⾏两次测试所获得的两组数据,或对两个完全的样本在不同条件下进⾏测试所得到的两组数据;两独⽴样本t检验就是根据样本数据对两个配对样本来⾃的两配对总体的均值是否有显著差异进⾏推断;两配对样本t检验的前提条件:两样本是配对的(数量⼀样,顺序不能变),服从正态分布。
⽐如:实验组A组中,实验前后,变化的对⽐。
第九章方差分析第九章方差分析【思考与练习】一、思考题1. 方差分析的基本思想及其应用条件是什么?2. 在完全随机设计方差分析中各表示什么含义?SS SS SS、、总组间组内3. 什么是交互效应?请举例说明。
4. 重复测量资料具有何种特点?5. 为什么总的方差分析的结果为拒绝原假设时,若想进一步了解两两之间的差别需要进行多重比较?二、最佳选择题1. 方差分析的基本思想为A. 组间均方大于组内均方B. 误差均方必然小于组间均方C. 总变异及其自由度按设计可以分解成几种不同来源D. 组内方差显著大于组间方差时,该因素对所考察指标的影响显著组间方差显著大于组内方差时,该因素对所考察指标的影响显著E.第九章 方差分析3.完全随机设计的方差分析中,下列式子正确的是4. 总的方差分析结果有P<0.05,则结论应为A. 各样本均数全相等B. 各总体均数全相等C. 各样本均数不全相等D. 各总体均数全不相等E. 至少有两个总体均数不等5. 对有k 个处理组,b 个随机区组的资料进行双因素方差分析,其误差的自由度为A. kb k b --B. 1kb k b ---C. 2kb k b ---D. 1kb k b --+E. 2kb k b --+6. 2×2析因设计资料的方差分析中,总变异可分解为A. MS MS MS =+B A 总B. MS MS MS =+B 总误差C. SS SS SS =+B 总误差D. SS SS SS SS =++B A 总误差E. SS SS SS SS SS =+++B A A B 总误差7.观察6只狗服药后不同时间点(2小时、4小时、8小时和24小时)血药浓度的变化,本试验应选用的统计分析方法是A. 析因设计的方差分析第九章方差分析B. 随机区组设计的方差分析C. 完全随机设计的方差分析D. 重复测量设计的方差分析E. 两阶段交叉设计的方差分析8. 某研究者在4种不同温度下分别独立地重复10次试验,共测得某定量指标的数据40个,若采用完全随机设计方差分析进行统计处理,其组间自由度是A.39B.36C.26D.9E.39. 采用单因素方差分析比较五个总体均数得,若需进一步了解其中一P0.05个对照组和其它四个试验组总体均数有无差异,可选用的检验方法是A. Z检验B. t检验C. Dunnett–t检验D. SNK–q检验E. Levene检验三、综合分析题1. 某医生研究不同方案治疗缺铁性贫血的效果,将36名缺铁性贫血患者随机等分为3组,分别给予一般疗法、一般疗法+药物A低剂量,一般疗法+药物A 高剂量三种处理,测量一个月后患者红细胞的升高数(102/L),结果如表9-1所示。
第九章t 检验和方差分析在科研中,我们往往是根据样本之间的差异,去推断其总体之间是否有差异。
样本差异可能是由抽样误差所致,也可能是由本质的不同所致。
应用统计学方法来处理这类问题,称为“差异的显著性检验”。
若已知总体为正态分布,进行差异的显著性检验,称为“参数性检验”,SAS 中MEANS 、TTEST 、ANOVA 、GLM 等均属此类检验;若未知总体分布,进行差异的显著性检验,称为“非参数性检验”,SAS 中采用NPAR1WAY 过程。
第一节 t 检验9.1.1 简介t 检验是用于两组数据均值间差异的显著性检验。
它常用于以下场合:1.样本均值与总体(理论)均值差别的显著性检验检验所测得的一组连续资料是否抽样于均值已知的总体根据大量调查的结果或以往的经验,可得到某事物的平均数(例如生理生化的正常值),以此作总体均值看待。
SAS 中采用MEANS 过程,计算出观察与总体均值的差值,再对该差值的均值进行t 检验。
2.同一批对象实验前后差异的显著性检验(自身对照比较)或配对资料差异的显著性检验(配对比较检验)比如,在医学研究中,我们常常对同一批病人治疗前后的某些生理生化指标(如血压、体温等)进行测量,以观察疗效;或对同一批人群进行预防接种,以观察预防效果;或把实验对象配成对进行测定,比较其实验结果。
SAS 中采用MEANS 过程,计算出两样本观察的差值(如治疗前、后实验数据的差值),再对该差值的均值进行t 检验。
3.两样本均值差异的显著性检验作两样本均值差异比较的两组原始资料各自独立,没有成对关系。
两组样本所包含的个数可以相等,也可以不相等。
每组观测值都是来自正态总体的样本。
设1X 与2X 为两样本的均值,1n 与2n 为两样本数,21s ,22s 为两样本方差,分两种情形,其数学模型为:(1)方差齐(相等)时:)/1/1(21221n n s x x t +-=)2/(])1()1[(212222112-+-+-=n n s n s n s(2)方差不齐时: 22212121//n s n s x x t +-=SAS 中采用TTEST 过程,先作方差齐性检验(F 检验),然后根据方差齐(EQUAL)和方差不齐(UNEQUAL)输出t 值和P 值以及基本统计量。
T检验及其与方差分析的区别假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同。
t 检验:1.单因素设计的小样本(n<50)计量资料2.样本来自正态分布总体3.总体标准差未知4.两样本均数比较时,要求两样本相应的总体方差相等•根据研究设计t检验可由三种形式:–单个样本的t检验–配对样本均数t检验(非独立两样本均数t检验)–两个独立样本均数t检验(1)单个样本t检验•又称单样本均数t检验(one sample t test),适用于样本均数与已知总体均数μ0的比较,其比较目的是检验样本均数所代表的总体均数μ是否与已知总体均数μ0有差别。
•已知总体均数μ0一般为标准值、理论值或经大量观察得到的较稳定的指标值。
•单样t检验的应用条件是总体标准s未知的小样本资料( 如n<50),且服从正态分布。
(2)配对样本均数t检验•配对样本均数t检验简称配对t检验(paired t test),又称非独立两样本均数t检验,适用于配对设计计量资料均数的比较,其比较目的是检验两相关样本均数所代表的未知总体均数是否有差别。
•配对设计(paired design)是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。
•应用配对设计可以减少实验的误差和控制非处理因素,提高统计处理的效率。
•配对设计处理分配方式主要有三种情况:①两个同质受试对象分别接受两种处理,如把同窝、同性别和体重相近的动物配成一对,或把同性别和年龄相近的相同病情病人配成一对;②同一受试对象或同一标本的两个部分,随机分配接受两种不同处理,如例5.2资料;③自身对比(self-contrast)。
即将同一受试对象处理(实验或治疗)前后的结果进行比较,如对高血压患者治疗前后、运动员体育运动前后的某一生理指标进行比较。
(3)两独立样本t检验两独立样本t 检验(two independent samples t-test),又称成组t 检验。
第九章 t 检验和方差分析在科研中,我们往往是根据样本之间的差异,去推断其总体之间是否有差异。
样本差异可能是由抽样误差所致,也可能是由本质的不同所致。
应用统计学方法来处理这类问题,称为“差异的显著性检验”。
若已知总体为正态分布,进行差异的显著性检验,称为“参数性检验”,SAS 中MEANS 、TTEST 、ANOVA 、GLM 等均属此类检验;若未知总体分布,进行差异的显著性检验,称为“非参数性检验”,SAS 中采用NPAR1WAY 过程。
第一节 t 检验9.1.1 简介t 检验是用于两组数据均值间差异的显著性检验。
它常用于以下场合:1.样本均值与总体(理论)均值差别的显著性检验检验所测得的一组连续资料是否抽样于均值已知的总体根据大量调查的结果或以往的经验,可得到某事物的平均数(例如生理生化的正常值),以此作总体均值看待。
SAS 中采用MEANS 过程,计算出观察与总体均值的差值,再对该差值的均值进行t 检验。
2.同一批对象实验前后差异的显著性检验(自身对照比较)或配对资料差异的显著性检验(配对比较检验) 比如,在医学研究中,我们常常对同一批病人治疗前后的某些生理生化指标(如血压、体温等)进行测量,以观察疗效;或对同一批人群进行预防接种,以观察预防效果;或把实验对象配成对进行测定,比较其实验结果。
SAS 中采用MEANS 过程,计算出两样本观察的差值(如治疗前、后实验数据的差值),再对该差值的均值进行t 检验。
3.两样本均值差异的显著性检验作两样本均值差异比较的两组原始资料各自独立,没有成对关系。
两组样本所包含的个数可以相等,也可以不相等。
每组观测值都是来自正态总体的样本。
设1X 与2X 为两样本的均值,1n 与2n 为两样本数,21s ,22s 为两样本方差,分两种情形,其数学模型为:(1)方差齐(相等)时:)/1/1(21221n n s x x t +-=)2/(])1()1[(212222112-+-+-=n n s n s n s(2)方差不齐时: 22212121//n s n s x x t +-=SAS 中采用TTEST 过程,先作方差齐性检验(F 检验),然后根据方差齐(EQUAL)和方差不齐(UNEQUAL)输出t 值和P 值以及基本统计量。
在作方差齐性检验时,用F 检验。
F 值计算公式为:),(),(22212221S S Min S S Max F =9.1.2 用MEANS 过程作t 检验1.过程格式PROC MEANS MEAN STD STDERR T PRT ; VAR 变量表;2.说明(1)PROC MEANS 语句中,选择了5个统计量:均值、标准差、标准误差、t 值、P 值。
(2)VAR 语句中的变量是分析变量。
缺省时,计算所有数值型变量。
3.举例例1: 样本均值与总体均值差别的显著性检验。
已知某水样中含CaCO 3的真值为20.7mg /L ,现用某方法重复测定该水样11次,CaCO 3的含量为:20.99,20.41,20.10,20.00,20.91,22.60,20.99,20.41,20,23,22。
问用该法测CaCO 3的含量所得的均值与真值有无显著差别 ?程序: (yp111.sas) 编程说明:在数据步中,变量x 读取测定值,产生一个差值变量y(y=x-20.7),在过程步中,计算出Y 的均值、标准差、标准误差、t 值、P 值。
结果说明:因t =1.0636907,0.05<p=0.3125,故用此法测定水中CaCO 3的含量的均值与真值间无显著差异。
此法可信。
例2:配对比较的t 检验。
研究食物中维生素E 与肝脏中维生素A 含量的关系。
将大白鼠按性别、体重配对。
每对随机分配,一个用正常饲料,一个用缺乏维生素E 的饲料。
经过一个时期饲养,杀死动物测定肝中维生素A 的含量,结果如下表:大白鼠肝脏中维生素A含量(IU/g)配对号 1 2 3 4 5 6 7 8正常饲料3550 2000 3000 3950 3800 3750 3450 3050 缺乏E饲料2450 2400 1800 3200 3250 2700 2500 1750程序:(yp112.sas)编程说明:数据步中,把每对数据中的一个作为x,另一个作为y,计算出差数d(d=x-y),在过程步中,计算差数d的均值、标准差、标准误差、t值、P值。
结果说明:因t=4.21 p=0.0040<0.05,故有非常显著差异,即正常饲料组鼠肝维生素A含量比维生素E缺乏组的含量大。
例3 自身对照比较的t检验。
应用克矽平治疗矽肺患者10名,治疗前后血红蛋白的含量如下表,问该药是否会引起血红蛋白的变化?治疗前后血红蛋白的含量(mg%)治疗前11.3 15.0 15.0 13.5 12.8 10.0 11.0 12.0 13.0 12.3 治疗后14.0 13.8 14.0 13.5 13.5 12.0 14.7 11.4 13.8 12.0程序:(yp113.sas)编程说明:数据步中,把每对数据中的一个作为x,另一个作为y,计算出差数d(d=x-y),在过程步中,计算差数d的均值、标准差、标准误差、t值、P值。
结果说明:因t=1.1989377,O.05<p≤O.2612,故差别无显著差异,即该药不会引起血红蛋白的变化。
9.1.3用TTEST过程作t检验1.过程格式PROC TTEST [DATA=数据集];CLASS变量;VAR变量表;2.说明(1)CLASS语句中的变量是分类变量,其水平值只能有两个,并对应两组观察。
是必选语句。
(2)VAR语句中的变量是被分析的变量,如果缺省,则对所有的数值型变量进行分析。
3.举例观察某药物对大白鼠肉瘤的影响。
数据如下表,试作差异性检验。
对照组56 55 54 53 56 52 57 54 52 56实验组50 48 49 49 50 50 60 55 43 52 56 57 程序: (yp114.sas)编程说明:数据步中,用循环控制变量a作分类变量,其水平值为1(对照组)和2(实验组),变量n表示样本数,分别为10和12,用变量x读取原始数据,在过程步中,用CLASS语句标识分类变量,用VAR语句标识分析变量。
结果说明:输出的最后:H0:Variances are equal(方差相等)表示给出的是对方差相等假设的结果。
先看方差齐性检验(F检验),然后根据F检验的结果,选择方差齐(Equal)或不齐(Unequal)的t值和p值,以及两组观察的均值、标准差、标准误差、最大值、最小值。
找Prob>F’=右边的值,即方差相等假设检验的P值,如果此值大于0.01则在方差相等假设下继续进行,否则只能使用近似T检验。
因P=0.0074,说明方差差异显著,即方差不齐。
当方差不齐时,T=2.0000,0.05<P≤0.0644,故无显著差异,即此药物对大白鼠肉瘤无显著影响。
第二节方差分析当试验结果受到多个因素的影响,而且也受到每个因素的各水平的影响,为从数量上反映各因素以至各因素诸水平对试验结果的影响时使用方差分析的方法。
方差分析的基本思想是把全部数据关于总均值的离差平方和分解成几个部分,每一部分表示某因素交互作用所产生的效应,将各部分均方与误差均方相比较,从而确认或否认某些因素或交互作用的重要性。
用公式概括为:总变异=组间变异+组内变异其中:组间变异由各因素所引起,组内变异由个体差异所引起的,或者说由误差引起的。
常用的方差分析法有以下4种:(1)完全随机设计资料的方差分析(单因素方差分析)(2)随机区组设计资料的方差分析(二因素方差分析)(3)拉丁方设计资料的方差分析(三因素方差分析)(4)R*C析因设计资料的方差分析(有交互因素的方差分析)SAS系统中,ANOVA过程可以处理以上情形的方差分析,但它要求每个分类因子的组合观察数相等,即数据是均衡的。
若不均衡,就要求用GLM过程进行处理。
在只考虑组间变异和误差变异时,称为单向方差分析。
此时ANOVA会自动处理均衡和非均衡数据。
在方差分析中,每次只研究1个指标时,称之为一元方差分析(简称ANOVA),同时考虑多个指标时,称之为多元方差分析(MANOVA)。
在这一节里,我们还将讨论协方差分析。
9.2.1 均衡数据的方差分析(ANOVA过程)1.过程格式PROC ANOVA 选项CLASS 变量表;MODEL 因变量表=效应;MEANS 效应[/选择项];2.使用说明(1)程序中,CLASS语句和MODEL语句是必需的,而且,CLASS语句必须出现在MODEL语句之前。
(2)CLASS语句中的变量是分类变量,可以是数值型,也可以是字符型。
(3)MODEL语句指明因变量和自变量(因子变量)效应。
效应是分类变量的各种组合,效应可以是主效应、交互效应、嵌套效应和混合效应。
对应的效应模型如下:·主效应模型MODEL y=a b c;模型中,a,b,c是主效应,y是因变量。
下同。
·交互模型MODEL y=a b c a*b a*c b*c a*b*c;模型中,a*b,a*c,b*c,a*b*c是交互效应。
·嵌套效应模型MODEL y=a b c(a b);模型中,c(a b)是嵌套效应。
·混合效应模型MODEL y=a b(a) c(a) b*c(a);(4)MEANS语句是选择语句,计算并输出所列的效应对应的因变量均值,若指明了选择项,则将进行主效应均值间的检验。
常用的选择项如下:BON、DUNCAN、LSD、REGWF、REGWO、SNK(Q检验)、SCHEFFE、SIDAK、SMM(GT2)、TUKEY、WALLER。
以上选择项在实际应用中,一般选择一种或两种方法即可。
ALPHA=p确定检验的显著性水平。
缺省值是0.05。
3.举例(1)完全随机设计资料的方差分析(单因素方差分析)某劳动卫生研究所研究棉布、府绸、的确凉、尼龙四种衣料吸附十硼氢量。
每种衣料各做五次测量,所得数据如下表。
试检验各种衣料吸附十硼氢量有没有显著差别?各种衣料间棉花吸附十硼氢量棉布府绸的确凉尼龙2.33 2.483.064.002.00 2.343.06 5.132.93 2.683.004.612.73 2.34 2.66 2.802.33 2.223.06 3.60程序: (yp115.sas)编程说明:数据步中,用循环控制变量a做分类变量,其水平数是4,分别代表不同的衣料。
过程步中,用CLASS语句指明一个因素a,用MODEL 语句反映出该因素的效果模型。
结果说明:在输出中,找CLASS语句指出的变量的P值。
此例中,P≤0.0003,可得出各衣料组间有非常显著差异。