第九章方差分析
- 格式:ppt
- 大小:506.00 KB
- 文档页数:46
第九章方差分析和回归分析第九章方差分析和回归分析内容提要1、方差分析(1)基本概念方差分析:通过随机抽样及数据处理,检验试验结果是否受试验条件这一类可控制因素显著影响,从而确认对质量指标影响主要来自哪一类因素,即用来鉴别所谓因素效应的有效统计分析方法.因素(因子):人为可以控制的实验条件称为因素或因子.水平:因素或因子的不同等级或因素所处的不同状态称为因素的不同水平. 单因素试验:试验中如果只有一个因素或因子在变化,其它可控条件保持不变,这样的方差试验称为单因素试验.多因素试验:试验中不止一个因素或因子在变化,称为多因素试验.若只有二个因素在变化就叫双因素试验.(2)单因素试验的方差分析设因素A 有j 个不同水平(r j ,,2,1 =),在总的r 个水平下均重复试验i 次(m i ,,2,1 =).每一个水平视为一个独立总体),(~2 j j j N X σμ,每个水平下总的m 次试验结果视为取自j X 的容量为m 的样本),,,,(21mj kj j j X X X X .单因素方差分析的一般方法步骤如下:1)提出待检假设H 0:μμμμ====r 21; 2)列方差计算表9-1,计算2A S 、2E S ; 3)选取建立F 统计量),1(~122r mr r F S S r r mr F EA--?--=,并计算F 统计量的值; 4)对给定的检验水平α,查F 分布表,找到F 统计量的临界值(表值); 5)比较得出结论:① 若计算值F F >临界值),1(r mr r F --α,拒绝H 0,即因素水平影响显著,或有显著影响;② 若计算值F F <临界值),1(r mr r F --α,接受H 0,即因素水平影响不显著或没有显著影响.单因素方差分析见表9-2.表9-1水平试验序号 1A 2A…j A… r A1 x 11 x 12 … x 1j … x 1r 2 x 12 x 22 … x 2j … X 2r … … … … … … … i x i 1 x i 2 … x ij … x ir … … … … … … …∑)(mx m 1x m 2… x mj… x mr∑=??=mi jj x T 11?T 2?T…j T ? …m T ?∑==r j j T x 1 212)(∑=??=m i j jx T21T22T…2jT…2mT∑=?=rj j T T 1 2*∑=?=m i jjxT 12221TT…2jT…2mT∑==rj j T T 1222、回归分析(1)基本概念回归分析:利用样本数据建立起相关变量之间相关关系的数学模型,并应用统计推断的一般法则,对相关关系进行有效的统计分析方法.一元线性回归模型为ε++=bx a Y ,),0(~2σεN 其中,a 、b 称为回归系数.(2)最小二乘法表9-2方差来源离差平方和方差自由度 F 统计量计算值F 临界值(表值)组间2AS12-r S A1-r2)1()(EAS r S r m F --=),1(r mr r F --α组内2E Sr mr S E-2r mr -总变差2TS12-mr S T1-n或1-mr线性回归方程可表示为 x b a y+=,可用最小二乘法求得回归系数的估计值:-=--=∑∑==x b y ax n x y x n y x b ni i ni i i 1221 或-=---=∑∑==x b y ax x y y x x b ni i ni i i ??)())((?121 令-=-=-=--=-=-=-=∑∑∑∑∑∑∑∑========n i n i i i yy n i ni i i i i xy n i n i ni i n i i i i xx y n y y y L y x n y x y y x x L xn x x n x x x L 1122211111221222)())(()(1)(则-==x b y a L L b xx xy ???(3)线性相关显著性检验检验回归方程x b a y+=是否有效,或x 、y 之间线性相关关系是否显著,只要检验回归系数0?=b是否成立.这个问题只存在下面两种可能==≠+=?≠=?=)0?(??)0?(0;??0?ax b y ax b a yb a yb 即,否即是,)2)11)表示y ?与x 无关即y 与x 没有线性相关关系,反过来,若不能否定1),就表示线性相关显著;2)有二种可能,都表示y 与x 之间线性相关关系成立.运用R 检验法进行线性相关显著性检验.R 检验法检验线性相关显著性或回归方程有效性的一般步骤为:1)提出检验假设:0H :0?=b; 2)选用统计量)2(~-=n R L L L R yyxx xy ,并计算R 值;3)在给定α下,查相关系数表得到临界值)2(-n R α; 4)比较得出结论:① 若)2(->n R R α,拒绝0H ,所求回归方程有效或线性相关显著;② 若)2(-<="" ,所求回归方程无效或线性相关不显著.=""> 疑难分析1、怎样区分讨论的问题是方差分析还是回归分析?实际问题所考察的指标y 往往既受因素i x 的影响,又受随机误差的影响.而因素又分为属性的和数量的.属性的因素一般无数量大小可言,只是性质的不同,如:种子的品种、机器的型号、加工的工艺、材料的品质等等.数量的因素,可以在一定范围内取值,如:人的身高、体重,试验的温度,产品的合格率等等.当所考虑的因素是属性时,问题属于方差分析的范围;当所考虑的因素是数量时,问题属于回归分析的范围.例题解析【例1】设某地区酿酒公司下属有1A 、2A 、3A 、4A 共4个酒厂.公司总经理为提高酒的质量,开展质量评优活动,随机地从4个酒厂各抽取3瓶样酒,指定同一名品酒员按事先规定的色、香、味质量标准评分,评分结果的原始数据如表9-3所示.表9-3厂别试验序号 1A 2A 3A 4A1 5 8 7 112 6 9 8 10 36 8 6 12试问:不同酒厂对酒的质量有无显著影响(05.0=α)?解:(1)提出待检假设H 0:μμμμ====r 21;(2)列方差计算表,如表9-4所示. 利用表中最后一列,即(∑)列的数据计算表9-4水平试验序号 1A 2A3A4A1 58 7 11 2 6 9 8 10 368612(∑)∑=??=mi jj x T 117 25 21 33∑==r j j T x 1=96212)(∑=??=mi j jx T 289 625 441 1089∑=?=rj j T T 12*=2444∑=?=mi jjxT 12297 209 149 365∑==rj j T T 122=82033.52444318201*22=?-=-=T m T S E 67.4612 96244431122*2=-?=-?=?mr x T m S A(3)选F 统计量并求F 计算值和临界值)8,3(~38144122222F S S S S F EA E A=?--= 35.2333.5367.468=??=F又查附表5, 07.4)8.3(05.0=F(4)比较得出结论因为)8,3(35.2305.0F F >>=,拒绝H 0,即表示不同酒厂对酒的质量有显著影响.这里αF F >>,可认为因素水平影响特别显著,事实上由原始数据可见,4A 评分特别高,直观上已可判断有显著差异,说明分析的结论是符合实际情况的,也证明了方差分析的科学性.【例2】设有某种创汇商品在国际市场上需求量q (单位:万件),价格p (单位:万美元/件).根据往年市场调查获悉q 与p 之间的一组调查数据如表9-5所示.表9-5价格 p i 2 4 4 4.5 3 4.2 3.5 2.5 3.3 3 需求量 q i6 2 2 1 4 1.5 2.8 5.1 3.4 4.2如果今年该商品预定价为p =4.6(万美元/件),要求根据往年资料建立的q 对p 的回归方程,进行线性相关性是否显著,并预测国际市场上今年的需求量大致为多大?(05.0=α)解:根据样本数据,用最小二乘法求a、b ?的值.04.24.3108.1212.34.31017.97)(1010?222-=?-??-=--=∑∑iiiii p p q p q p b136.104.3)04.2(2.3??=?--=-=p b q a将a、b ?的值代入得到所要求的引例中需求量q 对价格p 的回归方程为 p q04.2136.10?-=. 对所建立的q 对p 的回归方程进行线性相关性显著检验:1)提出待检假设0H :0?=b; 2)选用统计量)2(~-=n R L L L R qqpp qp ,并利用回归计算的结果计算R :因为∑==-=1012268.5)(10i ipp p pL ;63.1110101-=-=∑=i i i pq q p q p L ;∑==?-=-=1012229.23)2.3(103.126)(10i i qq q q L所以 998.09.2368.563.11=?-=R ;3)查附表7得到 632.0)8(05.0=R ; 4)结论∵)2(->n R R α,拒绝0H ,即q 对p 的回归方程有效或线性相关性显著.经检验说明:回归方程p q04.2136.10?-=有效,可以用于预测. 当p =4.6时,国际市场上今年对该商品的需求量大致为:10.136-2.04×4.6=0.752(万件).。
知识是人类进步的阶梯第九章方差分析【思考与练习】一、思考题1. 方差分析de根本思想及其应用条件是什么?2. 在完全随机设计方差分析中SS、、SS且间、SS且内各表示什么含义?3. 什么是交互效应?请举例说明.4. 重复测量资料具有何种特点?5. 为什么总de方差分析de结果为拒绝原假设时,假设想进一步了解两两之间de差别需要进行多重比拟?二、最正确选择题1. 方差分析de根本思想为A. 组问均方大丁组内均方B. 误差均方必然小丁组问均方C. 总变异及其自由度按设计可以分解成几种不同来源D. 组内方差显著大丁组问方差时,该因素对所考察指标de影响显著E. 组问方差显著大丁组内方差时,该因素对所考察指标de影响显著2. 同一两样本均数比拟de资料,方差分析de结果与f检验de结果卜A.理论上不同*完全等价AF PC.完全等价F = F /D不同,,检验de结果更可靠wE.不同,方差分析de结果更可靠3. 完全随机设计de方差分析中,以下式子正确de选项是A.SS皇=$羽十5&时B., A£S t= US.E +A£f a_ +-1c. ss成巧> SS成内+JD,担Sjj闻> MS皿,E一% <54. 总de方差分析结果有P<0.05,那么结论应为A. 各样本均数全相等B. 各总体均数全相等C. 各样本均数不全相等D. 各总体均数全不相等E. 至少有两个总体均数不等5. 对有k个处理组,b个随机区组de资料进行双因素方差分析, 其误差de自由度为A. kb - k - bB. kb - k - b -1C. kb -k - b -2D. kb - k - b 1E. kb -k - b 26. 2 2析因设计资料de方差分析中,总变异可分解为A. MS 总=MS B+MS AB. MS 总=MS B+MS误差C. S&、= SS B SS吴差D. SS = S$ SS SS吴差E. SS、=SS +S& +SS A B +SS吴差7. 观察6只狗服药后不同时间点〔2小时、4小时、8小时和24小时〕血药浓度de 变化,本试验应选用de统计分析方法是A. 析因设计de方差分析B. 随机区组设计de方差分析C. 完全随机设计de方差分析D. 重复测量设计de方差分析E. 两阶段交义设计de方差分析8. 某研究者在4种不同温度下分别独立地重复10次试验,共测得某定量指标de 数据40个,假设采用完全随机设计方差分析进行统计处理,其组问自由度是A. 39B. 36C. 26D. 9E. 39. 采用单因素方差分析比拟五个总体均数得P < 0.05 ,假设需进一步了解其中一个对照组和其它四个试验组总体均数有无差异,可选用de检验方法是A. Z检验B. t检验C. DunnettT 检验D. SNK -q 检验E. Levene 检验三、综合分析题1. 某医生研究不同方案治疗缺铁性贫血de 效果,将36名缺铁性贫血患者随机等分为3组,分别给予一般疗法、一般疗法+药物A低剂量,一般疗法+药物A高剂量三种处理,测量一个月后患者红细胞de升高数〔102/L〕,结果如表9-1所示.问三种治疗方案有无差异?表9-1三种方案治疗一个月后缺铁性贫血患者红细胞de升高数〔102/L〕编亏一般疗法一般疗法+A1 一般疗法+A21 0.81 1.32 2.352 0.75 1.41 2.503 0.74 1.35 2.434 0.86 1.38 2.365 0.82 1.40 2.446 0.87 1.33 2.46 7 0.75 1.43 2.408 0.74 1.38 2.439 0.72 1.40 2.21 10 0.82 1.40 2.45 110.80 1.34 2.38 120.751.462.402. 在药物敏感试验中,欲比拟三种弥散法de 抑菌效果,每种方法均采用三种药 物,观察其抑菌效果,以抑菌环de 直径为观察指标,结果如表 9-2所示,试比拟三种方法de 抑菌效果.表9-2 三种药物在不同弥散法下de 抑菌效果 (mm) 药物 -挖洞27.524.3 20.0 黄艮27.6 24.6 21.0 26.9 25.0 20.627.327.7 20.820.9 24.6 19.1 炒21.2 24.7 19.3 20.5 23.9 18.721.324.818.527.422.0 29.6 青霉素27.6 21.7 30.2 26.9 21.8 29.526.722.330.43. 某试验研究饮食疗法和药物疗法降低高胆固醇血症患者胆固醇de 效果有无差 别,随机选取14名高胆固醇血症患者,随机等分为两组,分别采用饮食疗法和 药物疗法治疗一个疗程,测量试验前后患者血胆固醇含量,结果如表 9-3所示,请问两种疗法降胆固醇效果有无差异.表9-3不同治疗方法下胆固醇变化情况 (mmol/L)4 6.94 6.64 7.31 6.835 9.17 8.42 6.81 6.736 7.61 7.22 8.16 7.657 6.60 6.65 6.98 6.524. 为研究某中学初一年级、初二年级和初三年级学生周日锻炼时间情况,从这三个年级中各随机抽取20名学生,调查得到学生周日锻炼时间如下表9-4所示问这三个年级学生周日锻炼时间是否不同?表9-4初中不同年级学生de锻炼时间〔分〕三年级37.856 59.164 48.77870.793 36.650 51.05786.928 38.511 47.60958.785 48.945 48.42873.923 29.367 42.81461.435 41.988 52.30364.130 69.419 54.32767.169 33.109 35.59149.099 38.872 55.01362.728 53.401 36.08452.534 62.814 21.30745.230 38.454 46.41940.400 32.802 41.83644.399 37.683 37.48133.091 48.944 35.78163.469 48.869 31.35441.704 41.920 45.19062.268 46.859 40.92458.209 65.067 38.87763.319 38.403 27.259经数据分析结果见下表:表9-5 三个年级之间de t检验结果组别t P一年级和二年级2.85 0.0071一年级和三年级4.09 0.0002二年级和三年级1.12 0.2710问:(1)该资料采用de是何种统计分析方法?(2) 所使用de统计分析方法是否正确?为什么?(3) 假设不正确,可以采用何种正确de统计分析方法.请作分析?【习题解析】一、思考题1. 方差分析de根本思想是把全部观察值de总变异按设计和需要分解成两个或多个组成局部,然后将各局部de变异与随机误差进行比拟, 来判断总体均数问de差别是否具有统计学意义.应用条件:各样本是相互独立de随机样本,且服从正态分布,各样本方差齐性.2. S&是各观测值与总均值之差de平方和, 即总离均差平方和,表示总变异de大小;SS且间表示组问变异,指各处理组均值大小de不同,是由处理因素和随机误差造成de;SS且内表示组内变异,指同一处理组内部各观察值之间de变异,是由随机误差造成de.3. 交互效应是指某一因素de效应随另一因素不同水平■de变化而变化,称这两个因素之间存在交互效应.例如:某实验研究A、B两种药物在不同剂量情况下对某病de治疗效果,药物A 在不同剂量时,B药de效应不同,或者药物B在不同剂量时,A药de效应不同,那么A、B两药问存在交互效应.4. 重复测量资料中de处理因素在受试者问是随机分配de,受试者内de因素即时间因素是固定de,不能随机分配;重复测量资料各受试者内de数据彼此不独立, 具有相关性,后一个时间点de数据可能受到前面数据de影响, 而且时间点离得越近de数据相关性越高.5. 方差分析中备择假设是多个总体均数不等或不全相等,拒绝原假设只说明多个总体均数总de 来说差异有统计学意义,并不能说明任意两总体均数之间均有差别.因此,假设希望进一步了解两两问de差异,需进行多重比拟.二、最正确选择题1. C2. C3. A4. E5. D6. E7. D8. E9. C三、综合分析题1.解:此题采用完全随机设计de方差分析表9-6 二种万荣治疗个月后缺铁性贫血患者红细胞de升高数: (102/L)一般疗法一般疗法+A1 一般疗法+A2 合计0.81 1.32 2.350.75 1.41 2.500.74 1.35 2.430.86 1.38 2.360.82 1.40 2.440.87 1.33 2.46X 0.75 1.43 2.400.74 1.38 2.430.72 1.40 2.210.82 1.40 2.450.80 1.34 2.380.75 1.46 2.40n i 12 12 12 36 (n)'X i 9.43 16.60 28.81 54.84( ' X )X i 0.7858 1.3833 2.4008'X i27.4385 22.9828 69.2281 299.6494(、X ) (1) 方差分析1)建立检验假设,确定检验水准H.:即三种方案治疗后缺铁性贫血患者红细胞升高数相同Hi :九、匕、气不全相同,即三种方案治疗后缺铁性贫血患者红细胞升高数不全相同:=0.052)计算检验统计量C =('X)2/N = (54.84)2/36=83.5396-- . —2 _ 2 _SS、= ' (X -X) 八X -C =99.6494-83.5396=16.1098v总=N -1 =36-1=3 5SS且间=' ng -X)2= \' X j)2,n i -C一.2 一一 2 __ __ 2,9.43 16.60 28.81、=(-------- ---------- ----------- )-83.5396 =16.002212 12 12v 组间=k —1 =3—1 = 2S 两内=S&、一S 寄间=16.1098—16.0022= 0.1076v 组内=N —k=33-MS 绢间 SS 祯/v 绢间 F — • = 2452.7216MS 组内SS 且内/v 组内 方差分析结果见表9-7表9-7完全随机资料de 方差分析表3〕确定P 值,作出统计推断查F 界值表〔附表4〕得P<0.01,按a =0.05水准,拒绝H 0 ,接受H 1 ,差异有 统计学意义,可以认为三种不同方案治疗后患者红细胞升高数de 总体均数不全相 同. ⑵ 用Dunnett-t 法进行多重比拟 1〕建立检验假设,确定检验水准H0:任一实验组与对照组de 总体均数相同 H 1 :任一实验组与对照组de 总体均数不同-=0.052〕计算检验统计量MS e =0.0033 n 〔 = n 2 = n 3=12 「「 1 1 1 1S i= \MSe(n T 、「"0033(12 12)=0.02表9-8 多个样本均数de Dunnett-t 检验计算表将表9-8中t D 取绝对值,并以计算 MS e 时de 自由度 *=33和实验组数 a=k-1=2〔不含对照组〕查Dunnett-t 界值表得P 值,列丁表中.按a =0.05水准, 一般疗法+A1与一般疗法相比,疗效差异有统计学意义,可以认为一般疗法+A1与一般疗法治疗缺铁性贫血疗效不同. 同理,可以认为一般疗法+A2与一般疗法治疗缺铁性贫血疗效不同SPSS操作数据录入:翻开SPSS Data Editor® 口,点击Variable View标签,定义要输入de变量, group表示组另U 〔1为一般疗法,2为一般疗法+药物A低剂量,3为一般疗法+ 药物A高剂量〕,x表示患者红细胞de升高数〔102/L〕;再点击Data View标签,录入数据〔见图9-1,图9-2〕.图9-1 Variable View窗口内定义要输入de变量group和x图9-2 Data View窗口内录入数据分析:Analyze Compare Means one-Way ANOV ADependent List 框:xFactor 框:groupPost Hoc—> Equal Variances Assumed:【♦Dunnett: Control Category : firstContinuEOption... r Statistics:I/ Homogeneity of Variances testContinueOK输出结果Test of Homogeneity of Variances(102/L)红细胞升高数(102/L)Multiple Comparisons2 Dependent Variable:红细胞升局数(10 /L)- 一一 _ aa Dunnett t-tests treat one group as a control, and compare all other groups against it.2. 解:此题采用析因设计de方差分析.表9-9 九种不同处理情况下抑菌环de直径(mm)纸片弥散法a〔挖洞弥散a2 钢圈弥散a3稣地青霉素青霉素青霉素合计b1 b2b3 b1 b2b3 b1 b2b327.5 20.9 27.4X 24.3 24.6 22.0 20.0 19.1 29.627.6 21.2 27.6 24.6 24.7 21.7 21.0 19.3 30.226.920.5 26.9 25.0 23.9 21.8 20.6 18.7 29.527.3 21.3 26.7 27.7 24.8 22.3 20.8 18.5 30.4n i 4 44 4 4 4 4 4 4 36 "X i 109.3 83.9 108.6101.698.087.882.4 75.6 119.7866.9n A1212 12n B1212 12、XA301.8 287.4 277.7、XB293.3 257.5316.1(1)建立检验假设,确定检验水准 因素AH o :三种弥散方法抑菌环直径de 总体均数相等H i :三种弥散方法抑菌环直径de 总体均数不全相等 因素B Ho :三种药物抑菌环直径de 总体均数相等 H 1 :三种药物抑菌环直径de 总体均数不全相等 AB 交互作用Ho :不同药物对三种弥散方法de 抑菌效果无影响 H i :不同药物对三种弥散方法de 抑菌效果有影响 :=0.05 (2)计算检验统计量C =(' X)2/N =(866.9)2/36 = 20875.4336 S&、=' X 2 -C =21322.83-20875.4336=447.3964=N —1=36—1 =35283.92 119.72 -+ +川+ )-20875.4336=436.6339 4 4v 处理=k 一1 = 82 -rr -2287土 玄7二)—20875.4336 = 24.50721212% = A de 水平■数-1=22 :109.383.9S —"C=(二2 SS A 八(' XAf.'nA-CT 30!812MS A=竺=24507= 12.2536 '••A22Q3 32257 52316 12SS B (' X B)2n B—C =(. —— ― )- 20875.4336 = 145.4289 12 12 12v B = B de 水平■数-1 =2SS 145.4289MS B = * =72.7145'.•BS&B = S$里- S& - S& = 266.6978AB ='.•处理 一'3 一" =4SS AB 266.6978MS AB =」B = ------- = 66.6745 '•ABSS 吴差=SS 、-S$M 理= 10.7625.误差=N —k =36-9 =27SS 吴差 10.76250.398627MS 误差FBF ABM S AMS 1 2. 253 0. 39860. 74 1 6=些=*^=182.4247MS 误差 0.3986MSAB66.6745167.2717MS 吴差0.3986方差分析结果见表9-10变异来源 SS VMS FP总变异 447.3964 35处理436.6339 8A 24.5072 2 12.2536 30.7416 <0.05B 145.4289 2 72.7145 182.4247 <0.05 AB266.6978 4 66.6745167.2717<0.05误差10.7625270.3986表9-10析因设计资料de 方差分析表根据V,查F界值表〔附表4〕得相应P值.交互作用de F=167.2717, P<0.05, 按a =0.05水准,拒绝H0,接受H1 ,差异有统计学意义,可以认为弥散方法和药物抑菌效果两者之间存在交互作用. 这时,如要分析A因素或B因素de单独效应,应固定在A因素de基线水平■来分析B因素de作用,或者固定在B因素de基线水平■来分析A因素de作用.SPSS操作数据录入:翻开SPSS Data Editor® 口,点击Variable View标签,定义要输入de变量,g1表示三种弥散方法〔1为纸片,2为挖洞,3为钢圈〕,g2表示三种药物〔1为黄共,2为大黄,3为宵霉素〕,x表示抑菌效果〔mm〕;点击Data View标签,录入数据〔见图9-3,图9-4〕.图9-3 Variable View窗口内定义要输入de变量g1、g2和x图9-4 Data View窗口内录入数据分析:Analyze General Linear Model UnivariateDependent List 框:xFixed Factor 框:g1、g2OK输出结果Tests of Betw een-Subjects Effects3. 解:此题可采用t检验分析,但最好采用重复测量资料de方差分析. 因重复测量资料de方差分析计算量较大,故此题不给出笔算结果,仅提供SPSS软件分析结果.(1) 建立检验假设,确定检验水准处理因素KH0 :饮食疗法和药物疗法降低胆固醇值de总体均数相同H I :饮食疗法和药物疗法降低胆固醇值de总体均数不相同时间因素IH0:试验前后患者胆固醇值de总体均数相同H I :试验前后患者胆固醇值de总体均数不相同交互作用KIH0:时间对两种方法降低胆固醇de效果无影响H1 :时间对两种方法降低胆固醇de效果有影响:=0.05(2) 计算检验统计量本例是最简单de重复测量设计,时间因素只有两个水平,可以用重复测量de 方差分析进行计算,由丁时间点只有两个水平, 可以不考虑球形对称问题.列出方差分析表见表9-11:表9-11重复测量资料de方差分析表SS V MS F P总变异14.197 27处理0.168 1 0.168 0.153 0.703个体间误差13.196 12 1.100时间0.445 1 0.445 13.921 0.003处理州间0.004 1 0.004 0.122 0.733个体内误差0.384 12 0.032⑶确定P值,作出统计推断时间因素和治疗方法之间de交互作用,F值为0.122, P值为0.733,按口=0.05 水准,不拒绝H.,差异无统计学意义,尚不能认为时间和疗法之间存在交互作用;对丁时间因素,F值为13.921, P值为0.003, P<0.001,按a =0.05水准, 拒绝H0,接受H1 ,差异有统计学意义,可以认为试验前后患者胆固醇de值不同;两种治疗方法de F值为0.153, P值为0.703, P>0.05,按a =0.05水准,不拒绝H0 , 差异无统计学意义,尚不能认为饮食疗法和药物疗法之间具有差异.SPSS操作数据录入:翻开SPSS Data Editor® 口,点击Variable View标签,定义要输入de变量, no表示编号,g 表示分组〔1为饮食疗法,2为药物疗法〕,t1表示实验前患者胆固醇de值〔mmol/L〕 , t2表示实验后患者胆固醇de值〔mmol/L〕;击Data View标签, 录入数据〔见图9-5,图9-6〕.Filt Edit View Data transform Ainalyifr Graphs Utili ti nd&w Melp诊Q|A|风]J tdJd M|通蓟圜剑匿I栏剑< | ►|\ Data View | ♦SPSS Processor is ready图9-5 Variable View窗口内定义要输入de变量no、g、t1和t2图9-6 Data View窗口内录入数据分析:Analyze General Linear Model Repeated MeasuresWithin-Subject Factor name :改为tNumber of Levels :键入 2 Add |Define :Within-Subjects Variables [t] : t1 〜t2Between- Subjects Factor [s] : g Model : • Customr Within-Subjects Model : tr Between-Subjects Model : g Continue函输出结果Mauchly's Test of Sphericity(b)Tests of W ithin-Subjects EffectsTests of Betw een-Subjects EffectsMeasure: MEASURE_14. (1)该资料采用de是两独立样本t检验作两两比拟.(2) 所使用de统计分析方法错误.欲比拟三组均数是否两两不同,用两独立样本t检验作屡次比拟,会增大犯I型错误de概率.(3) 应领先采用完全随机设计方差分析,假设分析结果拒绝H0,那么进一步采用SNK法作三组问de两两比拟.完全随机设计方差分析1)建立检验假设,确定检验水准H.:三个年级锻炼时间de总体均数相等H I :三个年级锻炼时间de总体均数不全相等,即至少有两个总体均数不等:=0.052)计算检验统计量C =('X)2/N = (2887.142) 2/60=138926.4821 22SS 、= *X _X)2 八 X 2 -C =148914.9985-138926.4821=9988.5164v 总=N 』=60—1=59SS 且间=' MX ] -又)2 =、(' XS.n -C911.241838.432)-138926.4821「2431.72312020¥组间=k -1 =3 -1 = 2SS 且内=SS 、- SS 且间=7556.7933v 组内=N -k=57亡MS 组间SS 且间/v 组间…… F = --------- = ---------------- = 9.1711MS 组内SS 且内/v 组内 方差分析结果见表9-12.表9-12方差分析表SS vMSFP总变异 9988.5164 59组间2431.7231 2 1215.86159.17<0.01组内7556.793357132.5753多个样本均数问比拟见表9-13表9-13 SNK 检验计算表q 界值A 与BX A - XB标准误q包含组数--P& XA Ba0.05 0.01(1) (2) (3) (4)=(2)(3) (5) (6) (7) (8) 1与3 14.9519 2.5746 5.8075 3 3.44 4.37 <0.01 1与2 11.3114 2.5746 4.3935 2 2.86 3.82 <0.01 2与33.64052.57461.414022.863.82>0.053〕确定P 值, 作出统计推断方差分析结果P<0.01,按« =0.05水准,拒绝H 0,接受H 1 ,差异有统计学意义,可以认为三个年级锻炼时间de 总体均数不全相等; 多个均数问de 两两比拟 de SNK 检验结果提示:可以认为一年级和二年级、一年级和三年级de 锻炼时间 不同;尚不能认为二年级和三年级de 锻炼时间不同.1137.469220SPSS操作数据录入:翻开SPSS Data Editor® 口,点击Variable View标签,定义要输入de变量, group表示组另U 〔1为一年级,2为二年级,3为三年级〕,x表示锻炼时间〔分〕;再点击Data View标签,录入数据〔见图9-7,图9-8〕.图9-7 Variable View窗口内定义要输入de变量x、g图9-6 Data View窗口内录入数据分析:Analyze — Compare Means^ ONEWAY-ANOVADependent List 框:锻炼时间(x)Factor 框:gPost Hoc 卜Equal Variances Assumed " S-N-KContinueOption... — Statistics: v Homogeneity of Variances testContinue知识是人类进步的阶梯亟输出结果Test of Homogeneity of Variances 锻炼时间ANOVA锻炼时间文档如有冒犯,请站内留言,谢谢!。
第九章 t 检验和方差分析在科研中,我们往往是根据样本之间的差异,去推断其总体之间是否有差异。
样本差异可能是由抽样误差所致,也可能是由本质的不同所致。
应用统计学方法来处理这类问题,称为“差异的显著性检验”。
若已知总体为正态分布,进行差异的显著性检验,称为“参数性检验”,SAS 中M EANS 、TTEST 、ANOVA 、GLM 等均属此类检验;若未知总体分布,进行差异的显著性检验,称为“非参数性检验”,SAS 中采用NPAR 1WAY 过程。
第一节 t 检验9.1.1 简介t 检验是用于两组数据均值间差异的显著性检验。
它常用于以下场合: 1.样本均值与总体(理论)均值差别的显著性检验检验所测得的一组连续资料是否抽样于均值已知的总体 根据大量调查的结果或以往的经验,可得到某事物的平均数(例如生理生化的正常值),以此作总体均值看待。
SAS 中采用MEAN S 过程,计算出观察与总体均值的差值,再对该差值的均值进行t 检验。
2.同一批对象实验前后差异的显著性检验(自身对照比较)或配对资料差异的显著性检验(配对比较检验)比如,在医学研究中,我们常常对同一批病人治疗前后的某些生理生化指标(如血压、体温等)进行测量,以观察疗效;或对同一批人群进行预防接种,以观察预防效果;或把实验对象配成对进行测定,比较其实验结果。
SAS 中采用MEAN S 过程,计算出两样本观察的差值(如治疗前、后实验数据的差值),再对该差值的均值进行t 检验。
3.两样本均值差异的显著性检验作两样本均值差异比较的两组原始资料各自独立,没有成对关系。
两组样本所包含的个数可以相等,也可以不相等。
每组观测值都是来自正态总体的样本。
设与为两样1X 2X 本的均值,1n 与为两样本2n 数,21s ,22s 为两样本方差,分两种情形,其数学模型为:(1)方差齐(相等)时:)/1/1(21221n n s x x t +-=)2/(])1()1[(212222112-+-+-=n n s n s n s(2)方差不齐时: 22212121//n s n s x x t +-=SAS 中采用TTES T 过程,先作方差齐性检验(F 检验),然后根据方差齐(EQUAL )和方差不齐(UNEQU AL)输出t 值和P 值以及基本统计量。