利用SPSS_进行方差分析以及正交试验设计
- 格式:doc
- 大小:558.50 KB
- 文档页数:10
方差分析是用于两个及两个以上样本均数差别的显著性检验。
由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。
方差分析的基本思想是:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
方差分析主要用途:①均数差别的显著性检验,②分离各有关因素并估计其对总变异的作用,③分析因素间的交互作用,④方差齐性检验。
在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。
通常是比较不同实验条件下样本均值间的差异。
例如医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同化学药剂对作物害虫的杀虫效果等,都可以使用方差分析方法去解决。
方差分析原理方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:(1) 随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,记作SS w,组内自由度df w。
(2) 实验条件,实验条件,即不同的处理造成的差异,称为组间差异。
用变量在各组的均值与总均值之偏差平方和表示,记作SS b,组间自由度df b。
总偏差平方和 SS t = SS b + SS w。
组内SS t、组间SS w除以各自的自由度(组内dfw =n-m,组间dfb=m-1,其中n为样本总数,m为组数),得到其均方MS w和MS b,一种情况是处理没有作用,即各组样本均来自同一总体,MS b/MS w≈1。
另一种情况是处理确实有作用,组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。
那么,MS b>>MS w(远远大于)。
MS b/MS w比值构成F分布。
用F值与其临界值比较,推断各样本是否来自相同的总体。
方差分析的假设检验假设有m个样本,如果原假设H0:样本均数都相同即μ1=μ2=μ3=…=μm=μ,m个样本有共同的方差。
SPSS13.0在空白列正交试验设计及其数据处理中的应用SPSS13(0在空白列正交试验设计及其数据处理中的应用 ?426?中国卫生统计2007年8月第24卷第4期 SPSS13.0在空白列正交试验设计及其数据处理中的应用山东省临沂市疾病预防控制中1~,(276001)王如德山东省平邑县临涧中心卫生院(273300)怀燕泰山医学院预防医学教研室(271000)程琮正交试验设计(orthogonalexperimentdesign)对多因素,多水平的试验具有设计,计算简便,节省实验单元,统计效率高等优点,故在药物拆方,药品制备工艺, 试验条件的优化等方面运用广泛.但是利用SPSS系统随机产生的正交设计表,进行正交试验设计及其数据处理方面,仅有无空列非重复正交试验设计的个案报道【1;在无空列重复正交试验设计(也称有重复正交试验设计)和空白列正交试验设计方面,未见报道. 本文利用SPSS系统随机产生的无空列重复正交试验设计表及空白列正交试验设计表,以教科书例题作为模拟数据,用sPss13.0处理模拟的结果,并与SAS 8.1运行结果比较.通常,人们必须查阅专用正交设计书籍,利用标准正交设计表安排实验因素,但在sPss软件广泛应用的今天,对于常用的L8(2),(3)等正交表,可利用其DATA命令菜单创建.1.创建正交表的一般步骤打开SPSS系统,点击DATA,在其下拉菜单中有 OrthogonalDesign,点击Generate…,出现Generate0r—thogonalDesign对话框,在FactorName框中输入分析变量如fl,点击Add按钮;同理,按正交表的要求依次输入其他变量,有空白列变量的,也要输入.第二,变量水平数的输入:选定a,点击DefineValues,出现 GenerateDesign对话框,在Value栏中分别输入fl因素的水平数,如1,2或1,2,3,点击Continue返回,同理依次输入其他变量的水平数,之后在Datafile中选 ReplaceWorkingdatafile,点击OK系统创建正交表. 整理正交表,按此表进行试验取得数据,可用Excel建立数据集,以便用SPSS或SAS软件调用此数据集. 2.空白列正交试验设计影响钉螺产卵的因素【2J有温度A1=5?,A2= 10?,含氧量B1=0.5,B2=5.0,含水量C1=10%, C2=30%,PH值D1=6.0,D2=8.0,欲研究各因素不同水平对钉螺产卵数有无影响及AxB的交互作用. 根据正交表的选用原则【0可选用L8(2)正交表,SPSS 随机创建的正交表整理如下.该随机正交表与教科书【J的正交表略有不同,但SPSS13.0与SAS8.1软件运行结果与教材结果一样.表1SPSS系统随机创建的(2)iE交表及模拟数据 noababC1516d用Excel将表1建立数据集,打开SPSS13.0,将 Excel调入形成SPSS数据集后,点击Analyze--~Gener— nalLinearModels--~Univariate对话框将因变量Y调入DepentVariable框中,将因素变量fl,b,ab,C,d调入 FixedFactors中--~Model,选定Custom,将fl,b,ab,C,d(主效应)调入model框--~Continue返回一Option一将因素变量a,b,ab,C,d 调入DisplayMeansfor框一Con— tinue返回一OK.SPSS13.0和SAS8.1运行结果分别见表2,表3.表2DependentVariableY方差分析SPSS输出结果虬鼢裙ChineseJourmlofHealthStatistics,Au22007,Vo1.24,No.4表3DependentVariableY方差分析SAS输出结果 3.无空列重复正交试验设计影响胃蛋白酶生产质量的因素有A水解温度,B 水解时间,C加盐量,D烘房温度,各因素取三个水平, 测量指标为残留蛋白x(每个因素测量三个数据,共有 27个数据).以此测量结果[】作为SPSS系统随机正交表的模拟数据.SPSS系统随机创建的(3)正交表整理如下(表4)该数据集为5列27行,运行程序从Analyze到因变量x,因素变量abCd调入,与前述步骤一样,不同之处在于Option一将因素变量abCd调入Display Meansfor框后,在其下框选定Comparemaineffects--~Continue返回?OK.该模拟结果见表5与金丕焕SAS结果一致. 表4SPSS系统随机创建的L9(3)正交表及模拟数据 1231212表5DependentVariablex方差分析结果小结使用SPSS软件可以很方便地设计正交表,处理数据简便快捷,结果准确,在实际工作中值得推广使用.利用SPSS之DATA命令菜单创建的正交表是随机的,即在统一状态下每运行一次,创建的正交表不同,但都满足正交表必备的两个性质[引.得到正交表后,根据实际要求,选用一个正交表,安排试验. 因此,利用SPSS之DATA命令菜单创建的正交表之前,必须对正交表的性质,如何选正交表及其交互作用列号(3,53(有交互项时)有所了解.文献[报道的正交表设计,未指出SPSS系统设计随机化,且使用的正交表也是常用的格式.正交表性质:(1)每一列中,不同的数字出现的次数相等. (2)任意两列中出现的数对次数相等,如(1,1), (1,2),(2,1),(2,2)数对.凡满足上述两个性质的表就称为正交表. 正交表选择原则一般是根据:(实验因子水平数一1)×因子数+1; 若有交互影响,再加上交互作用因子的自由度乘以交互作用因子数,即是最少需超过的实验次数,最后根据最少需超过的实验数和因子水平数选用正交表. 参考文献1.侯卫雄,李思华.SPSS11.5forwindows在药学研究领域中的应用.数理医药学杂志,2004.17(5):458.459.:东南大学出版社.2003.55. 2.沈其君主编.SAS统计分析.南京3.金良超主编.正交设计与多指标分析.第1版.北京:中国铁道出版社.1988.4.金丕焕.苏炳华,贺佳.主编.医用SAS统计分析,上海:复旦大学出版社.2002.50.5.孙振球,徐勇勇主编.医学统计学.北京:人民卫生出版社.2004.189.4237O88411OOO1OOO335562973O1OOO1OOO35748197321OOO1OOO3。
实习三方差分析(analysis of variance--- ANOV A )一、目的要求1、掌握方差分析的应用条件2、掌握方差分析的基本思想3、掌握方差分析的用途4、掌握常用方差分析的方法(完全随机设计、随机区组设计方差分析)5、掌握多个样本均数间的两两比较方法(a. 两两比较:SNK法(q检验);b.对照组与各处理组比较:LSD法)。
二、完全随机设计的方差分析(One-Way ANOVA)One-Way ANOVA过程用于进行两组及多组样本均数的比较,即完全随机设计(成组设计)的方差分析,如果做了相应选择,还可进行随后的两两比较。
P432第8题:某职业病防治院对某石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,结果如下表所示。
问三组石棉矿工的用力肺活量有无差别?三组石棉矿工的用力肺活量(L)石棉肺患者可疑患者非患者1.82.3 2.91.42.13.21.52.1 2.72.1 2.1 2.81.92.6 2.71.72.5 31.82.33.41.92.4 31.82.43.41.8 3.32.03.5建库:1、点击Variable View: 定义分类变量(组别)和应变量(用力肺活量)2、点击Data View,输入数据:3、分析过程界面说明:【Dependent List框】(选入应变量)选入需要分析的变量,可选入多个结果变量(应变量)。
【Factor框】(因素,即选入一个分类变量)选入需要比较的分组因素,只能选入一个。
【Contrasts钮】(线性组合比较,如检验均数之间差异大小的关系,均数间的线性趋势等)【Post Hoc钮】(各组均数的多重比较)弹出Post Hoc Multiple Comparisons(多重比较)对话框,用于选择进行各组间两两比较的方法,有:Equal Variances Assumed复选框组一组当各组方差齐时可用的两两比较方法,共有14中种这里不一一列出了,其中最常用的为LSD和S-N-K法。
SPSS试验方差分析方差分析是一种用于检验多组数据之间差异是否显著的方法。
在SPSS软件中,方差分析的主要功能实现在“分析-方差”菜单项下,包括单因素方差分析、方差分析比较两个或多个均值以及重复测量方差分析等。
单因素方差分析单因素方差分析适用于只有一个自变量的情况。
单因素方差分析的目的是确定这个变量不同水平之间的差异是否显著,如果显著则可以得出结论,这个自变量对因变量有显著影响。
为了进行单因素方差分析,需要输入数据并选择相应的分析选项。
例如,假设有两个班级,每个班级有10个学生。
这些学生分别接受了两个不同的课程,然后根据每个班级的平均成绩,我们想测试课程是否有显著差异。
在SPSS中进行单因素方差分析,需要先添加数据并确定自变量和因变量。
步骤:1. 打开SPSS,导入数据文件。
2. 选择“分析”菜单,并在“方差”子菜单下选择“单因素方差分析”。
3. 将自变量和因变量放入相应的输入框中。
4. 点击“设置”按钮,设置所需的分析选项。
在输出窗口中,可以看到方差分析表,其中包括相关参数的显著性水平(P值),以及F值和相应的自由度。
根据F值和P值,可以得出结论,即该自变量对因变量是否有显著影响。
方差分析比较两个或多个均值方差分析比较两个或多个均值的目的是确定两个或多个独立样本(平均值)之间的差异是否显著。
通常,此类数据需要存储在两个或多个变量中。
为了进行方差分析比较两个或多个均值,需要选择适当的分析选项。
重复测量方差分析重复测量方差分析用于比较两个或多个组的平均值,其中每个组都接受了多次测量。
这种方法通常适用于测试同一组受试者在不同时间或不同条件下的表现,并检测差异是否显著。
为了进行重复测量方差分析,需要选择适当的分析选项。
实验报告课程名称试验设计与数据分析姓名邵建智学号3110100122专业生物系统工程实验名称试验设计结果分析浙江大学生物系统工程与食品科学学院二O一三年八月制实验六:试验设计结果分析实验类型:上机操作实验地点:农生环D-414指导老师:傅霞萍实验日期:2013 年10 月29 日一、实验目的和要求(1)了解正交试验的基本原理和用途,掌握正交设计的基本方法和步骤,能使用SPSS进行正交试验数据的分析。
二、实验内容和原理2.1实验原理利用正交表科学地安排与分析多因素实验的方法。
由少数实验结果的统计分析,可以推出较优方案。
对实验结果进一步分析,可以得到更多实验因素对试验结果影响的重要程度,各因素对因素对实验结果的影响趋势等。
2.2 实验内容(显著性水平α=5%)(1)利用SPSS对下表所示的试验结果进行方差分析表6-1 鸭肉保鲜天然复合添加剂筛选的试验结果(2)为了通过正交试验寻找从某矿物中提取稀土元素的最优工艺条件,使稀土元素提取率最高,选需要考虑的交互作用有A×B, A×C, B×C,如果将A、B、C分别安排在正交表L8(2)的1、2、4列上,试验结果(提取量mL)依次为1.01、1.33、1.13、1.06、1.03、0.80、0.76、0.56,试用方差分析法(α=0.05)分析试验结果,确定较优工艺条件。
正交表L8(27):三、主要仪器设备/实验环境(使用的软件等)IBM SPSS 19.0等四、操作方法与实验步骤(必填,上机操作过程,可以插图)实验(1)实验(2)五、实验数据记录和处理(必填,图表数据、计算结果、对图表的处理)实验(1)实验(2)六、实验结果与分析(必填)实验(1):a:由4种因素的F检验知,因素主次茶多酚浓度>被膜剂种类>增效剂种类>浸泡时间b:设A:茶多酚浓度,B:增效剂种类,C:被膜剂种类,D:浸泡时间,由各个因素的同类子集可以看出,A因素1水平最优,B因素1水平最优,C因素4水平最优,D 因素2水平最优,所以正交试验得出的优方案为A1B1C4D2。
SPSS 17.0中的正交试验设计与数据分析
朱红兵;席凯强
【期刊名称】《首都体育学院学报》
【年(卷),期】2013(025)003
【摘要】在SPSS 17.0中如何正确实现正交试验设计及其数据分析有着十分重要的现实意义,用实证对比研究方法发现,除考虑交互作用时,需用正交试验设计书中的正交设计表来安排试验,确定试验次数外,其余工作均可在SPSS 17.0中完成,即可以利用数据菜单中正交设计过程里的生成程序产生正交表,用显示程序打印正交设计方案,再用SPSS中多因素方差分析的方法来完成正交试验设计的方差分析,同时可考虑交互作用;因此,在SPSS 17.0中是可以实现正交试验设计及对试验结果进行分析的,它填补了SPSS教材中的一个空白.
【总页数】6页(P283-288)
【作者】朱红兵;席凯强
【作者单位】首都体育学院,北京100191;首都体育学院,北京100191
【正文语种】中文
【中图分类】G80-32
【相关文献】
1.SPSS13.0在空白列正交试验设计及其数据处理中的应用 [J], 王如德;怀燕;程琮
2.SPSS软件在正交试验设计、结果分析中的应用 [J], 邓振伟;于萍;陈玲
3.SPSS11.5软件在正交试验设计中的应用 [J], 胡志洁
4.正交试验法和SPSS数据分析法优选玄栀颗粒的成型工艺 [J], 陈继英;吴谋;蓬展鹏
5.正交试验法和SPSS数据分析法优选玄栀颗粒的成型工艺 [J], 陈继英;吴谋;蓬展鹏
因版权原因,仅展示原文概要,查看原文内容请购买。
实验设计与分析课程论文 题 目 利用SPSS 软件进行方差 分析和正交试验设计
学 院
专 业 年 级 学 号 姓 名
2012年 6月 29日 一、SPSS简介 SPSS是世界上最早的统计分析软件,1984年SPSS总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。 SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS也有专门的绘图系统,可以根据数据绘制各种图形。SPSS 的分析结果清晰、直观、易学易用,而且可以直接读取EXCEL及DBF数据文件,现已推广到多种各种操作系统的计算机上,它和SAS、BMDP并称为国际上最有影响的三大统计软件。 SPSS输出结果虽然漂亮,但不能为WORD等常用文字处理软件直接打开,只能采用拷贝、粘贴的方式加以交互。这可以说是SPSS软件的缺陷。 二、方差分析 例如 某高原研究组将籍贯相同、年龄相同、身高体重接近的30名新战士随机分为三组,甲组为对照组,按常规训练,乙组为锻炼组,每天除常规训练外,接受中速长跑与健身操锻炼,丙组为药物组,除常规训练外,服用抗疲劳药物,一月后测定第一秒用力肺活量(L),结果见表。试比较三组第一秒用力肺活量有无差别。对照组为组一,锻炼组为组二,药物组为组三。
第一步:打开SPSS软件 表1 三组战士的第一秒用力肺活量(L)
对照组 锻炼组 药物组 合计 3.25 3.66 3.44 3.32 3.64 3.62 3.29 3.48 3.48 3.34 3.64 3.36 3.16 3.48 3.52 3.64 3.20 3.60 3.60 3.62 3.32 3.28 3.56 3.44 3.52 3.44 3.16 3.26 3.82 3.28 第二步:由数据视图切换为变量视图修改变量名称 第三步:输入数据
第四步:点击“分析”——比较均值———单因素AVOVA, 如下所示: 第五步:点击两两比较进行设置(选择“LSD”,选择“S-N-K”,点击继续)→点击选项(选择“描述性”,选择“方差同质性检验”,点击继续)→确定。得到结果如下: 描述 肺活量
N 均值 标准差 标准误 均值的 95% 置信区间 极小值 极大值 下限 上限 1.00 10 3.3660 .16215 .05128 3.2500 3.4820 3.16 3.64 2.00 10 3.5540 .16681 .05275 3.4347 3.6733 3.20 3.82 3.00 10 3.4220 .14436 .04565 3.3187 3.5253 3.16 3.62 总数 30 3.4473 .17231 .03146 3.3830 3.5117 3.16 3.82 方差齐性检验 肺活量 Levene 统计量 df1 df2 显著性 .109 2 27 .897 ANOVA 肺活量 平方和 df 均方 F 显著性 组间 .186 2 .093 3.729 .037 组内 .675 27 .025 总数 .861 29
多重比较 因变量:肺活量
(I) 分组 (J) 分组 均值差 (I-J) 标准误 显著性 95% 置信区间 下限 上限 LSD 1.00 2.00 -.18800* .07069 .013 -.3330 -.0430 3.00 -.05600 .07069 .435 -.2010 .0890 2.00 1.00 .18800* .07069 .013 .0430 .3330 3.00 .13200 .07069 .073 -.0130 .2770 3.00 1.00 .05600 .07069 .435 -.0890 .2010 2.00 -.13200 .07069 .073 -.2770 .0130 肺活量 分组 N alpha = 0.05 的子集 1 2 Student-Newman-Keulsa 1.00 10 3.3660 3.00 10 3.4220 3.4220 2.00 10 3.5540 显著性 .435 .073 将显示同类子集中的组均值。 a. 将使用调和均值样本大小 = 10.000。
由图表可知:组一和组二之间显著性为0.013,小于0.05,所以组一和组二之间存在显著差异,因为组一和组三之间显著性为0.435,大于0.05,所以组一和组三之间没有显著差异。 三、正交试验设计 正交试验设计也称正交设计(orthogonal design),是用来科学设计多因素试验的一种方法。其利用一套规格化的正交表(orthogonal table)安排试验,得到的试验结果再用数理统计方法进行处理,使之得出科学结论。主要优点是能在多试验条件中选出代表性强的少数试验方案,通过对这些少数试验方案结果的分析,从中找出最优方案或最佳生产工艺条件,并可以得到比试验结果本身给出的还要多的有关各因素的信息。 例如:某食品厂生产口香糖,检验口香糖的质量好坏需要分析:1.拉伸率(越大越好);2.变形(越小越好);3.耐弯曲次数(越多越好)这三种指标,要求对这三种指标都取得较好的水平,先要进行口香糖配方的实验分析,因素水平表如下:
水平 因素 A胶剂添加量% B葡萄糖浆添加量% C糖粉添加量% D薄荷添加量% 1 19 17 58 0.8 2 20 18 59 0.9 3 21 19 60 1 4 22 20 61 1.1
第一步:打开SPSS软件→变量视图(对各变量进行命名)
*. 均值差的显著性水平为 0.05。 第二步:输入数据→数据→正交设计→生成 确定→生成正交表,如下: 得某口香糖配方试验结果5164L,如下: 第二步:点击“分析”→“一般线性模型”→“单变量”→选择因变量和固定因子,如下: 点击“模型”弹出“单变量:模型窗口”→点击“设定”,将“因子与协变量”加入“模型”中,构建项类型选择“主效应”,如下: 点击“继续”返回“单变量”窗口,点击“选项”进入“单变量:选项”窗口,将“因子与因子交互”框内的A、B、C、D转入“显示均值”框内,选择“描述统计”,如下:
点击“继续”回到“单变量”窗口→点击“确定”,结果如下: 主体间效应的检验 因变量:拉伸率 源 III 型平方和 df 均方 F Sig. 校正模型 9582.750a 12 798.563 4.094 .136 截距 4136139.063 1 4136139.063 21204.173 .000 A胶剂添加量 4403.688 3 1467.896 7.525 .066 B葡萄糖浆添加量 3879.187 3 1293.062 6.629 .077 C糖粉添加量 1062.188 3 354.063 1.815 .318 D薄荷添加量 237.687 3 79.229 .406 .761 误差 585.188 3 195.063 总计 4146307.000 16 校正的总计 10167.938 15 a. R 方 = .942(调整 R 方 = .712)
1. A胶剂添加量 因变量:拉伸率
A胶剂添加量 均值 标准 误差 95% 置信区间 下限 上限 19 513.750 6.983 491.526 535.974 20 489.000 6.983 466.776 511.224 21 532.750 6.983 510.526 554.974 22 498.250 6.983 476.026 520.474
2. B葡萄糖浆添加量 因变量:拉伸率
B葡萄糖浆添加量 均值 标准 误差 95% 置信区间 下限 上限 17 534.500 6.983 512.276 556.724 18 500.500 6.983 478.276 522.724 19 505.000 6.983 482.776 527.224 20 493.750 6.983 471.526 515.974 由III 型平方和比较可知,对口香糖拉伸率的影响A>B>C>D。每个因素的最佳水平为:A胶体添加量为21%,B葡萄糖添加量为17%,C糖粉添加量为61%,D薄荷添加量为1.10%。
3. C糖粉添加量 因变量:拉伸率 C糖粉添加量 均值 标准 误差 95% 置信区间 下限 上限 58 504.000 6.983 481.776 526.224 59 498.000 6.983 475.776 520.224 60 512.250 6.983 490.026 534.474 61 519.500 6.983 497.276 541.724 4. D薄荷添加量 因变量:拉伸率 D薄荷添加量 均值 标准 误差 95% 置信区间 下限 上限 0.80 511.750 6.983 489.526 533.974 0.90 504.000 6.983 481.776 526.224 1.00 505.250 6.983 483.026 527.474 1.10 512.750 6.983 490.526 534.974