数理统计--第4章 方差分析、正交试验设计
- 格式:ppt
- 大小:6.75 MB
- 文档页数:69
正交试验设计法正交试验设计法的基本思想正交表正交表试验方案的设计试验数据的直观分析正交试验的方差分析常用正交表1.正交试验设计法的基本思想正交试验设计法,就是使用已经造好了的表格--正交表--来安排试验并进行数据分析的一种方法。
它简单易行,计算表格化,使用者能够迅速掌握。
下边通过一个例子来说明正交试验设计法的基本想法。
[例1]为提高某化工产品的转化率,选择了三个有关因素进行条件试验,反应温度(A),反应时间(B),用碱量(C),并确定了它们的试验范围:A:80-90℃B:90-150分钟C:5-7%试验目的是搞清楚因子A、B、C对转化率有什么影响,哪些是主要的,哪些是次要的,从而确定最适生产条件,即温度、时间及用碱量各为多少才能使转化率高。
试制定试验方案。
这里,对因子A,在试验范围内选了三个水平;因子B和C也都取三个水平:A:Al=80℃,A2=85℃,A3=90℃B:Bl=90分,B2=120分,B3=150分C:Cl=5%,C2=6%,C3=7%当然,在正交试验设计中,因子可以是定量的,也可以是定性的。
而定量因子各水平间的距离可以相等,也可以不相等。
这个三因子三水平的条件试验,通常有两种试验进行方法:(Ⅰ)取三因子所有水平之间的组合,即AlBlC1,A1BlC2,A1B2C1,……,A3B3C3,共有33=27次试验。
用图表示就是图1 立方体的27个节点。
这种试验法叫做全面试验法。
全面试验对各因子与指标间的关系剖析得比较清楚。
但试验次数太多。
特别是当因子数目多,每个因子的水平数目也多时。
试验量大得惊人。
如选六个因子,每个因子取五个水平时,如欲做全面试验,则需56=15625次试验,这实际上是不可能实现的。
如果应用正交实验法,只做25次试验就行了。
而且在某种意义上讲,这25次试验代表了15625次试验。
图1 全面试验法取点..........(Ⅱ)简单对比法,即变化一个因素而固定其他因素,如首先固定B、C于Bl、Cl,使A变化之:↗A1B1C1 →A2↘A3 (好结果)如得出结果A3最好,则固定A于A3,C还是Cl,使B变化之:↗B1A3C1 →B2 (好结果)↘B3得出结果以B2为最好,则固定B于B2,A于A3,使C变化之:↗C1A3B2→C2 (好结果)↘C3试验结果以C2最好。
第三章:统计推断第3章第7题分别使用金球和铂球测定引力常数(1)用金球测定观察值:6.683,6.681,6.676,6.678,6.679,6.672;(2)用铂球测定观察值:6.661,6.661,6.667,6.667,6.664。
σ),u,2σ均为未知。
试就1,2两种情况分别求u的置信度设测定值总体为N(u,2σ的置信度为0.9的置信区间。
为0.9的置信区间,并求2(1)金球均值置信度为0.9的置信区间,SAS程序如下:①打开SAS软件②打开solution-analysis- analyst输入数据并保存③打开analyst,选择jingqiu文件,打开:④Statistics ——Hypothesis Tests ——One-Sample t-test for a Mean,将待分析变量jq送入Variable中,在单击Tests,选中Interval,设置confidence level设置为90.0%:⑤结果输出:金球u的置信度为0.9的置信区间为(6.67,6.68)。
(2)铂球均值置信度为0.9的置信区间,SAS程序如下:①打开solution-analysis- analyst输入数据并保存②打开analyst,选择Bq文件,打开:③Statistics ——Hypothesis Tests ——One-Sample t-test for a Mean,将待分析变量bq 送入Variable中,在单击Tests,选中Interval,设置confidence level设置为90.0%:④结果输出:铂球u的置信度为0.9的置信区间为(6.66,6.67)。
(3)金球方差置信度为0.9的置信区间,SAS程序如下:①打开analyst,选择Bq文件,打开数据:②Statistics ——Hypothesis Tests ——One-Sample Test for a Variance,将待分析变量jq 送入Variable中,并在Null:Var中设置一个大于0的数,再单击Intervals,选中Interval,设置confidence level设置为90.0%:③结果输出:金球σ2的置信度为0.9的置信区间为(676E-8, 0.0001)(4)铂球方差置信度为0.9的置信区间,SAS程序如下:①Statistics ——Hypothesis Tests ——One-Sample Test for a Variance,将待分析变量bq送入Variable中,并在Null:Var中设置一个大于0的数,再单击Intervals,选中Interval,设置confidence level设置为90.0%:②结果输出:铂球σ2的置信度为0.9的置信区间为(379E-8, 507E-7)。
先列出一个表格 三因素,三水平 正交表为4列,9行正交表的作用:对于同一个因素的任一个水平,当实验组合中含有这个水平时,其他的参数取值是均匀的,没有重复.如B 因素取90这个水平时有三个组合,这三个组合为可以看出,在B 因素取90时,A 和C 因素分别取了没有重复的三个变量,即均匀的。
这有什么好处,下面引出方差分析中一些假设1. 实验的结果有一个期望值E 0值,这个E 0 值是所用参数可能取值得到的计算结果的期望值,而且假设计算结果是满足正态分布的。
即),(~20σE N X i 。
注意:E 0 不是这9个计算结果的平均值,这9个计算结果只是所有可能结果的9个样本而已,我们就是在用着9个样本来分析总体2. 对于单个参数而言,由于单个参数的任一水平的计算结果只受该参数影响,而不受其他参数的影响,所以单个参数的计算结果的期望和方差都应该满足)(20,σE N ,1、2这两条实际是为方差分析服务的。
3. 至于说在正交法中单个参数的计算结果只受该参数影响,而不受其他两个参数取值的影响,涉及了另一个假设:假设各个参数对计算结果的影响是独立的,也就是说计算结果是3个参数的作用的加和,比如说在B=30,C=64时,A 取12对计算结果的贡献是8。
当B=32,C=40时,A 取12对计算结果的贡献还是8。
当然,这都是理想状态,参数之间的作用肯定是有互相影响滴,这种影响叫做交互作用,而且,每次试验都有误差的,不可能互相没有影响,两次试验中A 对计算结果的贡献肯定是不相等的。
我们在试验时一般不急于考虑交互作用,且在我们这个项目中交互作用的影响比较小,查的文献中直接对交互作用闭口不提,所以就不考虑了。
这样的话不就可以列出各个参数下的计算结果的表达式了以B=90这个例子为例。
X 1=31=Y(A=80)+Y ’(A=80)+Y(B=90) +Y ’(B=90)+Y(C=5) +Y ’(C=5) X 4=53=Y(A=85)+Y ’(A=85)+Y(B=90) +Y ’(B=90)+Y(C=6) +Y ’(C=6) X 7=57=Y(A=90)+Y ’(A=90)+Y(B=90) +Y ’(B=90)+Y(C=7) +Y ’(C=7)其中Y (A=80)是理想状态下A 取80对计算结果的贡献,Y ’(A=80)是A 取80对计算结果贡献的实验误差。
正交试验结果的方差分析方法计算公式和项目试验指标的加和值=,试验指标的平均值与表4-13一样,第j列的(1) I j”水平所对应的试验指标的数值之和(2) II j——“ 2”水平所对应的试验指标的数值之和(3)……(4) k j——同一水平出现的次数。
等于试验的次数除以第j列的水平数.(5)I j/k j——“水平所对应的试验指标的平均”(6)II j/k j——“2”水平所对应的试验指标的平均值(7)……以上各项的计算方法,与“极差法”同,见4.1.7节(8)偏差平方和(4-1)(9) fj ——自由度.fj第j列的水平数-1.(10)Vj——方差.Vj =Sj/fj(4-2)(11)Ve——误差列的方差。
(4-3)(12)Fj——方差之比(4-4)(13)查F分布数值表(见附录6),做显著性检验。
显著性检验结果的具体表示方法与第3章相同。
(14)总的偏差平方和(4-5) (15)总的偏差平方和等于各列的偏差平方和之和。
即(4-6) 式中,m为正交表的列数。
若误差列由5个单列组成,则误差列的偏差平方和S e等于5个单列的偏差平方和之和,即:S e=S e1+S e2+S e3+S e4+S e5;也可用S e= S总-S’来计算,其中:S’为安排有因素或交互作用的各列的偏差平方和之和应引出的结论。
与极差法相比,方差分析方法可以多引出一个结论:各列对试验指标的影响是否显著,在什么水平上显著。
在数理统计上,这是一个很重要的问题。
显著性检验强调试验误差在分析每列对指标影响中所起的作用。
如果某列对指标的影响不显著,那么,讨论试验指标随它的变化趋势是毫无意义的。
因为在某列对指标的影响不显著时,即使从表中的数据可以看出该列水平变化时,对应的试验指标的数值也在以某种“规律”发生变化,但那很可能是由于实验误差所致,将它作为客观规律是不可靠的。
有了各列的显著性检验之后,最后应将影响不显著的交互作用列与原来的“误差列”合并起来,组成新的“误差列”,重新检验各列的显著性。