一次回归正交设计
- 格式:doc
- 大小:638.00 KB
- 文档页数:43
回归正交试验设计一、概述(1)回归分析与正交试验设计的主要优缺点回归分析的主要优点是可以由试验数据求出经验公式,用于描述自变量与因变量之间的函数关系。
它的主要缺点是毫不关心试验数据如何取得,这样,不仅盲目地增加了试验次数,而且试验数据还往往不能提供充分的信息。
因此,有些工作者将经典的回归分析方法描述成:“这是撒大网,捉小鱼,有时还捉不到鱼”。
所以说,回归分析只是被动地处理试验数据,并且回归系数之间存在相关关系,若从回归方程中剔除某个不显著因素时,需重新计算回归系数,耗费大量的时间。
正交试验设计的主要优点是科学地安排试验过程,用最少的试验次数获得最全面的试验信息,并对试验结果进行科学分析(如方差分析),从而得到最佳试验条件,但是它的主要缺点是试验结果无法用一个经验公式来表达,从而不便于考察试验条件改变后,试验指标将作如何变化。
(2)回归正交试验设计回归正交试验设计,实际上就是将线性回归分析与正交试验设计两者有机地结合起来而发展出的一种试验设计方法,它利用正交试验设计法的“正交性”特点,有计划、有目的、科学合理地在正交表上安排试验,并将试验结果用一个明确的函数表达式即回归方程来表示,从而达到既减少试验次数、又能迅速地建立经验公式的目的。
根据回归模型的次数,回归正交试验设计又分为一次回归试验设计和二次回归试验设计。
二、一次回归正交试验设计(一)一次回归正交试验设计的概念一次回归设计研究的是一个因素z (或多个因素z 1,z 2,……)与试验指标y 之间的线性关系。
当只研究一个因素时,其线性回归模型:y =β0+β1z +e (1)其回归方程为:z y ∧∧∧+=10ββ (2)式中∧0β、∧1β称为回归系数,e 是随机误差,是一组相互独立、且服从正态分布N(0,σ2)的随机变量。
可以证明,∧0β、∧1β和∧y 是β0、β1和y 的无偏估计,即E(∧0β)=β0,E(∧1β)=β1,E(∧y )=y一次回归正交试验设计是通过编码公式x =f(z) −− 即变量变换,将式(2)变为:x b b y 10+=∧(3)且使试验方案具有正交性,即使得编码因素X的各水平之和为零:∑==mi ix1(4)式中m 是因素x 的水平数。
EXCEL和SPSS在回归分析正交试验设计和判别分析中的应用一、回归分析回归分析是一种统计方法,通过对自变量和因变量之间关系进行建模,预测因变量的值。
EXCEL和SPSS都可以进行回归分析,并提供了丰富的功能和工具。
在EXCEL中,可以使用内置的回归分析工具实现回归分析。
首先,需要将数据输入到工作表中,然后选择“数据”选项卡的“数据分析”,再选择“回归”选项。
接下来,填写变量范围和输出范围,并选择相关的统计信息和图表。
最后,点击“确定”即可得到回归分析的结果。
在SPSS中,进行回归分析的步骤稍有不同。
首先,需要导入数据文件,并选择“回归”选项。
然后,选择因变量和自变量,并设置统计选项。
最后,点击“运行”即可得到回归分析的结果。
二、正交试验设计正交试验设计是一种多因素实验设计方法,可以用于确定影响实验结果的因素及其相互作用关系。
使用正交试验设计可以减少实验次数,提高实验效率。
EXCEL和SPSS都提供了工具支持正交试验设计。
在EXCEL中,可以使用内置的“正交表生成器”来实现正交试验设计。
首先,选择“数据”选项卡的“数据分析”,再选择“正交设计表”。
接下来,填写因素数和水平数,并选择生成正交表的方式。
最后,点击“确定”即可生成正交试验设计的表格。
在SPSS中,进行正交试验设计的步骤稍有不同。
首先,需要定义因素和水平,并选择因素的类型和因素间交互作用。
然后,可以选择“生成”选项卡的“正交表”来生成正交试验设计的表格。
三、判别分析判别分析是一种统计方法,用于确定分类变量与一组预测变量之间的关系。
它可以用于预测一个事物属于哪个类别。
EXCEL和SPSS都可以进行判别分析,并提供了相应的功能和工具。
在EXCEL中,可以使用内置的“数据分析工具包”来实现判别分析。
首先,选择“数据”选项卡的“数据分析”,再选择“判别分析”。
接下来,填写变量范围和输出范围,并选择分类变量和预测变量。
最后,点击“确定”即可得到判别分析的结果。
一次回归正交设计某冶炼厂排出的废水中含有大量的镉、鉀、铅等有害元素,对环境造成严重污染。
考察的试验因素为温度(X i)、碱与硫酸亚铁之比(X2)以及硫酸亚铁用量(刈)对指标除镉效率(y)的影响。
不考虑交互作用。
已知X|= 60~80C, x2= 8~ 12, x3= 1~3ml。
(1)因素水平编码及试验方案的确定由于不考虑交互作用,所以建立一个三元线性方程。
因素水平编码如表1所示。
选正交表L8(27)安排试验,将三个因素分别安排在回归正交表的第1、2、4列,试验方案及试验结果见表2,表中的第9、10、11号试验为零水平试验。
表2试验方案及试验结果⑵回归方程的建立表3试验结果及计算表由表3计算a 」皆 \ 二-72.〕6. 6 182n i.i11回归方程为y = 6.6182 0.5125/ 0.5375Z 2 0.3125Z 3由该回归方程偏回归系数绝对值的大小,可以得到各因素的主次 顺序为:X 2>X 1>X 3,即液固比 >乙醇浓度>回流次数。
又由于各偏回归 系数都为正,所以这些影响因素取上水平时,试验指标最好。
(3)回归方程显著性检验b 2b 3、Z 1i Y ii =1m c ' Z 2i%i =1i =1Z 3i Y im c41二 0.5125843二 0.537582^50. 3125 8SS = m c b 2= 8汉 0.5125 = 2.101 = m c b 荻 8 0.53752二 2.311 SQ = m j b ; = 8 0.31252 = 0.781SQ = SS + SS2 + SS3 + SS 2 + SS 厂 2.101+ 2.311+ 0.781= 5.193SS= SS-S&5. 2 9 6- 5. 1 93 0.方差分析结果见表4。
表4方差分析表差异源 SS df MS F 显著性 Z 1 2.101 1 2.101 142.9 ** Z 2 2.311 1 2.311 157.2 ** Z 3 0.781 1 0.781 53.1 ** 回归 5.193 3 1.731117.8**残差 0.103 70.0147总和5.296n — 1 = 10注:F o.o1(1, 7)= 12.25, F o.o1(3, 7) = 8.45可见,三个因素对试验指标都有非常显著的影响, 所建立的回归 方程也非常显著。
《试验设计与数据处理》专业:机械工程班级:机械11级专硕学号:S110805035 姓名:赵龙第三章:统计推断3-13 解:取假设H0:u1-u2≤0和假设H1:u1-u2>0用sas分析结果如下:Sample StatisticsGroup N Mean Std. Dev. Std. Error----------------------------------------------------x 8 0.231875 0.0146 0.0051y 10 0.2097 0.0097 0.0031Hypothesis TestNull hypothesis: Mean 1 - Mean 2 = 0Alternative: Mean 1 - Mean 2 ^= 0If Variances Are t statistic Df Pr > t----------------------------------------------------Equal 3.878 16 0.0013Not Equal 3.704 11.67 0.0032由此可见p值远小于0.05,可认为拒绝原假设,即认为2个作家所写的小品文中由3个字母组成的词的比例均值差异显著。
3-14 解:用sas分析如下:Hypothesis TestNull hypothesis: Variance 1 / Variance 2 = 1Alternative: Variance 1 / Variance 2 ^= 1- Degrees of Freedom -F Numer. Denom. Pr > F----------------------------------------------2.27 7 9 0.2501由p值为0.2501>0.05(显著性水平),所以接受原假设,两方差无显著差异第四章:方差分析和协方差分析4-1 解:Sas分析结果如下:Dependent Variable: ySum ofSource DF Squares Mean Square F Value Pr > FModel 4 1480.823000 370.205750 40.88 <.0001Error 15 135.822500 9.054833Corrected Total 19 1616.645500R-Square Coeff Var Root MSE y Mean0.915985 13.12023 3.009125 22.93500Source DF Anova SS Mean Square F Value Pr > Fc 4 1480.823000 370.205750 40.88 <.0001由结果可知,p值小于0.001,故可认为在水平a=0.05下,这些百分比的均值有显著差异。
试验设计与数据处理复习要点1、引言20世纪20年代,英国生物统计学家及数学家费歇提出了方差分析20世纪50年代,日本统计学家田口玄一将正交设计表格化。
数学家华罗庚的“优选法”。
我国数学家王元和方开泰于1978年首先提出了均匀设计。
常用的统计软件:SAS,SPSS,Origin,Excel等。
试验设计与数据处理的意义。
试验设计的目的:合理地安排试验,力求用较少的试验次数获得较好结果数据处理的目的:通过误差分析,评判试验数据的可靠性;确定影响试验结果的因素主次,抓住主要矛盾,提高试验效率;确定试验因素与试验结果之间存在的近似函数关系,并能对试验结果进行预测和优化;获得试验因素对试验结果的影响规律,为控制试验提供思路;确定最优试验方案或配方。
加权平均值:如果某组试验值用不同的方法获得,或由不同的试验人员得到的,则这组数据中不同的精度或可靠性不一致,为了突出可靠性高的数值,则可采用加权平均值。
绝对误差:试验值与真值之差误差根据其性质或产生原因分为:系统误差,随机误差,过失误差1. 随机误差:以不可预知的规律变化着的误差,绝对误差时正时负,时大时小产生的原因:偶然因素(气温的微小变2.仪器的轻微振动等)2. 系统误差:一定试验条件下,由某个或某些因素按照某一确定的规律起作用而形成的误差产生的原因:多方面(仪器不准或操作者观察终点方法不对)3.过失误差:一种显然与事实不符的误差产生的原因:实验人员粗心大意造成精密度、正确度和准确度的含义与区别。
1.精密度:反映了随机误差大小的程度,在一定的试验条件下,多次试验值的彼此符合程度2.正确度:反映系统误差的大小,精密度高并不意味着正确度也高精密度不好,但当试验次数相当多时,有时也会得到好的正确度3.准确度:反映了系统误差和随机误差的综合,表示了试验结果与真值或标准值的一致程度关于权的选择和绝对误差的选择。
权不是任意给定的,除了依据实验者的经验外,还可以按如下方法给予。
一次回归正交设计、二次回归正交设计、二次回归旋转设计说
明
一次回归正交设计是一种广泛应用于实验设计中的设计方式,该设计最基本的特点是每一个自变量只考虑一次。
这种设计方法可以通过排列组合的方式得到各种不同的设计方案,使得实验者可以通过设计来达到用最少的实验次数获取尽可能多的信息的目的。
一次回归正交设计在实验设计中被广泛使用,尤其在化学制药、工业生产等领域得到了广泛运用。
二次回归正交设计是一种基于一次回归正交设计的设计方式,这种设计方式可以进一步增加实验信息的获取。
在二次回归正交设计中,依然按照一次正交设计的方式来设计实验,但是在每个单独的自变量上,提高对其的测量次数,使得对这些自变量的测量更加准确。
同时,在某些需要深入探究的因素上,可以通过将这些因素的实验次数进一步提高,来获取相关信息。
二次回归旋转设计是一种在二次回归正交设计的基础上发展而来的设计方式。
在二次回归旋转设计中,实验者可以通过旋转矩阵来达到实验变量间的协方差为0的目的。
这样可以在保证基本信息获取的同时,增加获取高阶信息的可能性。
旋转设计特别适合于需要同时考虑多个变量的实验设计,可以使各个变量之间更加独立,减少不必要的干扰。
总的来说,在实验设计领域中,三种设计方法各自有着各自的优势。
对于需要更精准的信息获取的实验,应该选择更高阶的设计方法,在更基础的实验中则可以选择更为简单的设计方法。
另外,在选择设计方法的过程中,还应该根据实验具体情况灵活选择,使得实验设计更加科学合理。