第07章 回归分析
- 格式:ppt
- 大小:301.50 KB
- 文档页数:59
第7章最优回归试验设计与分析方差分析一章介绍的方差分析技术主要用于析因试验结果的分析。
但在多处理情形下,虽然我们在理论上可以容易地将双因子方差分析的模型和方法推广到多因子方差分析的情况,但在实践中,做多个因子的完全试验会有实际的困难,因为完全试验所要求的试验次数太多,乃至无法实现。
例如,假定要考虑5个三水平因子,则完全试验(重复数为1)要求做35=243次试验;假如再加一个四水平因子,则完全试验(同样重复数为1)要作972次试验,如果要能够分析全部交效应,同时还能够做平方和分解,则试验次次还需要加倍!显然,如此大的试验次数在实际中几乎是无法实施的。
解决这个困难的技术之一是采取正交试验设计进行试验。
本章介绍的最优回归试验设计包括一般正交试验设计、正交回归、正交旋转组合设计及均匀设计的试验设计及其分析技术。
第1节正交试验统计分析1.概述正交试验是解决科学试验中多因素、多水平试验,如按全面试验方法,试验处理个数急剧上升的问题。
例如有6个因素,每个因素5个水平的试验,全面试验的试验数目是56=15625个,一般是不可能完成这么多试验处理的。
因此,统计学家发明了一类试验设计的方法-正交因子设计,或简单地称为“正交设计“。
在这种试验设计中,可以安排许多因子,而试验次数远远小于完全试验所需的试验次数;同时统计分析具有分离各因子的主效应和一阶交互效应两优点。
由于这个优点,正交设计在工、农业试验和科学试验中得到了广泛的应用,并发挥了巨大的作用。
2.分析前先编辑定义数据矩阵,数据矩阵的左边放正交表,右边输入试验结果(试验可是单个或有重复),一行一个正交试验组合。
然后, 将正交表和试验结果一起定义成数据矩阵, 如有1个包含3个处理(A,B,C)和2个空闲因子、重复3次的试验,的其数据编辑定义格式为如图7-1。
然后进入菜单选择“一般正交试验”功能,系统提示用户输入试验因子(处理+空闲因子)的总个数(系统一般能自动识别出来,故一般只需回车)。
回归分析的概念和分析(doc 20页)部门: xxx时间: xxx整理范文,仅供参考,可下载自行编辑第七章回归分折讨论随机变量与非随机变量之间的关系的问题称回归分析;讨论随机变量之间的关系的问题称相关分析.对于这两种问题,或统称回归分析,或统称相关分析都可以.但是,自然界的众多的变量间,还有另一类重要关系,我们称之为相关关系.例如,施肥量与农作物产量之间的关系,这种关系虽不能用函数关系来描述,但施肥量与产量有关系,这种关系就是相关关系,又比如,人的身高与体重的关系也是相关关系,虽然人的身高不能确定体重,但总的说来,身高者,体也重些,总之,在生产斗争与科学实验中,甚至在日常生活中,变量之间的相关关系是普遍存在的.其实,即使是具有确定性关系的变量间,由于实验误差的影响,其表现形式也具有某种的不确定性.回归分折方法是数理统计中一个常用方法,是处理多个变量之间相关关系的一种数学方法,.它不仅提供了建立变量间关系的数学表达---通常称为经验公式的一般方法,而且还可以进行分析,从而能判明所建立的经验公式的有效性,以及如何利用经验公式达到预测与控制的目的.因而回归分析法得到了越来越广泛地应用. 回归分析主要涉及下列内容:(1)从一组数据出发,分析变量间存在什么样的关系,建立这些变量之间的关系式(回归方程),并对关系式的可信度进行统计检验;(2)利用回归方程式,根据一个或几个变量的值,预测或控制男一个变量的取值;(3)从影响某一个变量的许多变量中,判断哪些变量的影响是显著的,哪些是不显著的,从而可建立更实用的回归方程,(4)根据预测和控制所提出的要求,选择试验点,对试验进行设计.我们在本章,重点讨论一元线性回归,对多元回归只作简单地介绍.§1 一元线性回归一元线性回归分析中要考察的是:随机变量Y 与一个普通变量x 之间的联系。
对有一定联系的两个变量:x 与Y ,我们的任务是根据一组观察值1,12,2,(),(),,(),n n x y x y x y L判断Y 与x 是否存在线性关系y a bx ε=++,我们能否通过这组观察值将确定系数a 与b 出来呢?这就是回归问题要解决的问题,且判断Y 与x 是否真存在此线性关系.一 . 经验公式与最小二乘法:【例1】 纤维的强度与拉伸倍数有关.下表给出的是24个纤维样品的强度与拉伸倍数的实测记录.我们希望通过这张表能找出强度y 与拉伸倍数x 之间的关系式们将观察值,()(124)i i x y i ≤≤作为24个点,将它们画在平面上,这张图称为散点图,这散点图启示我们,这些点虽然是散乱的,但大体上散布在一条直线的周围.也就是说,拉伸倍数与强度之间大致成线性关系.我们用(*)确定,是线性的,要完全确定经验公式,就要确定(*)中的系数a 和b ,这里b 通常称为回归系数,关系式叫做回归方程.从散点图来看,要找出a 与b 是不困难的,在图上划一条直线,使该直线总的来看最“接近”这24个点.于是,这直线在y 轴上的截距就是所求的a ,它的斜率就是所求的b .几何方法虽然简单,但是太祖糙,而对非线性形式的问题,就几乎无法实行.然 而,它的基本思想,即“使该直线总的说来最接近这24个点”,却是很可取的,问题是把这基本思想精确化,数量化.下面介绍一种方法,求一条直线使其“总的来看最接近这24个点”,这就是最小二乘法.给定的n 个点1122(,),(,),,(,)n n x y x y x y L ,那么,对于平面上任意一条直线l : y a bx =+我们用数量2[()]i i y a bx -+来刻画点(,)i i x y 到直线l 的远近程度, 于是二元函数21(,)[()]ni i i Q a b y a bx ==-+∑ 就定量的描述了直线l 跟这n 个点的总的远近程度,这个量是随不同的直线而变化,或者说是随不同的a 与b 而变化的,于是要找一条直线, 使得该直线总的来看最“接近” 这 n 个点的问题就转化为:要找两个数a 与b , 使得二元函数(,)Q a b 在ˆˆ,a ab b ==处达到最小,即ˆˆ(,)min((,))Q ab Q a b = 由于(,)Q a b 是n 个量平方之和,所以“使(,)Q a b 最小”的原则称为平方和最小原则,习惯上称为最小二乘原则.由最小二乘原则求a 与b 估计值的方法称为最小二乘法.按照最小二乘原则,具体求ˆˆ,ab 的问题就是利用极值原理,求解二元一次联立方程组有唯一解:于是, 对于给定的n 个点1122(,),(,),,(,)n n x y x y x y L ,先算出ˆb,再算出ˆa ,就得到了所求的回归方程:可计算【例1】的因此所求经验公式, 即回归方程为【例2】P .236――― 例1.2对任意两个相关变量,即使它们不存在线性关系,都可以通过。