《试验设计与数据处理》讲稿第4章试验数据的回归分析
- 格式:ppt
- 大小:323.50 KB
- 文档页数:24
实验四回归分析预测实验(3个学时)2010302330013 张秋子 10信一【实验目的】1.了解Microsoft Excel 提供的数据分析工具。
2.掌握EXCEL提供的3种回归分析方法。
3.掌握通过回归分析进行预测的方法。
【实验内容】1.熟悉Microsoft Excel 提供的分析工具库。
2.使用“数据分析”方法进行回归分析。
3.使用“函数”方法进行回归分析,包括直线回归函数、预测函数、指数曲线趋势函数。
4.使用“趋势线”方法进行回归分析。
【实验步骤】第一部分:利用分析工具1、在EXCEL2007中,通过设置EXCEL选项,选择加载项中的分析工具进行加载。
2、选择数据分析工具中的回归分析,设置Y区域为C2-C12,X区域为D2-D12,并且勾选标志。
勾选残差和拟合图。
得到如下结果:第二部分:利用函数一、利用线性回归函数1、利用直线回归函数LINEST(known_y's,known_x's,const,stats)。
在EXCEL2007输入如下数据:2、在A7单元格输入公式“=LINEST(A2:A5,B2:B5,,FALSE)”,得到如下结果:其中2是直线的斜率。
3、选择以公式单元格开始的区域A7:B7。
按F2,再按Ctrl+Shift+Enter。
结果如下:如果公式不是以数组公式输入,则返回单个结果值2,无法获得y轴截距。
当以数组输入时,将返回斜率2和y轴截距1。
4、通常,SUM({m,b}*{x,1}) 等于mx + b,所以可以用SUM和LINEST共同来估计某一个月的预测值。
5、多重线性回归可以看出,y = 27.64*x1 + 12,530*x2 + 2,553*x3 - 234.24*x4 + 52,318二、利用预测函数1、语法:FORECAST(x,known_y's,known_x's)参数说明:X 为需要进行预测的数据点。
Known_y's 为因变量数组或数据区域。
第4章试验设计基本知识4.1 基本概念一、试验指标在试验设计中,根据试验目的而选定的用来衡量试验效果的特征值,称为试验指标。
试验指标可以是数量指标、质量指标、成本指标、效率指标等。
试验指标可分为两大类,一类是定量指标,也称为数量指标,它是在试验中能够直接得到具体数值的指标,如强度、硬度、重量、光洁度、精度、寿命、成本、合格率、pH值等;另一类是定性指标,或称非数量指标,它是在试验中不能得到具体数值的指标,如颜色、味道、光泽、手感等。
在试验设计中,为便于分析试验结果,一般把定性指标定量化,例如,可把色泽按不同深度分成不同等级。
试验指标可以是一个,也可以同时是几个。
前者称单指标试验设计,后者称多指标试验设计。
二、试验因素对试验指标特征值可能有影响的原因或要素称为因素(factor),也称为因子,它是进行试验时重点考察的内容,因素一般用大写英文字母A、B、C……来标记,如因素A、因素B、因素C……等。
1在确定试验因素时,必然以专业技术和生产实践经验为基础,应尽可能列出与研究对象目标有关的各种因素,然后判断哪些是需要探索的因素。
因素有各种分类方法,最简单的是分为可控因素和不可控因素。
可控因素是指人们可以控制和调节的因素,如温度、流量、pH值等;不可控因素指人们暂时不能控制和调节的因素,如设备的轻微振动、刀具的轻微磨损等。
进行试验设计时,一般只考虑可控因素。
只考察一个因素的试验叫单因素试验,考察两个因素的试验叫双因素试验,考察三个或三个以上因素试验中多因素试验。
三、因素水平(level of factor)在试验设计中,为考察试验因素对试验指标的影响情况,要使试验因素处于不同的状态。
我们把试验因素所处的各种状态称为因素水平或试验水平,简称水平或位级。
试验设计中,一个因素选了几个水平,就称该因素为几水平因素。
如某试验中温度A选了300C和500C二个水平,时间B选了20min、40min、60min三个水平,就称A为二水平因素,B为三水平因素。
《试验设计与数据处理》教学大纲课程编码:0413105002课程名称:试验设计与数据处理学时/学分:24/1.5先修课程:《高等数学》适用专业:化学工程与工艺、制药工程、化学开课教研室:化工教研室一、课程性质与任务1.课程性质:本课程是面向化学工程与工艺、制药工程及化学专业学生的专业选修课程。
2.课程任务:本课程的基本任务是在学生学习《高等数学》等专业基础课程的前提下,向学生介绍工程技术和科研试验中常用的试验设计与数据处理方法,为其后续专业实验、毕业论文环节的顺利进行打下良好基础。
二、课程教学基本要求通过本课程的教学,使学生了解并掌握科学试验中试验前的试验方案设计以及对试验所获得数据进行分析和处理的基本理论和知识,学会使用科学的试验设计方法设计试验并对试验得到的大量数据进行正确的分析和处理,同时能够合理地设计试验,使试验次数尽可能少并在较短的时间内以较少的成本来达到预期的试验目标,进而摸索出较优的工艺条件或配方。
通过培养学生合理设计化学工程试验,并对试验数据进行科学分析和处理的技能,最终达到提高学生分析问题和解决问题的能力(如确定最优工艺条件或配方)的目的。
成绩考核形式:期末成绩(70%)+平时成绩(作业、课堂提问等)(30%)。
成绩评定采用百分制,60分为及格。
三、课程教学内容第一章绪论1.教学基本要求了解试验设计与数据处理的概念和发展,学习此门课程的目的与意义;掌握试验设计的三个基本要素。
2.要求学生掌握的基本概念、理论、技能通过本章教学,使学生能准确理解指标、因素、水平等基本概念,掌握试验设计与数据处理的基本要素。
3.教学重点和难点教学重点是试验设计的基本要素。
教学难点是试验设计中因素与水平的选取原则。
4.教学内容(1)试验与试验设计的基本概念(2)试验设计与数据处理的发展概况(3)试验设计的基本要素主要知识点:指标;因素;水平。
(4)试验设计与数据处理的目的第二章试验数据的误差分析1.教学基本要求理解误差分析的重要性,各种试验误差的来源,误差理论的基本问题,掌握误差的检验与控制方法;掌握有效数字的修约标准与运算规则;能够运用误差的传递公式判断间接测量或函数误差的主要来源,选择合适的测量仪器或方法;能够根据具体情况运用合适的方法对数据进行显著性检验,并对数据中可能存在的异常值进行检验和处理。
Lecture 4——统计推断——假设检验一、统计推断概述.统计推断(statistical inference),就是根据统计量的分布和概率理论,由样本统计量来推断总体的参数,实际工作中,一次试验或一次调查所获得的数据资料,通常是一个样本的结果,而我们真正需要知道的是抽取样本的总体特征,即:统计分析的结论是针对总体参数而言的,因此,统计推断是科研工作中一个十分重要的工具,对试验设计也有很大的指导意义.从数据得到对现实世界的结论的过程。
.它主要包括统计假设检验(test of hypothesis)和参数估计(parametric estimation)两部分内容。
二、假设检验的基本概念.假设检验又叫显著性检验(test of significance)。
.其原理和过程是:–对未知的或不完全知道的总体参数提出一些假设(hypothesis这些假设通常构成完全事件系),然后在某一基本假设的基础上,计算样本的统计量,并分析这一统计量的分布规律。
最后根据这一统计量作出在一定概率意义下应当接受何种假设的结论。
–这里有一个定量转化为定性的过程:.经计算所得到的统计量一般是呈连续分布的(定量),但最后的检验结论只有两种:接受何种假设(定性),即:存在一个临界值,统计量未达到临界值,应当接受一种假设,统计量超过临界值,应当接受另一种假设。
.假设检验方法很多,常用的有u检验、t检验、F检验和卡方检验等。
尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。
三、假设检验的基本思路–为了说明问题,我们举几个例子进行讨论:.例1、抽取一批小鼠,随机分为两组,一组注射催产素,一组作为对照(即不注射催产素),半小时后检查这两组小鼠的血糖含量,得:注射催产素组为:= 106.88,对照组平均为:= 109.17 。
同时我们也发现,同一组内的小鼠其血糖含量也是不同的。
两组小鼠的平均血糖含量之间有个差:=106.88.109.17=.2.29。