(应用数理统计)回归分析_01
- 格式:ppt
- 大小:1.41 MB
- 文档页数:42
应用数理统计大作业1——逐步回归法分析终应用数理统计多元线性回归分析(第一次作业)学院:机械工程及自动化学院姓名:学号:2014年12月逐步回归法在AMHS物流仿真结果中的应用摘要:本文针对自动化物料搬运系统 (Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS 数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。
关键词:逐步回归;残差;SPSS;AMHS;物流仿真目录1、引言 (1)2、逐步回归法原理 (4)3、模型建立 (6)3.1确定自变量和因变量 (6)3.2分析数据准备 (6)3.3逐步回归分析 (7)4、结果输出及分析 (9)4.1输入/移去的变量 (9)4.2模型汇总 (10)4.3方差分析 (10)4.4回归系数 (11)4.5已排除的变量 (12)4.6残差统计量 (13)4.7残差分布直方图和观测量累计概率P-P图 (14)5、异常情况说明 (15)5.1异方差检验 (15)5.2残差的独立性检验 (17)5.3多重共线性检验 (17)6、结论 (18)参考文献 (20)1、引言回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。
这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。
逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。
SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。
第11章 回归分析设x 为普通变量,Y 为随机变量。
如果当x 变化时,Y 随着x 的变化大体上按某种趋势变化,则称x 与Y 之间存在相关关系,即),0(~,)(2σεεN x f Y +=例如,某地人均收入x 与某种商品的消费量Y 之间的关系;森林中树木的断面直径x 与高度Y 之间的关系;某种商品的价格x 与销售量Y 之间的关系;施用氮肥、磷肥、钾肥数量1x ,2x ,3x 与某种农作物产量Y 之间的关系。
在生产实践和科学研究中,常常有这样的问题:由实验或测量得到变量间的一批离散样点,要求由此建立变量之间的近似函数关系或得到样点之外的数据。
我们确定的函数要求在某种距离意义下的误差达到最小(通常用最小二乘法,即考虑使各数据点误差平方和最小)。
由一个(或几个)普通变量来估计或预测某个随机变量的取值时,所建立的数学模型及所进行的统计分析称为回归分析。
§11.1 一元线性回归假设有一批关于x 与Y 的离散样点),(,),,(),,(2211n n y x y x y x集中在一条直线附近,说明x 与Y 之间呈线性相关关系,即),0(~,2σεεN bx a Y ++=称为一元线性回归模型。
一、模型中的参数估计 1、b a ,的估计 首先引进记号∑∑∑∑∑=====-=-=-===ni i i xy ni i yy ni i xx ni ini iyx n y x S y n y S x n x S y n y x n x 11221221111按最小二乘法可得到xxxyS S b =ˆ x b y a ˆˆ-= 称x b a yˆˆˆ+=为Y 关于x 的一元线性回归方程。
2、2σ的估计)ˆ(21ˆ22xx yy S b S n --=σ求出关于的一元线性回归方程。
解:先画出散点图如下计算出 3985193282503.6714510======xy yy xx S S S y x n483.0ˆ==xxxyS S b 735.2ˆˆ-=-=x b y a所求的回归方程是x y483.0735.2ˆ+-=。
数理统计分析知识及回归分析方法把研究对象的全体称为总体,构成总体的每个单位称为 个体,通常用N 表示总体所包含的个体数。
总体的一部分称 为样本(或成子样),通常用n 表示样本所含的个体数,称 为样本容量。
从总体中抽区样本称为抽样。
若总体中每个个体被抽取的可能性相同,这样的抽样称为随机抽样,所获得的样本称 为随机样本。
在许多情况下不可能直接试验或研究总体,例如灯泡的 寿命、混凝土强度等,总是采用抽样的方法,通过试验或研 究样品的特性,去估计该批产品的特性或质量状况。
数理统 计就是一种以概率论为理论基础、 通过研究随机样本(样品) 对总体的特性或质量状况作出估计和评价的方法。
对于工程试验中常见的正态分布,主要计算样本的三个 统计量,即平均值、标准差(或极差)和变异系数。
一、样本平均值:以算术平均值 X 表示,可按下式计xi式中:xi ——各个试验数据试验数据个数nxi各个试验数据之和、样本标准差:以标准差s表示,可按下式计算:xi上式又称贝塞尔公式。
标准差表示一组试验数据对于其平均值的离散程度,也就是数据的波动情况,具有与平均值相同的量纲。
在相同平均值条件下,标准差大表示数据离散程度大,即波动大;标准差小表示数据离散程度小,波动小三、样本极差:极差也可以表示数据的离散程度。
极差是数据中最大值与最小值之差:极差也可以表示数据的离散程度。
极差是数据中最大值与最小值之差:当一批数据不多时(n W 10),可用样本极差估计总体标准差:A式中::标准差的估计值;R :极差;dn:与n有关的系数,一般,dn可近似地取为:X max x mins1ni 1,2< n W 10四、样本变异系数:变异系数表示数据的相对波动大小,按下式表示:sC v 100%x数据的性Cv可用于不同平均制条件下数据饿波动情况,更能反映质。
回归分析回归分析是一重处理变量与变量之间关系的数学方法。
变量与变量之间存在对应关系的,称为函数关系。