(1)用Excel作一元线性回归分析
- 格式:doc
- 大小:676.83 KB
- 文档页数:12
Excel求解一元线性回归方程步骤(图解详细)1.开始-程序-Microsoft Excel,启动Excel程序。
2.Excel程序启动后,屏幕显示一个空白工作簿。
3.选定单元格,在单元格内输入计算数据。
4.选中输入数据,点击“图表向导”按钮。
5.弹出图表向导对话窗,点击XY散点图,选择平滑线散点图,点击下一步。
6.选择系列产生在:列,点击下一步。
7.在图表标题中输入“硝基苯标准曲线”,数值(X)轴输入“硝基苯浓度”,数值(Y)轴输入“HPLC峰面积”。
此外还可以点击“坐标轴”,“网格线”,“图例”,“数据标志”下拉菜单,对其中选项进行选择。
8.点击完成后,即可得到硝基苯的标准曲线图。
9.将鼠标移至图表工作曲线上,单击鼠标右键,选择“添加趋势线”。
10.在“类型”选项中选择“线性”,“选项”中选择“显示公式”,“显示R平方值”,单击确定。
11.单击确定后即可得到附有回归方程的一元线性回归曲线。
12.至此,利用“图表向导”制作回归方程的操作步骤完毕。
利用Excel中“图表向导”制作标准曲线,使用者仅需按照向导说明填入相关信息即可完成图表的制作。
方法简单,适合对Excel了解不多的人员,如果你对Excel函数有一定的了解,那么你可以利Excel函数编制程序完成回归方程的计算。
4.4.2.2通过编制Excel程序计算一元线性回归方程1.打开一个新工作簿,以“一元线性回归方程”为文件名存盘。
2.单击插入,选择名称-定义。
3.在弹出的“定义名称”对话窗中“名称”栏输入“a”,“引用位置”栏输入“=$E$4”,然后按“添加”按钮;再在“名称”栏输入“b”,“引用位置”栏输入“=$E$3”,按“添加”按钮,依次输入下列内容,最后单击确定。
“名称”栏输入内容“引用位置”栏输入内容a =$E$4b =$E$3f =$G$4n =$G$3rf =$G$6rxy =$E$5x =$A$3:$A$888y =$B$3:$B$888aa=$G$2yi1 =$E$12yi2 =$E$134.完成命名后,在相关单元格内输入下列程序内容。
丌丌丌丌丌丌丌丌丌丌丌保山学院学报丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌Excel在一元线性回归分析中的应用杨雄曾智(娄底职业技术学院,湖南娄底417000)[摘要]回归分析有预测和因子分析的作用,但在实际运算中计算量大,随着软件的发展,许多运算过程可以用软件来替代;通过分析一元回归的建立过程,以成本预测为案例,应用Excel对案例进行回归方程的求解,并且对Excel的运行结果中的各参数进行具体解释,以至于能够理解各参数的实际意义,进而可以熟悉应用Excel进行回归分析,并能展开实际预测。
[关键词]成本预测;相关系数;回归分析;Excel应用[中图分类号]O13[文献标识码]A doi:10.3969/j.issn.1674-9340.2021.02.012[文章编号]1674-9340(2021)02-0066-08回归分析是在研究现象之间相关分析的基础上,对自变量x和因变量y的变动趋势拟合数学模型进行数量推算的一种统计分析方法[1]。
在客观世界中,寻找变量之间的关系,大致可以分为两种类型:一是反映变量之间的确定性的关系,称为函数关系;二是变量之间存在着关系,但不是确切的函数关系,可是变量之间又存在某种密切关系,然而又不能由一个(或一组)变量的值精确地求出另一个变量的值,称这种非确定性关系为相关关系。
在相关关系中,假设x,y是两个变量,其中x是自变量,y是因变量,而自变量x的取值是非随机的普通变量,它是人为的可控制的变量,称为可控量,因变量y由于随机误差等因素的影响,取值是随机的,称为随机变量,但服从一定的概率分布。
进而当自变量x是非随机的可控变量时,自变量x与因变量y关系的分析称为回归分析。
回归分析法属于因素分析法的一种,在掌握大量观察数据或历史数据的基础上,利用数理统计方法建立因变量y与自变量x之间的回归关系函数表达式。
在有些专业中,开设了经济数学课,包含一元回归分析内容,其中会计专业课会讲到成本预测,成本预测需要建立回归方程,但在成本预测的计算中面对复杂的数据,同时涉及要素也繁多,此项工作任务繁重,因此需要借助相应工具来简化计算提高工作效率。
实验结果:实验一:一元线性回归在Excel中的实现一、实验过程描述1.录入数据打开EXCLE,录入实验数据,B列存放居民货币收入,C列存放居民消费品购买力,如下图所示:2.绘制散点图点击插入——图表——散点图——下一步,选择数据区域如下图:定义表名为消费能力表、X轴为收入、Y轴为购买力,形成生散点图:根据散点图可知,题中两个条件之间存在着线性关系,根据散点图可建立一次回归模型。
3.所需数据的计算一元线性回归系数的计算中,需要用到∑x、∑y、∑2x、∑2y及∑xy 的值,因此按下列步骤求出这些值。
在D2单元格中输入“=B2*B2”,下拉求出所有的值。
同上,在E2单元格中输入”=C2*C2”,在F2单元格中输入“=B2*C2”,依次下拉,得到所有值。
结果如下表所示:在B11单元格中输入“=SUM(B2:B10)”,依次右拉,求出各列的和∑x 、∑y 、∑2x 、∑2y 及∑xy ,依次存在B11,C11,D11,E11,F11.如下图所示:4. 一元线性回归系数的计算:根据系数公式x b y a x x n y x xy n b 22-=--=∑∑∑∑∑)(,在EXCLE 表格中进行计算如下: 在I2单元格中输入一元线性回归系数b 的公式“=(9*F11-B11*C11)/(9*D11-B11*B11)”,在I3单元格中输入系数a 的公式 “ =C11/9-I2*(B11/9)”结果如下图所示:由此得出回归方程:Y=-0.99464X+0.847206二、实验结果分析在进行线性回归分析之前,首先必须依据一定的经济理论、专业知识,对变量间是否存在一定的相关性进行分析。
本题中,应根据实际经验,确定居民货币收入为自变量,居民消费品购买力为因变量。
再次要绘制散点图,观察数据信息是否符合线性要求,在完成上述准备工作后,才能进行线性回归方程的计算。
利用Excel进行线性回归分析————————————————————————————————作者: ————————————————————————————————日期:ﻩ文档内容1.利用Excel进行一元线性回归分析2. 利用Excel进行多元线性回归分析1.利用Excel进行一元线性回归分析第一步,录入数据以连续10年最大积雪深度和灌溉面积关系数据为例予以说明。
录入结果见下图(图1)。
图1第二步,作散点图如图2所示,选中数据(包括自变量和因变量),点击“图表向导”图标;或者在“插入”菜单中打开“图表(H)”。
图表向导的图标为。
选中数据后,数据变为蓝色(图2)。
图2点击“图表向导”以后,弹出如下对话框(图3):图3在左边一栏中选中“XY散点图”,点击“完成”按钮,立即出现散点图的原始形式(图4):灌溉面积y(千亩)01020304050600102030灌溉面积y(千亩)图4第三步,回归观察散点图,判断点列分布是否具有线性趋势。
只有当数据具有线性分布特征时,才能采用线性回归分析方法。
从图中可以看出,本例数据具有线性分布趋势,可以进行线性回归。
回归的步骤如下:1. 首先,打开“工具”下拉菜单,可见数据分析选项(见图5):图5用鼠标双击“数据分析”选项,弹出“数据分析”对话框(图6):图62.然后,选择“回归”,确定,弹出如下选项表(图7):图7进行如下选择:X 、Y 值的输入区域(B1:B11,C1:C11),标志,置信度(95%),新工作表组,残差,线性拟合图(图8-1)。
或者:X 、Y 值的输入区域(B2:B11,C2:C11),置信度(95%),新工作表组,残差,线性拟合图(图8-2)。
注意:选中数据“标志”和不选“标志”,X 、Y 值的输入区域是不一样的:前者包括数据标志:最大积雪深度x (米) 灌溉面积y (千亩)后者不包括。
这一点务请注意(图8)。
图8-1包括数据“标志”图8-2不包括数据“标志”3.再后,确定,取得回归结果(图9)。
利⽤EXCEL函数LINEST进⾏统计学中的回归分析介绍统计学中的⼀元和多元线性回归,并通过EXCEL⾃带的统计函数LINEST、INDEX进⾏⼿⼯计算,再通过EXCEL数据分析⼯具包进⾏⾃动计算。
由于很多复杂的EXCEL⾃动化程序,需要⽤到⾃动化计算,EXCEL数据分析⼯具并不适⽤⾃动计算,反⽽EXCEL统计函数是很容易实现批量⾃动计算。
所以本⽂重点介绍EXCEL统计函数的使⽤。
统计学上的线性回归原理简介回归是研究⼀个随机变量y对另⼀个(x)或⼀组(x1,x2,…,xn)变量的相依关系的统计分析⽅法。
其中y⼜叫因变量,x叫⾃变量。
简单的记忆⽅法:x是⾃⾝可以变动的,y是因为x的变化⽽变化的,就不会把⾃变量和因变量的意义搞乱。
线性回归是⾃变量与因变量之间是线性关系的回归。
⼀般来说,因变量只有⼀个,⾃变量会有⼀个或多个。
下⾯就按因变量的数量及类别为分:⼀元线性回归、多元线性回归。
⼀元线性回归⼀元线性回归是指⼀个因变量y只与⼀个⾃变量x有相关关系,通过公式可以表⽰为如下图:⼀元线性回归其中a称为斜率,b称为截距。
它的意思是当x增减⼀个单位时,y会同样增减a个单位的x,如a=2时,x增加⼀个单位,y就增加2个单位x。
通过EXCEL统计函数LINEST来实现⼀元线性回归分析,在EXCEL的A1到B10输⼊如下数据:x y1.12001.92452.536744004.555055405.966777701210使⽤LINEST线性回归函数进⾏⼿⼯计算。
LINEST函数可通过使⽤最⼩⼆乘法计算与现有数据最佳拟合的直线,来计算某直线的统计值,然后返回描述此直线的数组。
也可以将 LINEST 与其他函数结合使⽤来计算未知参数中其他类型的线性模型的统计值,包括多项式、对数、指数和幂级数。
因为此函数返回数值数组,所以必须以数组公式的形式输⼊。
LINEST语法LINEST(known_y’s, [known_x’s], [const], [stats])Known_y’s 必需。
Excel数据管理与图表分析一元线性回归分析在回归分析中,当只涉及一个因变量和一个自变量时,称做一元回归分析。
当描述自变量与因变量之间因果关系的函数表达式是线性的还是非线性的,分为线性回归分析和非线性回归分析。
本节来介绍一元线性回归分析方法的应用。
例如,某公司长期由7大投资商赞助,其投资额与企业收益密切相关,其相关数据信息如下图13-12所示。
试运用一元线性回归分析的方法来建立回归方程,并对特定投资额进行收益值的预测。
图13-12 创建表格用户可以运用如图13-12所示的表格,对投资与收益进行分析计算并创建回归分析。
1.运用函数分析一元线性方程用户可以通过使用相关的函数,来计算出一元线性方程的斜率和截距,从而帮助创建一元线性方程。
为了创建一元线性方程,可以首先来创建如图13-13所示的表格,以帮助用户在此表格中清楚的观察方程的创建过程。
图13-13 创建表格图13-14 计算斜率和截距选择C13和D13单元格,分别输入“=SLOPE(C3:C9,B3:B9)”和“=INTERCEPT(C3:C9,B3:B9)”公式,即可求出方程的斜率和截距,如图13-14所示。
在进行斜率和截距的计算过程中,使用了SLOPE和INTERCEPT两个函数,下面分别对其进行介绍。
其中,SLOPE函数返回根据known_y's和known_x's中的数据点拟合的线性回归直线的斜率。
斜率为直线上任意两点的重直距离与水平距离的比值,也就是回归直线的变化率。
语法:SLOPE(known_y's,known_x's)其中,Known_y's表示为数字型因变量数据点数组或单元格区域。
Known_x's表示为自变量数据点集合。
提示如果known_y's 和known_x's 为空或其数据点个数不同,函数SLOPE 返回错误值#N/A。
创建表格创建表格输入INTERCEPT函数是利用现有的x值与y值计算直线与y轴的截距。
用excel进行一元线性回归分析在Excel中进行一元线性回归分析可以遵循以下步骤:1.打开Excel并输入你的数据。
在A列和B列分别输入x和y的值。
例如,如果你在研究体重(x)和血压(y)的关系,你的数据可能会像这样:A列是体重,B列是血压。
2.在Excel中打开“数据”菜单,然后选择“数据分析”工具。
如果你没有看到这个选项,那么可能需要先在“文件”>“选项”>“加载项”中启用它。
3.在“数据分析”工具中,选择“回归”选项。
这会打开一个新的对话框,其中包含几个选项。
4.在“回归”对话框中,你将看到几个选项。
在“Y值输入区域”中,选择你的y值(在上面的例子中是B列)。
在“X值输入区域”中,选择你的x值(在上面的例子中是A列)。
确保勾选“标志”选项,这样你的模型就会包括截距项。
5.点击“确定”按钮。
Excel会在C列和D列中输出回归结果。
C列包含回归系数,D列包含标准误差和R平方等统计信息。
6.解读结果。
如果回归系数(C列)的P值小于你选择的显著性水平(如0.05),那么你就可以认为这个因素是显著的。
R平方值越接近1,说明模型的解释力度越高。
以上就是在Excel中进行一元线性回归分析的基本步骤。
需要注意的是,虽然Excel提供了一个方便的工具来做这个分析,但是它并不能提供高级的统计测试或者复杂的模型。
如果你需要更复杂的分析,可能需要使用专门的统计软件,如SPSS、SAS或R等。
在进行回归分析时,还要注意几个关键点。
首先,你需要确保你的数据满足线性回归的假设,包括误差的正态性和独立性、线性关系以及合理的异方差性等。
其次,如果你的样本量很小,那么你可能需要更谨慎地解释结果,因为小样本可能会导致较大的误差和偏差。
最后,记住回归分析只能告诉你变量之间的关系,并不能告诉你因果关系。
例如,体重可能和血压有关系,但并不意味着体重是导致血压升高的原因。
在进行回归分析时,还可以使用一些额外的工具和技巧来改进你的分析。
简单问题⽤Excel表格去做回归(该案例是⼀元线性回归)⽐如有这样⼀组数据(原始数据)
这是数据字典(必须要有!)
已知⽉均信⽤卡⽀出为因变量
如果我们想查看这个⼈的收⼊和⽉均信⽤卡⽀出是否有显著的相关性,以及它们之间的数量关系。
可以把这两列数据复制到⼀个新的⼯作表中
我们想看收⼊和⽀出的数量关系
⾸先:⽂件→选项→加载项;查看数据分析库是否在活⽤应⽤程序加载项中,若在不在,那么肯定在⾮活动应⽤程序加载项中,就要把它转到活动应⽤程序加载项⾥⾯
这样的话,在数据⾥⾯就有数据分析这项功能了
具体步骤如下
①对缺失值进⾏处理,可以⽤均值进⾏填补。
average函数得出均值
然后筛选第⼀列:开始→排序和筛选→筛选
取消全选,选中空⽩,点击确定
这样就会把所有缺失值筛选出来
再⽤刚刚算出来的平均数去填补缺失值
没有了缺失值,就可以正常去操作数据了
②数据→数据分析→回归→确定
会弹出这个框,我们先把Y值区域和X区域选中进去
第⼀⾏有标签⾏的话,就要勾选标志这个选项,这样计算机在计算的时候就会忽略标签⾏
点击确定,会得到下列数据
最后两⾏数据就是回归结果
Intercept这⼀⾏不管,我们重点是看第⼆⾏Income。
一元回回归的实验报告excel
摘要:
一、实验目的和要求
二、实验原理
三、实验内容
四、实验方法和步骤
五、实验结果分析
六、实验总结
正文:
一、实验目的和要求
本次实验旨在帮助学生掌握一元线性回归的估计与应用,熟悉Excel 的基本操作。
实验要求学生应用教材上的例题进行一元线性回归分析,并进行预测。
二、实验原理
一元线性回归是一种常用的回归分析方法,它的目标是找到一个线性方程,使得这个方程能够最佳地表示自变量和因变量之间的关系。
普通最小二乘法是一元线性回归的一种常用方法。
三、实验内容
本次实验的内容包括:应用Excel 进行一元线性回归分析,并对结果进行预测。
四、实验方法和步骤
1.打开Excel,新建一个工作表,将数据输入到工作表中。
2.选中数据区域,点击“数据”菜单,选择“数据分析”。
3.在弹出的对话框中,选择“回归”,然后点击“确定”。
4.在回归分析对话框中,设置“因变量区域”和“自变量区域”,然后点击“确定”。
5.观察回归分析结果,包括斜率、截距、R 方等。
6.根据回归方程进行预测。
五、实验结果分析
根据实验结果,我们可以得到一元线性回归方程,并通过这个方程对未来的值进行预测。
同时,我们可以通过分析R 方等指标,来评估回归方程的拟合效果。
六、实验总结
通过本次实验,学生应该能够掌握一元线性回归的分析方法,并能够利用Excel 进行回归分析和预测。
Excel 财务应用 一元线性回归预测在回归分析中,当研究的因果关系只涉及因变量和一个自变量时,叫做一元回归分析。
在实际预测中,选取与预测量(Y )最紧密的一个影响因素作为自变量(X ),建立回归方程,配合回归曲线,对参数进行统计检验,从而对预测值进行精度检验和置信区间的估计。
为了研究某一化学反应过程中温度x 对产品生产率Y 的影响,下面利用一元线性回归预测分析来解决这一问题。
1.建立回归方程回归方程是对变量之间统计关系进行定量描述的一种数学表达式。
例如,在工作表中,输入温度与产品生产率的相应数据,如图8-36所示。
试用该工作表中的数据,预测温度为200℃时产品的生产率。
图8-36 温度与生产率基本数据在Excel 中对于一元线性回归提供了两种建立回归方程的方法,下面进行详细介绍。
通过SLOPE 和INTERCEPT 函数首先,对这两个函数进行介绍。
其中,SLOPE 函数返回根据known_y's 和known_x's 中的数据点拟合的线性回归直线的斜率。
斜率为直线上任意两点的重直距离与水平距离的比值,也就是回归直线的变化率。
语法:SLOPE(known_y's,known_x's)其中,Known_y's 表示为数字型因变量数据点数组或单元格区域。
Known_x's 表示为自变量数据点集合。
提 示如果 known_y's 和 known_x's 为空或其数据点个数不同,函数 SLOPE 返回错误值 #N/A 。
INTERCEPT 函数是利用现有的x 值与y 值计算直线与y 轴的截距。
截距为穿过已知的kn own_x's 和known_y's 数据点的线性回归线与y 轴的交点。
当自变量为0(零)时,使用INT ERCEPT 函数可以决定因变量的值。
语法:INTERCEPT(known_y's,known_x's)其中,Known_y's 表示因变的观察值或数据集合。
EXCEL一元线性回归一、概述在数据分析中,对于成对成组数据的二、一元线性回归基本概念➢一元线性回归方程的建立回归系数ˆˆˆiiy x αβ=+αβˆi yˆi i i e y y=-[]222111ˆ(,)()()nnniii ii i i i Q eyyyx αβαβ=====-=-+∑∑∑(,)Q αβ,αβ,αβ1111222111()()()()ˆ()()n n i i n ni i i i i i xy i i nnxxii ni i ii x y x x y y x y L n L xx x xnβ=======---===--∑∑∑∑∑∑∑ˆˆy xαβ=-根据最小二乘法,可以得到一组正规方程组,对方程组求解,即可得到回归系数, 的计算式:ˆαˆβ三、软件(EXCEL)实现过程本功能需要使用Excel扩展功能,如果Excel尚未安装数据分析,需加载“分析数据库”。
加载成功后,可以在“数据”菜单中看到“数据分析”选项汽车马力(HP)每加仑汽油行驶里程(MPG)4965.455565555.970495346.57046.25545.46259.26253.38043.47341.49240.99240.97340.46639.67339.37838.99238.87838.29042.29240.97440.79540散点图直线拟合分析结果SUMMARY OUTPUT回归统计Multiple R 0.789925583R Square 0.623982426Adjusted R Square0.619282206标准误差6.174780275观测值82方差分析df SS MS F Significance F 回归分析15061.709525061.709523132.75601341.13931E-18残差803050.2329238.12791145总计818111.94244Coefficients标准误差t Stat P-value Lower 95%Upper 95%下限95.0%上限95.0%Intercept 50.07566277 1.5696920531.90158406 2.94532E-4746.951876153.199449446.951876153.19944943X Variable 1-0.1390738520.01207031-11.521979581.13931E-18-0.163094531-0.1150532-0.163094531-0.115053172Y=-0.1391+50.075和前面散点图直线拟合的结果一致“回归”工具为我们提供残差图、线性拟合图:线性拟合图谢谢!请批评指正!。
execl回归方程
在Excel中计算回归方程,需要使用Excel的回归分析功能。
以下是具体的步骤:
准备数据:将需要计算回归方程的数据输入到Excel中,两列数据分别为自变量和因变量。
插入数据分析工具:在Excel的“数据”选项卡中选择“数据分析”,然后选择“回归”选项。
设置回归参数:在回归对话框中,选择自变量和因变量的数据区域,并选择输出区域,例如新的一列或新的工作表。
执行回归分析:单击“确定”按钮,Excel将计算回归方程的系数和截距,并将结果显示在指定的输出区域中。
解读结果:在回归结果中,会显示回归方程的斜率和截距值,同时还会显示其他统计信息,如判定系数、调整判定系数、标准误差等。
需要注意的是,Excel的回归分析功能需要Excel的高级版本才能使用。
另外,在使用回归分析时,需要注意数据的分布和异常值等情况,以确保结果的准确性和可靠性。
收稿日期:2006-08-20作者简介:赵丽娟(1974-),女,河北曲周人,邯郸职业技术学院经济系讲师。
Excel 在一元线性回归预测分析中的应用赵丽娟1 冯韶华2(1邯郸职业技术学院经济系,河北邯郸 056001;2河北工程大学,河北邯郸 056038)摘要:预测是企业决策的前提与基础,Excel 是一个具有强大功能的数据管理与分析软件。
我们可以运用Excel 进行回归分析预测,以提高工作效率。
通过案例分析,运用Excel 函数与数据分析工具两种方法建立一元线性回归预测分析模型,并进行回归分析的预测。
关键词:Excel ;一元线性回归;预测中图分类号:TP391.13 文献标识码:A 文章编号:1009-5462(2006)04-0066-06 现代企业经营管理离不开决策,决策的正确与否关系到企业的生存与发展。
而正确的决策要依据正确的预测,预测分析是决策的前提与基础。
预测分析的方法种类繁多,随分析对象和预测期限不同而有差异,但基本方法可分为定量分析法和定性分析法。
回归分析法是根据事物的因果关系对变量的预测方法,它是定量预测方法的一种。
因果关系普遍存在,比如,收入对消费支出的影响预测、产量对生产成本的影响预测、销量的预测、资金需要量的预测等,都可以运用回归分析法建立数学模型,进行预测分析。
Excel 是一个功能强大的数据管理与分析软件,我们可以运用Excel 函数与数据分析进行回归分析预测。
一、一元线性回归预测法的基本原理该方法是指影响市场变化的因素虽然是多方面的,但存在一个因素是最基本的、起决定作用的,而且自变量与因变量之间的数据分布成线性(直线)趋势,那么就可以运用一元线性回归方程y =a +bx 进行预测。
这里,y 是因变量,x 是自变量,a ,b 均为参数,其中b 为回归系数,表示当x 每增加一个单位时,y 的平均增加数量。
例如要对城镇居民消费支出的发展趋势进行预测,首先要找到影响城镇居民消费支出的影响因素。
一线性回归方程——利用公式LINEST
LINEST:使用最小二乘法对已知数据进行最佳直线拟合,并返回描述此直线的数组。
因为此函数返回数值数组,所以必须以数组公式的形式输入。
例如有如下数据:
1.选择A6:B6
2.插入函数f x在统计里找到函数LINEST
3.选择Y轴数据、X轴数据,按确定
4.按F2,再按Ctrl+Shift+Enter,就会出现如下结果,其中A6中出现的结果是线性方程的斜率,B6中出现的结果是线性方程Y 轴的截距
A B
1 已知y 已知x
2 1 0
3 9 4
4 5 2
5 7 3
6 21
斜率Y轴截距
二相关系数——利用公式CORREL
CORREL:返回单元格区域array1 和array2 之间的相关系数。
使用相关系数可以确定两种属性之间的关系。
例如有如下数据:
1.选择B7
2.插入插入函数f x在统计里找到函数CORREL
3.在Array1和Array2中分别选择数据1和数据2(或者数据2和
数据1,结果一样)
4.按确定。
出现如下结果。
其中B7的数据就是数据1和数据2的
相关系数。
实验四(1)用Excel作一元线性回归分析
实验名称:回归分析
实验目的:学会应用软件实验一元线性回归,多元线性回归和非线性回归模型的求解及应用模型解决相应地理问题。
1 利用Excel进行一元线性回归分析
第一步,录入数据
以连续10年最大积雪深度和灌溉面积关系数据为例予以说明。
录入结果见下图(图1)。
图1
第二步,作散点图
如图2所示,选中数据(包括自变量和因变量),点击“图表向导”图标;或者在
“插入”菜单中打开“图表(H)”。
图表向导的图标为。
选中数据后,数据变为蓝色(图2)(office2003)。
插入-图表(office2007)
图2
点击“图表向导”以后,弹出如下对话框(图3):
图3
在左边一栏中选中“XY散点图”,点击“完成”按钮,立即出现散点图的原始形式(图4):
灌溉面积y(千亩)
01020304050600
10
20
30
灌溉面积y(千亩)
图4
第三步,回归
观察散点图,判断点列分布是否具有线性趋势。
只有当数据具有线性分布特征时,才能采用线性回归分析方法。
从图中可以看出,本例数据具有线性分布趋势,可以进行线性回归。
回归的步骤如下:
⑴ 首先,打开“工具”下拉菜单,可见数据分析选项(见图5)
(office2003)。
数据-数据分析(office2007)
:
图5 用鼠标双击“数据分析”选项,弹出“数据分析”对话框(图6):
图6
⑵然后,选择“回归”,确定,弹出如下选项表(图7):
图7
进行如下选择:X、Y值的输入区域(B1:B11,C1:C11),标志,置信度(95%),新工作表组,残差,线性拟合图(图8-1)。
或者:X、Y值的输入区域(B2:B11,C2:C11),置信度(95%),新工作表组,残差,线性拟合图(图8-2)。
注意:选中数据“标志”和不选“标志”,X、Y值的输入区域是不一样的:前者包括数据标志:
最大积雪深度x(米)灌溉面积y(千亩)
后者不包括。
这一点务请注意(图8)。
图8-1 包括数据“标志”
图8-2 不包括数据“标志”
⑶再后,确定,取得回归结果(图9)。
图9 线性回归结果
⑷ 最后,读取回归结果如下:
截距:356.2=a ;斜率:813.1=b ;相关系数:989.0=R ;测定系数:979.02=R ;F 值:945.371=F ;t 值:286.19=t ;标准离差(标准误差):419.1=s ;回归平方和:854.748SSr =;剩余平方和:107.16SSe =;y 的误差平方和即总平方和:961.764SSt =。
⑸ 建立回归模型,并对结果进行检验
模型为:x y
813.1356.2ˆ+= 至于检验,R 、R 2、F 值、t 值等均可以直接从回归结果中读出。
实际上,8,05.0632.0989416.0R R =>=,检验通过。
有了R 值,F 值和t 值均可计算出来。
F 值的计算公式和结果为:
8,05.022
22
32.5945.371)
989416.01(1
1101
989416
.0)
1(1
1
F R k n R F =>=---=
---=
显然与表中的结果一样。
t 值的计算公式和结果为:
8,05.02
306.2286.191
110979416.01979416.01
1t k n R R t =>=---=
---=
回归结果中给出了残差(图10),据此可以计算标准离差。
首先求残差的平方
2
2)ˆ(i i i y
y -=ε,然后求残差平方和107.16174.0724.1101
2
=++==∑== n i i
S ε
,于是标准
离差为
419.18
107.161)ˆ(1112
===---=
∑=S v y y k n s n
i i
i 于是
15.0~1.0%15~100388.053
.36419.1=<==y s
图10 y 的预测值及其相应的残差等
进而,可以计算DW 值(参见图11),计算公式及结果为
751.0417
.0)911.1()313.1()833.0417.0()313.1911.1()(DW 2
22221
22
2
1=++-+--+++-=-=
∑∑==- n
i i
n
i i i ε
εε
取05.0=α,1=k ,10=n (显然81110=--=v ),查表得94.0=l d ,29.1=u d 。
显然,DW=0.751<94.0=l d ,可见有序列正相关,预测的结果令人怀疑。
图11 利用残差计算DW值
(DW取值范围0<DW<4.其统计学意义:
当DW值愈接近2时,残差项间愈无相关。
当DW值愈接近0时,残差项间正相关愈强。
当DW值愈接近4时,残差项间负相关愈强。
)
♣最后给出利用Excel快速估计模型的方法:
⑴用鼠标指向图4中的数据点列,单击右键,出现如下选择菜单(图12):
图12
⑵点击“添加趋势线(R)”,弹出如下选择框(图13):
图13
⑶ 在“分析类型”中选择“线性(L)”,然后打开选项单(图14):
图14
⑷ 在选择框中选中“显示公式(E)”和“显示R 平方值(R)”(如图14),确定,立即得到回归结果如下(图15):
图表标题
y = 1.8129x + 2.3564
R 2 = 0.9789
01020304050600
10
20
30
灌溉面积y(千亩)线性 (灌溉面积y(千亩))
图15
在图15中,给出了回归模型和相应的测定系数即拟合优度。
♠ 顺便说明残差分析:如果在图8中选中“残差图(D)”,则可以自动生成残差图(图12)。
图16
回归分析原则上要求残差分布是无趋势的,如果在图中添加趋势线,则趋势线应该是与x 轴平行的,且测定系数很小。
事实上,添加趋势线的结果如下(图17):
图17
可见残差分布图基本满足回归分析的要求。
♣预测分析
虽然DW检验似乎不能通过,但这里采用的变量相关分析,与纯粹的时间序列分析不同(时间序列分析应该以时间为自变量)。
从残差图看来,模型的序列似乎并非具有较强的自相关性,因为残差分布相当随机。
因此,仍有可能进行预测分析。
现在假定:有人在1981年测得最大积雪深度为27.5米,他怎样预测当年的灌溉面积?
下面给出Excel2000的操作步骤:
⑴在图9所示的回归结果中,复制回归参数(包括截距和斜率),然后粘帖到图1所示的原始数据附近;并将1981年观测的最大积雪深度27.5写在1980年之后(图18)。
图18
⑵ 将光标至于图18所示的D2单元格中,按等于号“=”,点击F2单元格(对应于截距a=2.356…),按F4键,按加号“+”,点击F3单元格(对应于斜率b=1.812…),按F4键,按乘号“*”,点击B2单元格(对应于自变量x 1),于是得到表达式
“=$F$2+$F$3*B2”(图19),相当于表达式11*ˆx b a y
+=,回车,立即得到9128.29ˆ1=y
,即1971年灌溉面积的计算值。
图19
⑶ 将十字光标标至于D2单元格的右下角,当粗十字变成细十字以后,按住鼠标左键,往下一拉,各年份的灌溉面积的计算值立即出现,其中1981年对应的D12单元格的
52.212
即我们所需要的预测数据,即有212.52ˆ11=y
千亩(图20)。
图20
⑷ 进一步地,如果可以测得1982年及其以后各年份的数据,输入单元格B13及其下面的单元格中,在D13及其以下的单元格中,立即出现预测数值。
例如,假定1982年的最大
积雪深度为7.2312=x 米,可以算得323.45ˆ12=y
千亩;1983年的最大积雪深度为7.1513=x ,容易得到819.31ˆ13=y
千亩(图21)。
图21 预测结果(1981-1983)。