第8章回归分析
- 格式:docx
- 大小:18.08 KB
- 文档页数:5
第八章 相关分析与回归分析习题参考答案一、名词解释函数关系:函数关系亦称确定性关系,是指变量(现象)之间存在的严格确定的依存关系。
在这种关系中,当一个或几个相互联系的变量取一定的数值时,必定有另一个且只有一个变量有确定的值与之对应。
相关关系:是指变量(现象)之间存在着非严格、不确定的依存关系。
在这种关系中,当一个或几个相互联系的变量取一定的数值时,可以有另一变量的若干数值与之相对应。
这种关系不能用完全确定的函数来表示。
相关分析:相关分析主要是研究两个或者两个以上随机变量之间相互依存关系的方向和密切程度的方法,直线相关用相关系数表示,曲线相关用相关指数表示,多元相关用复相关系数表示。
回归分析:回归分析是研究某一随机变量关于另一个(或多个)非随机变量之间数量关系变动趋势的方法。
其目的在于根据已知非随机变量来估计和预测随机变量的总体均值。
单相关:单相关是指仅涉及两个变量的相关关系。
复相关:复相关是指一个变量对两个或者两个以上其他变量的相关关系。
正相关:正相关是指两个变量的变化方向是一致的,当一个变量的值增加(或减少)时,另一变量的值也随之增加(或减少)。
负相关:负相关是指两个变量的变化方向相反,即当一个变量的值增加(或减少)时,另一个变量的值会随之减少(或增加)。
线性相关:如果相关的两个变量对应值在直角坐标系中的散点图近似呈一条直线,则称为线性相关。
非线性相关:如果相关的两个变量对应值在直角坐标系中的散点图近似呈现出某种曲线形式,则为非线性相关。
相关系数:相关系数是衡量变量之间线性相关密切程度及相关方向的统计分析指标。
取值在-1到1之间。
两个变量之间的简单样本相关系数的计算公式为:()()niix x y y r --∑二、单项选择1.B;2.D;3.D;4.C;5.A;6.D 。
三、判断题(正确的打“√”,错误的打“×”) 1.×; 2.×; 3.√; 4.×; 5.×; 6.×; 7.×; 8.√. 四、简答题1、什么是相关关系?相关关系与函数关系有什么区别?答:相关关系,是指变量(现象)之间存在着非严格、不确定的依存关系。
第8章 非线性回归思考与练习参考答案8.1 在非线性回归线性化时,对因变量作变换应注意什么问题?答:在对非线性回归模型线性化时,对因变量作变换时不仅要注意回归函数的形式, 还要注意误差项的形式。
如:(1) 乘性误差项,模型形式为e y AK L αβε=, (2) 加性误差项,模型形式为y AK L αβε=+对乘法误差项模型(1)可通过两边取对数转化成线性模型,(2)不能线性化。
一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式,为了方便通常省去误差项,仅考虑回归函数的形式。
8.2为了研究生产率与废料率之间的关系,记录了如表8.15所示的数据,请画出散点图,根据散点图的趋势拟合适当的回归模型。
表8.15生产率x (单位/周) 1000 2000 3000 3500 4000 4500 5000 废品率y (%)5.26.56.88.110.2 10.3 13.0解:先画出散点图如下图:5000.004000.003000.002000.001000.00x12.0010.008.006.00y从散点图大致可以判断出x 和y 之间呈抛物线或指数曲线,由此采用二次方程式和指数函数进行曲线回归。
(1)二次曲线 SPSS 输出结果如下:Model Summ ary.981.962.942.651R R SquareAdjusted R SquareStd. E rror of the EstimateThe independent variable is x.ANOVA42.571221.28650.160.0011.6974.42444.2696Regression Residual TotalSum of Squares dfMean SquareF Sig.The independent variable is x.Coe fficients-.001.001-.449-.891.4234.47E -007.0001.4172.812.0485.843 1.3244.414.012x x ** 2(Constant)B Std. E rror Unstandardized Coefficients BetaStandardizedCoefficientstSig.从上表可以得到回归方程为:72ˆ 5.8430.087 4.4710yx x -=-+⨯ 由x 的系数检验P 值大于0.05,得到x 的系数未通过显著性检验。
第八章 方差分析与回归分析§8.1 方差分析8.1.1 问题的提出举例说明概念因子和水平。
因子:对研究对象产生影响的因素。
水平:因子所处的状态。
8.1.2 单因子方差分析的统计模型在研究中只考察一个因子则称为单因子试验,其中,记因子为A ,设其有r 个水平,记为r A A ,,1 ,在每一水平下考察的指标可以看成一个总体,现有r 个水平,故有r 个总体,假定:(1)每一总体均为正态总体,记为r i N i i ,,2,1),,(2;(2)各总体的方差相同,记222221 r ;(3)从每一总体中抽取的样本是相互独立的,即所有的试验结果ij y 都相互独立。
这些假定都可以用统计方法进行验证。
首先比较各水平下的均值是否相同,即要对如下的一个假设进行检验,不全相等r rH H ,,,::211210在不会引起误解的前提下,1H 通常可以省略不写。
若0H 成立,则称因子A 不显著,否则,称因子A 显著。
对如上的假设进行检验,需要从每一水平下的总体抽取样本,设从第i 个水平下的总体获得m 个试验结果(各个水平下相同),记ij y 表示第i 个总体的第j 次重复试验结果。
共得如下m r 个试验结果:m j r i y ij ,,1,,,1,其中r 为水平数,m 为重复数,i 为水平编号,j 为重复编号。
在水平i A 下的试验结果ij y 与该水平下的指标均值i 一般总是有差距的,记i ij ij y ,ij 称为随机误差,于是有ij i ij y上式称为试验结果ij y 的数据结构式。
把三个假定用于数据结构式就可以写出单因子方差分析的统计模型:),0(,,1,,,1,2 N m j r i y ij ij i ij 相互独立,且都服从诸为了能更好地描述数据,常引入总均值和效应的概念:总均值:诸i 的平均 ri i r r 11 ;称第i 水平下的均值i 与总均值 的差i i a ,r i ,,1为因子A 的第i 水平的主效应,简称为i A 的效应。
第8章回归分析第8章回归分析8.1线性回归分析的基本原理8.2图表分析与回归函数分析8.3Excel回归分析工具8.4多元回归分析8.5非线性回归分析本章学习目标u?回归分析的基本思想u?利用Excel图表进行线性回归分析u利用Excel回归分析工作表函数进行线性回归分析u利用Excel回归分析工具进行一元及多元线性回归分析u?非线性回归分析的基本思路8.1线性回归分析的基本原理8.1.1回归分析的概念8.1.2回归分析的主要内容8.1.1回归分析的概念首先要区分两种主要类型的变量:一种变量相当于通常函数关系中的自变量,对这样的变量能够赋予一个需要的值(如室内的温度、施肥量)或者能够取到一个可观测但不能人为控制的值(如室外的温度),这样的变量称为自变量;自变量的变化能引起另一些变量(如水稻亩产量)的变化,这样的变量称为因变量。
由一个或一组非随机变量来估计或预测某一个随机变量的观测值时,所建立的数学模型及所进行的统计分析,称为回归分析。
因此,回归分析是研究随机变量与非随机变量之间的数量关系的一种数学方法。
如果所建立的模型是线性的就称为线性回归分析。
线性回归分析不仅告诉我们怎样建立变量间的数学表达式,即经验公式,而且还利用概率统计知识进行分析讨论,判断出所建立的经验公式的有效性,从而可以进行预测或估计。
8.1.2回归分析的主要内容回归分析的内容包括如何确定因变量与自变量之间的回归模型;如何根据样本观测数据,估计并检验回归模型及未知参数;在众多的自变量中,判断哪些变量对因变量的影响是显著的,哪些变量的影响是不显著的;根据自变量的已知值或给定值来估计和预测因变量的值。
Excel提供了许多回归分析的方法与工具,它们可用于不同的分析目的。
8.2图表分析与回归函数分析8.2.1利用图表进行分析8.2.2Excel中的回归分析工作表函数8.2.3利用工作表函数进行回归分析8.2.1利用图表进行分析例8-1某种合成纤维的强度与其拉伸倍数之间存在一定关系,图8-1所示(“线性回归分析”工作表)是实测12个纤维样品的强度y与相应的拉伸倍数x的数据记录。
试求出它们之间的关系。
(1)打开“线性回归分析”工作表。
(2)在工具栏上选择“图表向导”按钮,单击打开图表向导对话框,如图8-2所示,在“图表类型”列表框中选择“XY散点图”,单击“下一步”按钮进入图表向导步骤2。
(3)在图表向导步骤2对话框的“数据区域”中输入“B2:C13”,选择“系列产生在”为“列”,如图8-3所示,单击“下一步”按钮进入步骤3。
(4)在图表向导步骤3的对话框中,打开“图例”页面,取消“显示图例”,省略标题,如图8-4所示。
(5)单击“完成”按钮,得到XY散点图如图8-5所示。
(6)在散点图中,把鼠标放在任一数据点上,右击,在快捷菜单中选择“添加趋势线”,打开趋势线对话框。
(7)在“添加趋势线”对话框中打开“类型”页面,选择“线性”选项,在“选项”页面中选择“显示公式”和“显示R平方”选项,单击“确定”按钮,得到趋势回归图,如图8-6所示。
8.2.2Excel中的回归分析工作表函数Excel提供的回归分析工作表函数主要有以下几个:(1)截距函数。
(2)斜率函数。
(3)测定系数函数。
(4)估计标准误差函数。
(1)截距函数。
其功能是利用现有的x值与y值计算直线与y轴的截距。
截距为穿过已知的known_x''s和known_y''s数据点的线性回归线与y轴的交点。
当自变量为0时,使用INTERCEPT函数可以决定因变量的值。
例如,当所有的数据点都是在室温或更高的温度下取得的,可以用INTERCEPT函数预测在0°C时金属的电阻。
语法:INTERCEPT(known_y''s,known_x''s)(2)斜率函数。
该函数返回根据known_y''s和known_x''s中的数据点拟合的线性回归直线的斜率。
斜率为直线上任意两点的垂直距离与水平距离的比值,也就是回归直线的变化率。
语法:SLOPE(known_y''s,known_x''s)其中:Known_y''s为数字型因变量数据点数组或单元格区域;Known_x''s为自变量数据点集合。
(3)测定系数函数。
(3)测定系数函数。
该函数返回根据k nown_y''s和known_x''s中数据点计算得出的乘积矩相关系数的平方。
R平方值可以解释为y方差与x方差的比例。
语法:RSQ (known_y''s,known_x''s)回归直线的斜率计算公式如下:(4)估计标准误差函数。
该函数返回通过线性回归法计算每个x的y预测值时所产生的标准误差。
标准误差用来度量根据单个x变量计算出的y预测值的误差量。
语法:STEYX(known_y'' s,known_x''s)其中:Known_y''s为因变量数据点数组或区域,Known_x''s为自变量数据点数组或区域。
预测值y的标准误差计算公式如下:8.2.3利用工作表函数进行回归分析例8-4在某大学一年级新生体检表中随机抽取10张,得到10名大学生的身高(x)和体重(y)的数据,如图8-10(“身高体重”工作表)所示。
用Excel提供的工作表函数进行相关计算。
(1)在单元格A12~A15中分别输入“截距”、“斜率”、“测定系数”、“估计标准误差”。
(2)在单元格B12中输入公式“=INT ERCEPT(C2:C11,B2:B11)”,回车后显示-79.42015。
(3)在单元格B13中输入公式“=SLOPE(C2:C11,B2:B11)”,回车后显示0.8041825。
(4)在单元格B14中输入公式“=RSQ(C2:C11,B2:B11)”,回车后显示0.6817018。
(5)在单元格B15中输入公式“=STEYX(C2:C11,B2:B11)”,回车后显示2.8180738。
计算结果如图8-8所示。
8.3Excel回归分析工具8.3.1回归分析工具的主要内容8.3.2回归分析工具的应用8.3.3回归分析工具的输出解释8.3.1回归分析工具的主要内容回归分析工具是通过对一组观察值使用“最小平方法”进行直线拟合,以分析一个或多个自变量对单个因变量的影响方向与影响程度的方法。
它是Excel中数据分析工具的一个内容。
在“工具”菜单中选择“数据分析”选项,会出现“数据分析”对话框,在分析工具中选择“回归”,单击“确定”按钮就会进入“回归”对话框,如图8-12所示。
在此对话框中主要包括以下内容:Y值输入区域:X 值输入区域:标志:置信度:常数为零:输出区域:新工作表组:新工作簿:残差:标准残差:残差图:线形拟合图:正态概率图:8.3.2回归分析工具的应用例8-5以例8-4资料为例,利用回归分析工具进行回归分析。
(1)打开“身高体重”工作表。
(2)在“工具”菜单中选择“数据分析”选项,在“分析工具”列表中选择“回归”,单击“确定”按钮,打开“回归”对话框。
(3)在“Y值输入区域”中输入“$C$1:$C$11”,在“X值输入区域”中输入“$B$1:$B$11”;选择“标志”,置信度默认;在“输出选项”中选择“输出区域”,在其右边输入“$D$ 1”,如图8-13所示,单击“确定”按钮输出结果,如图8-14所示。
8.3.3回归分析工具的输出解释Excel回归分析工具的输出结果包括3个部分:1.回归统计表2.方差分析表3.回归参数表回归统计表包括以下几部分内容:(1)MultipleR(复相关系数R):(2)RSquare(复测定系数R2):(3)AdjustedRSquare(调整复测定系数R2):(4)标准误差:(5)观测值:8.4多元回归分析例8-6有一个工厂会计部门在估计每月管理费y时,用工人的劳动日数x1与机器的开工台数x2作自变量,现将当年10个月的数据搜集起来,如图8-15(“多元回归分析”工作表)所示,估计y对x1与x2的线性回归方程(α=0.05)。
(1)在“工具”菜单中选择“数据分析”选项,在“分析工具”列表中选择“回归”,单击“确定”按钮,打开“回归”对话框。
(2)在“Y值输入区域”中输入“D1:D11”,在“X值输入区域”中输入“B1:C11”;选择“标志”,置信度默认;在“输出选项”中选择“输出区域”,在其右边输入“A12”,单击“确定”按钮输出结果,如图8-16所示。
8.5 非线性回归分析以最小平方法分析非线性关系资料在数量变化上的规律叫做非线性回归分析。
从非线性回归的角度看,线性回归仅是其中的一个特例。
一个恰当的非线性回归方程的确定不是很容易的,一般要经过变量转换,将非线性问题转化为线性问题解决。
下面讨论几种非线性方程线性化的情况。
1.(1)添加趋势线。
(2)利用回归分析工具。
2.3.返回本节图8-13“回归”对话框图8-14回归分析结果返回本节返回本节返回首页图8-15“多元回归分析”工作表图8-16二元线性回归分析计算结果返回本节返回首页表8-1微量元素超标量与患病人数返回首页返回本节返回本节返回首页图8-1“线性回归分析.xls”工作表图8-2图表向导(步骤1)图8-3图表向导(步骤2)图8-4图表向导(步骤3)图8-5XY散点图图8-6趋势回归直线返回本节图8-7x、y数据图8-8计算截距图8-9计算斜率返回本节图8-10“身高体重”工作表图8-11“身高体重”回归计算结果返回本节返回首页。