第3章 回归预测方法
- 格式:doc
- 大小:311.00 KB
- 文档页数:8
第3章回归预测方法思考与练习(参考答案)1.简要论述相关分析与回归分析的区别与联系。
答:相关分析与回归分析的主要区别:(1)相关分析的任务是确定两个变量之间相关的方向和密切程度。
回归分析的任务是寻找因变量对自变量依赖关系的数学表达式。
(2)相关分析中,两个变量要求都是随机变量,并且不必区分自变量和因变量;而回归分析中自变量是普通变量,因变量是随机变量,并且必须明确哪个是因变量,哪些是自变量;(3)相关分析中两变量是对等的,改变两者的地位,并不影响相关系数的数值,只有一个相关系数。
而在回归分析中,改变两个变量的位置会得到两个不同的回归方程。
联系为:(1)相关分析是回归分析的基础和前提。
只有在相关分析确定了变量之间存在一定相关关系的基础上建立的回归方程才有意义。
(2)回归分析是相关分析的继续和深化。
只有建立了回归方程才能表明变量之间的依赖关系,并进一步进行预测。
2.某行业8个企业的产品销售额和销售利润资料如下:根据上述统计数据:(1)计算产品销售额与利润额的相关系数;r ,说明销售额与利润额高度相关。
解:应用Excel软件数据分析功能求得相关系数0.9934(2)建立以销售利润为因变量的一元线性回归模型,并对回归模型进行显著性检验(取α=);解:应用Excel 软件数据分析功能求得回归方程的参数为: 7.273,0.074a b =-=据此,建立的线性回归方程为 ˆ7.2730.074Yx =-+ ① 模型拟合优度的检验由于相关系数0.9934r =,所以模型的拟合度高。
② 回归方程的显著性检验应用Excel 软件数据分析功能得0.05ˆ=450.167(1,6) 5.99F F >=,说明在α=水平下回归效果显著.③ 回归系数的显著性检验0.025ˆ=21.22(6) 2.447tt >=,说明在α=水平下回归效果显著. 实际上,一元线性回归模型由于自变量只有一个,因此回归方程的显著性检验与回归系数b 的显著性检验是等价的。
回归预测法回归预测法回归预测法是指根据预测的相关性原则,找出影响预测目标的各因素,并用数学方法找出这些因素与预测目标之间的函数关系的近似表达,再利用样本数据对其模型估计参数及对模型进行误差检验,一旦模型确定,就可利用模型,根据因素的变化值进行预测。
回归预测法一元线性回归预测法(最小二乘法)公式:Y = a + b XX----自变量Y----因变量或预测量a,b----回归系数根据已有的历史数据Xi Yi i = 1,2,3,...n ( n 为实际数据点数目),求出回归系数 a , b为了简化计算,令 ( X1 + X2 + ... + Xn ) = 0,可以得出a , b 的计算公式如下:a = ( Y1 + Y2 +... + Yn ) / nb = ( X1 Y1 + X2 Y2 + ... + Xn Yn ) / ( X12 + X22 + ... + Xn2 )回归分析预测法的概念回归分析预测法,是在分析市场现象自变量和因变量之间相关关系的基础上,建立变量之间的回归方程,并将回归方程作为预测模型,根据自变量在预测期的数量变化来预测因变量关系大多表现为相关关系,因此,回归分析预测法是一种重要的市场预测方法,当我们在对市场现象未来发展状况和水平进行预测时,如果能将影响市场预测对象的主要因素找到,并且能够取得其数量资料,就可以采用回归分析预测法进行预测。
它是一种具体的、行之有效的、实用价值很高的常用市场预测方法。
回归分析预测法的分类回归分析预测法有多种类型。
依据相关关系中自变量的个数不同分类,可分为一元回归分析预测法和多元回归分析预测法。
在一元回归分析预测法中,自变量只有一个,而在多元回归分析预测法中,自变量有两个以上。
依据自变量和因变量之间的相关关系不同,可分为线性回归预测和非线性回归预测。
回归分析预测法的步骤1.根据预测目标,确定自变量和因变量明确预测的具体目标,也就确定了因变量。
如预测具体目标是下一年度的销售量,那么销售量Y就是因变量。
回归预测一种怎样的方法
回归预测是通过建立一个数学模型来预测一个或多个连续型变量的值。
以下是一种常用的回归预测方法:
1. 线性回归(Linear Regression):线性回归是最简单和最常用的回归方法之一。
它的目标是找到一条直线(或超平面),使得预测值与实际观测值的差别最小化。
2. 多项式回归(Polynomial Regression):多项式回归在线性回归的基础上,引入了多次项及其交互作用,适用于非线性的问题。
3. 支持向量回归(Support Vector Regression, SVR):SVR基于支持向量机,在线性回归的基础上加入了核函数,可以处理非线性问题。
4. 决策树回归(Decision Tree Regression):决策树回归通过将特征空间划分为多个区域,每个区域对应一个预测值。
适用于非线性、非参数化的问题。
5. 随机森林回归(Random Forest Regression):随机森林通过构建多棵决策树进行预测,综合多个决策树的预测结果来提高准确性。
6. 梯度提升回归(Gradient Boosting Regression):梯度提升回归通过迭代训练多个弱分类器,并使用之前分类器的残差来训练下一个分类器,从而提高预测
准确性。
除了上述方法,还有很多其他回归预测方法,如岭回归(Ridge Regression)、LASSO回归(Least Absolute Shrinkage and Selection Operator Regression)、贝叶斯回归(Bayesian Regression)等。
根据具体问题和数据情况,选择适合的回归模型进行预测。
第三章 回归预测法 第一节 一元线性回归预测法一元线性回归预测法是指成对的两个变量数据分布大体上呈直线趋势时,采用适当的计算方法,找到两者之间特定的经验公式,即一元线性回归模型,然后根据自变量的变化,来预测因变量发展变化的方法。
一、建立模型一元线性回归模型可表述为:i i i u x b b y ++=10,n i ,,1 =。
其中0b 、1b 是未知参数;i u 为剩余残差(或随机扰动)二、估计参数 三、进行检验 一元线性回归模型:⎩⎨⎧=++=.),0(...;,,1,210σN d i i u n i u x b b y ii i i 诸 ㈠标准误差∑=∧--=-==n i ii y y n n SSE MSE SE 12)(212 ㈡可决系数SSTSSESST SSR y yy y y y x x y y x x R ni ini ini i n i i n i i i -==--=--⎪⎭⎫⎝⎛--=∑∑∑∑∑==∧===1)()()()())((12121212212 ㈢相关系数∑∑∑===----=ni i ni ini i iy y x xy y x xr 12121)()())((说明:可查《概率论与数理统计教程》中的相关系数的临界值表。
㈣回归系数显著性检验0H :01=b vs 1H :01≠b ,由于,)2(~)2()2(112211---=--∧∧n t l n SSEb b n SSEl b b xxxxσσ,所以当0H 为真时,统计量)2(~)2(1--=∧n t l n SSEb t xx。
㈤F 检验(用于对回归模型作检验)0H :回归方程不显著 vs 1H :回归方程显著统计量)2,1(~)2()(1)(1212-=---=∑∑=∧=∧n F MSEMSRn y yy y F ni i ini i㈥德宾-沃森统计量(W D -)(用于检验i u 之间是否存在自相关关系) 如前所述,回归模型的剩余项i u 之间应该是相互独立的。
回归预测法,是分析因变量与自变量之间相互关系,用回归方程表示,根据自变量的数值变化,去预测因变量数值变化的方法。
在经济预测中,人们把预测对象当作因变量,把那些与预测对象有关的因素当作自变量,收集自变量的充分数据,应用相关分析和回归分析求得回归方程,并利用回归方程进行预测。
回归预测法中的自变量,与时间序列预测法中的自变量不相同。
后者的自变量是时间本身,而前者的自变量不是时间本身,而是其他的变量。
回归预测法中的自变量与因变量之间,有的属于因果关系,有的屑于伴随关系。
不能认为只有因果关系才能进行回归预测,实际上伴随关系也是一种相关关系,只要收集大量的足够的资料,也可以用回归预测法进行预测。
在回归预测法中,自变量不是随机的或者是给定的,这与相关分析中自变量有所区别。
相关分析中的自变量是随机的。
二、回归预测法的条件在作回归预测时必须注意下列几个问题,这些问题是提高预测准确度的条件。
(1)经济现象之间,即作为因变量与自变量之间必须有关系。
怎样剖析两者有相关关系呢?从根本上说,只有通过马克思主义政治经济学的理论分析,才能正确作出判断,正确认识经济现象之间的内在的必然联系和外部的偶然联系,不为假相关所迷惑。
因此,切不可轻视理论分析而草率运用回归预测法。
(2)因变量与自变量之间的关系必须密切,要有强相关,而自变量与另一个自变量之间的关系,必须不密切,要求弱相关或零相关。
判断相关关系密切程度的方法,可以通过绘制相关图和计算相关系数。
根据历史资料绘制的相关图能判断相关的类型。
相关图的类型如有以下几种。
①零相关图。
当自变量x与因变量y没有相关关系,称为零相关,如图10-1。
②强正相关图。
当自变量x增大时,因变量y亦随之增大,点子的分布集中,呈直线形。
故两者有强相关。
如图10-2。
③弱正相关图。
当自变量x的数值增大时,y的数值也增大,但点子的分布不集中,两者之间仅有一定相关关系,称弱正相关。
如图10-3。
④强负相关图。
当自变量x增大时,因变量y亦随之减少,点子的分布集中呈直线形,两者之间有强烈的相关关系,称强负相关。
第3章回归预测方法思考与练习(参考答案)1.简要论述相关分析与回归分析的区别与联系。
答:相关分析与回归分析的主要区别:(1)相关分析的任务是确定两个变量之间相关的方向和密切程度。
回归分析的任务是寻找因变量对自变量依赖关系的数学表达式。
(2)相关分析中,两个变量要求都是随机变量,并且不必区分自变量和因变量;而回归分析中自变量是普通变量,因变量是随机变量,并且必须明确哪个是因变量,哪些是自变量;(3)相关分析中两变量是对等的,改变两者的地位,并不影响相关系数的数值,只有一个相关系数。
而在回归分析中,改变两个变量的位置会得到两个不同的回归方程。
联系为:(1)相关分析是回归分析的基础和前提。
只有在相关分析确定了变量之间存在一定相关关系的基础上建立的回归方程才有意义。
(2)回归分析是相关分析的继续和深化。
只有建立了回归方程才能表明变量之间的依赖关系,并进一步进行预测。
2.某行业8个企业的产品销售额和销售利润资料如下:根据上述统计数据:(1)计算产品销售额与利润额的相关系数;r ,说明销售额与利润额高度相关。
解:应用Excel软件数据分析功能求得相关系数0.9934(2)建立以销售利润为因变量的一元线性回归模型,并对回归模型进行显著性检验(取α=);解:应用Excel 软件数据分析功能求得回归方程的参数为: 7.273,0.074a b =-=据此,建立的线性回归方程为 ˆ7.2730.074Yx =-+ ① 模型拟合优度的检验由于相关系数0.9934r =,所以模型的拟合度高。
② 回归方程的显著性检验应用Excel 软件数据分析功能得0.05ˆ=450.167(1,6) 5.99F F >=,说明在α=水平下回归效果显著.③ 回归系数的显著性检验0.025ˆ=21.22(6) 2.447tt >=,说明在α=水平下回归效果显著. 实际上,一元线性回归模型由于自变量只有一个,因此回归方程的显著性检验与回归系数b 的显著性检验是等价的。
(3)若企业产品销售额为500万元,试预测其销售利润。
根据建立的线性回归方程 ˆ7.2730.074Y x =-+,当销售额500x =时,销售利润ˆ29.73Y=万元。
3.某公司下属企业的设备能力和劳动生产率的统计资料如下:该公司现计划新建一家企业,设备能力为千瓦/人,试预测其劳动生产率,并求出其95%的置信区间。
v1.0 可编辑可修改解:绘制散点图如下:散点图近似一条直线,计算设备能力和劳动生产率的相关系数为,故可以采用线性回归模型进行拟合。
应用Excel 软件数据分析功能求得回归方程的参数为: 3.115, 1.43a b ==据此,建立的线性回归方程为 ˆ 3.115+1.43Yx =,对模型进行检验如下: (1)模型拟合优度的检验由于相关系数0.9806r =,所以模型的拟合度高。
(2)回归方程的显著性检验应用Excel 软件数据分析功能得0.05ˆ=300.34(1,12) 4.75F F >=,说明在α=水平下回归效果显著.(3)回归系数的显著性检验0.025ˆ=17.33(12) 2.1788tt >=,说明在α=水平下回归效果显著. 当设备能力为千瓦/人时根据建立的线性回归模型ˆ 3.115+1.43Y x = ,可得劳动生产率ˆ13.41Y=。
其95%的置信区间为[,] 4.某市1977~1988 年主要百货商店营业额、在业人员总收入、当年竣工住宅面积的统计数据如下:年份 营业额/千万元 在业人员总收入/千万元 当年竣工住宅面积/万平方米 1977 1978根据上述统计数据:(1)建立多元线性回归模型;解:应用Excel 软件数据分析功能求得多元线性回归模型的参数为:0120.2233,0.1.0.077βββ===据此,建立的线性回归方程为 12ˆ0.22330.10.077Y x x =++ (2)对回归模型进行拟合优度检验、F 检验、t 检验和DW检验(取α=)解:①拟合度检验应用Excel 软件计算得0.9808R =,接近于1,说明模型的拟合程度越高 ②F 检验应用Excel 软件计算得ˆ113.88F =,查表得0.05(2,9) 4.26F =,故0.05ˆ(2,9)F F > 说明在α=水平下回归效果显著。
③t检验应用Excel 软件计算得12ˆˆ5.188,0.849tt ==,查表得0.025(9) 2.262t =,故10.025ˆ(9)t t >,说明在α=水平下1β显著不为0,自变量1x 对ˆY有显著影响,而20.025ˆ(9)t t <,故接受假设20β=,说明2x 对ˆY无显著影响。
④ DW 检验通过计算得21221()55.31DW 2.7919.84nii i nii e ee-==-===∑∑ 当0.05,2,12a m n ===时,查DW 检验表,因DW 检验表中,样本容量最低是15,故取:0.82, 1.75L U d d ==,则有4DW <4U L d d -<-之间。
由此可以得出检验无结论。
检验结果表明,不能判断回归模型是否存在自相关。
(3)假定该市在业人员总收入、当年竣工住宅面积在1988 年的基础上分别增长15%、17%,请对该市1989 年主要百货商店营业额作区间估计(取α=)。
解:回归方程为12ˆ0.22330.10.077Y x x =++。
但由于2x 对Y 无显著影响,故用方程1ˆ0.22330.1Y x =+做回归预测: 1ˆ0.22330.10.22330.1248.5 1.1528.8Y x =+=+⨯⨯= 预测区间为: 200ˆ[(1)]Y t n m S ε±--,即0.025[28.8(9) 1.4848]t ±⨯,故当 1989年在业人员总收入为 千万元时,在α=显著性水平上,营业额的区间估计为:[25.44,32.16] 千万元。
5.下表是某百货商店某年的商品销售额和商品流通费率数据,根据表中数据: (注:题中的商品销售额为分组数据,自变量取值可用其组中值)v1.0 可编辑可修改12-15 15-18 18-21 21-24 24-27(1)拟合适当的曲线模型;解:绘制散点如下根据散点图的形状,与双曲线函数接近,故采用双曲线模型。
设双曲线回归预测方程为:011Y xββ=+ 令1x x'=,则方程可转换为:01Y x ββ'=+ 应用Excel 软件数据分析功能求得参数为: 012.225,7.621ββ==,由此可得双曲线回归方程为:12.2257.621Y x=+(2)对模型进行显著性检验;(取α=)由于上述双曲线回归方程是通过对其变换后的线性方程01Y x ββ'=+而得到的,因此这里显著性检验主要对方程01Y x ββ'=+进行检验,包括:①模型拟合优度的检验相关系数0.9673r =,所以模型的拟合度高。
②回归方程的显著性检验应用Excel 软件数据分析功能得0.05ˆ=101.92(1,7) 5.59F F >=,说明在α=水平下回归效果显著.③回归系数的显著性检验0.025ˆ=12.079(7) 2.365tt >=,说明在α=水平下回归效果显著. 通过以上检验,说明回归预测方程12.2257.621Y x=+的检验是显著的(3)当商品销售额为13万元时,预测商品流通费率:当商品销售额为13万元时,预测商品流通费率为1ˆ 2.2257.621 2.811(%)13y=+⨯= 6.已知下表中(,)i i x Y 为某种产品销售额的时间序列数据,其中ix 为时间序号,i Y为产品销售额(单位:万元)。
试利用龚帕兹生长曲线预测2005年该产品的销售额。
解:将上述数据分为三组: 1996-1998为第一组,1999-2001为第二组,2002-2004为第三组;然后求各组的i Y 值的对数和:311ln 5.3984i i S Y ===∑,624ln 6.3064i i S Y ===∑, 937ln 6.7359i i S Y ===∑利用公式,求得:33221 6.7359 6.30640.42950.47116.3064 5.39480.9116S S b S S --====--,所以0.7781b =2122()(1)(6.3064 5.3948)(0.77811)ln 0.9268(1)(0.47111)0.7781r S S b a b b ---⨯-===--⨯-⨯ 所以0.3958a =1(1)0.47111ln 5.39480.7781(0.9268)10.77811ln 2.3713r b b S a b K r -⋅--⋅-⨯⨯---=== 所以10.71k =,则预测模型为:0.7781ˆ10.710.3958tY=⨯故100.77812005ˆ10.710.39589.933Y =⨯=(万元) 即2005年该产品的销售额预测为万元。