经典线性回归模型的诊断与修正
- 格式:docx
- 大小:398.77 KB
- 文档页数:8
经典线性回归模型经典回归模型在涉及到时间序列时,通常存在以下三个问题:1)非平稳性→ ADF单位根检验→ n阶单整→取原数据序列的n阶差分(化为平稳序列)2)序列相关性→D.W.检验/相关图/Q检验/LM检验→n阶自相关→自回归ar(p)模型修正3)多重共线性→相关系数矩阵→逐步回归修正注:以上三个问题中,前两个比较重要。
整体回归模型的思路:1)确定解释变量和被解释变量,找到相关数据。
数据选择的时候样本量最好多一点,做出来的模型结果也精确一些。
2)把EXCEL里的数据组导入到Eviews里。
3)对每个数据序列做ADF单位根检验。
4)对回归的数据组做序列相关性检验。
5)对所有解释变量做多重共线性检验。
6)根据上述结果,修正原先的回归模型。
7)进行模型回归,得到结论。
Eviews具体步骤和操作如下。
一、数据导入1)在EXCEL中输入数据,如下:除去第一行,一共2394个样本。
2)Eviews中创建数据库:File\new\workfile, 接下来就是这个界面(2394就是根据EXCEL里的样本数据来),OK3)建立子数据序列程序:Data x1再enter键就出来一个序列,空的,把EXCEL里对应的序列复制过来,一个子集就建立好了。
X1是回归方程中的一个解释变量,也可以取原来的名字,比如lnFDI,把方程中所有的解释变量、被解释变量都建立起子序列。
二、ADF单位根检验1)趋势。
打开一个子数据序列,先判断趋势:view\graph,出现一个界面,OK。
得到类似的图,下图就是有趋势的时间序列。
X1.4.2.0-.2-.4-.6-.8100020003000400050002)ADF检验。
直接在图形的界面上进行操作,view\unit root test,出现如下界面。
在第二个方框内根据时序的趋势选择,Intercept指截距,Trend为趋势,有趋势的时序选择第二个,OK,得到结果。
上述结果中,ADF值为-3.657113,t统计值小于5%,即拒绝原假设,故不存在单位根。
线性回归模型的建模与分析方法线性回归模型是一种常用的统计学方法,用于研究自变量与因变量之间的关系。
在本文中,我们将探讨线性回归模型的建模与分析方法,以及如何使用这些方法来解决实际问题。
一、线性回归模型的基本原理线性回归模型假设自变量与因变量之间存在线性关系,即因变量可以通过自变量的线性组合来预测。
其基本形式可以表示为:Y = β0 + β1X1 + β2X2 + ... + βnXn + ε其中,Y表示因变量,X1、X2、...、Xn表示自变量,β0、β1、β2、...、βn表示回归系数,ε表示误差项。
二、线性回归模型的建模步骤1. 收集数据:首先需要收集自变量和因变量的相关数据,确保数据的准确性和完整性。
2. 数据预处理:对数据进行清洗、缺失值处理、异常值处理等预处理步骤,以确保数据的可靠性。
3. 模型选择:根据实际问题和数据特点,选择适合的线性回归模型,如简单线性回归模型、多元线性回归模型等。
4. 模型拟合:使用最小二乘法等方法,拟合回归模型,得到回归系数的估计值。
5. 模型评估:通过统计指标如R方值、调整R方值、残差分析等,评估模型的拟合优度和预测能力。
6. 模型应用:利用已建立的模型进行预测、推断或决策,为实际问题提供解决方案。
三、线性回归模型的分析方法1. 回归系数的显著性检验:通过假设检验,判断回归系数是否显著不为零,进一步判断自变量对因变量的影响是否显著。
2. 多重共线性检验:通过计算自变量之间的相关系数矩阵,判断是否存在多重共线性问题。
若存在多重共线性,需要进行相应处理,如剔除相关性较高的自变量。
3. 残差分析:通过观察残差的分布情况,判断模型是否符合线性回归的基本假设,如误差项的独立性、正态性和方差齐性等。
4. 模型诊断:通过观察残差图、QQ图、杠杆值等,判断是否存在异常值、离群点或高杠杆观测点,并采取相应措施进行修正。
5. 模型优化:根据模型评估结果,对模型进行优化,如引入交互项、非线性变换等,以提高模型的拟合效果和预测准确性。
线性回归(异方差的诊断、检验和修补)—SPSS操作首先拟合一般的线性回归模型,绘制残差散点图。
步骤和结果如下:为方便,只做简单的双变量回归模型,以当前工资作为因变量,初始工资作为自变量。
(你们自己做的时候可以考虑加入其他的自变量,比如受教育程度等等)Analyze——regression——linear将当前工资变量拉入dependent框,初始工资进入independent点击上图中的PLOTS,出现以下对话框:以标准化残差作为Y轴,标准化预测值作为X轴,点击continue,再点击OK第一个表格输出的是模型拟合优度2R,为0.775。
调整后的拟合优度为0.774.第二个是方差分析,可以说是模型整体的显著性检验。
F统计量为1622.1,P值远小于0.05,故拒绝原假设,认为模型是显著的。
第三个是模型的系数,constant代表常数项,初始工资前的系数为1.909,t检验的统计量为40.276,通过P值,发现拒绝原假设,认为系数显著异于0。
以上是输出的残差对预测值的散点图,发现存在喇叭口形状,暗示着异方差的存在,故接下来进行诊断,一般需要诊断异方差是由哪个自变量引起的,由于这里我们只选用一个变量作为自变量,故认为异方差由唯一的自变量“初始工资”引起。
接下来做加权的最小二乘法,首先计算权数。
Analyze——regression——weight estimation再点击options,点击continue,再点击OK,输出如下结果:由于结果比较长,只贴出一部分,第二栏的值越大越好。
所以挑出来的权重变量的次数为2.7。
得出最佳的权重侯,即可进行回归。
Analyze——regression——linear继续点击save,在上面两处打勾,点击continue,点击ok这是输出结果,和之前同样的分析方法。
接下需要绘制残差对预测值的散点图,首先通过transform里的compute计算考虑权重后的预测值和残差。
经典线性回归模型的诊断与修正下表为最近20年我国全社会固定资产投资与GDP的统计数据:1
年份国内生产总值(亿元)GDP 全社会固定资产投资(亿元)PI
1996 71813.6 22913.5
1997 79715 24941.1
1998 85195.5 28406.2
1999 90564.4 29854.7
2000 100280.1 32917.7
2001 110863.1 37213.49
2002 121717.4 43499.91
2003 137422 55566.61
2004 161840.2 70477.43
2005 187318.9 88773.61
2006 219438.5 109998.16
2007 270232.3 137323.94
2008 319515.5 172828.4
2009 349081.4 224598.77
2010 413030.3 251683.77
2011 489300.6 311485.13
2012 540367.4 374694.74
2013 595244.4 446294.09 1数据来源于国家统计局网站年度数据
1、普通最小二乘法回归结果如下:
方程初步估计为:
GDP=75906.54+1.1754PI
(32.351)
R2=0.9822F=1046.599 DW=0.3653
2、异方差的检验与修正
首先,用图示检验法,生成残差平方和与解释变量PI的散点图如下:
从上图可以看出,残差平方和与解释变量的散点图主要分布在图形的下半部分,有随PI的变动增大的趋势,因此,模型可能存在异方差。
但是否确定存在异方差,还需作进一步的验证。
G-Q检验如下:
去除序列中间约1/4的部分后,1996-2003年的OLS估计结果如下所示:
残差平方和RSS1=4274.201.
2008-2015年的OLS估计结果如下:
残差平方和RSS2=2.39E+09.
根据G-Q检验,F统计量为
=2.39∗109/4274.201=559168.836>F0.057,7=3.79 F=RSS2
RSS1
因此,在5%的显著性水平下拒绝两组子样本方差相同的假设,即存在异方差。
Gleiser检验结果如下
参数的估计值显著地不为0,则可以认定模型存在着异方差。
异方差的修正:
运用加权最小二乘法对异方差进行修正
对加权后的模型进行异方差检验,结果如下:
已知White统计量n R2=3.682,由于χ20.052=5.991>3.682,因此,可以判断在给定
显著性水平0.05的情况下,加权后的模型不再存在异方差,说明异方差性已经消除。
3、序列相关性的检验与修正
序列相关性的检验如下:
做残差与残差滞后一期的散点图:
可以看出,E与E(-1)逐渐合拢,因此残差与其滞后一期的残差存在序列相关性。
D-W检验:
从OLS估计结果中可直接得到DW值为0.3653,给定α=0.05,已知n=20,k=2,查DW检验临界值表可得,d l=1.20,d u=1.41,由0.3653<1.20可知模型存在正自相关。
序列相关性的修正:
利用广义差分法,由于ρ=1−DW
2=1−0.3653
2
=0.8174,有估计结果如下:
在新序列估计结果下,d u=1.41<DW=1.577<4-d u=4−1.41=2.59,故不再存在序列相关性,自相关已经得到消除。
运用Cochrane-Orcutt迭代法进行自相关的修正:
根据结果可知,d u=1.41<DW=1.7687<4-d u=4−1.41=2.59,故不再存在自相关。