当前位置：文档之家› 多重共线性验证及修正

多重共线性验证及修正

论文选读：

中国货币需求的因素分析

钟瑜王桢黄琦珍

内容摘要：本文以宏观货币需求理论为基础,引入收入和利率两个解释变量,利用计量经济学的方法,分析货币需求与这两者的关系.从中国的实际情况出发,在利用年度数据分析的基础上,又引入九十年代中期到目前为止的季度数据着重分析利率对货币需求的影响,从而将经济理论和中国现实情况结合进行分析.

关键字：货币需求利率

一经济理论阐述

凯恩斯在传统的货币数量论和现金余额说的基础上，考虑了货币的交易职能和货币的价值贮藏职能，提出了自己的货币需求理论。他认为人们之所以持有货币是处于三个动机：交易动机，预防动机和投机动机，从而相应地形成了货币的交易需求，预防需求和投机需求。随着经济的发展，交易与收入和支出往往在时间上不一致，人们为了应付日常的购买而持有一定量的货币即构成了货币的交易需求。而人们为了应付一些意外开支而持有的货币即为货币的预防需求。这两种需求都来源于货币的交易媒介职能。在影响交易动机和预防动机的众多因素中，货币收入起着决定作用，并且收入与货币的交易需求和预防需求成正方向变化。而货币的投机需求则是为了应付有价证券市场上价格的变化，从而获利。这一货币需求来源于货币的价值贮藏职能。人们总是根据对利率变动的预期持有一定量的货币，以在有利时机购买债券进行投机获利，因而，货币的投机需求与利率成反方向变化。凯恩斯根据对人们持有货币的心理动机的分析，将货币需求分为两个部分：货币的交易需求和预防需求L1(Y)和货币的投机需求L2(r), 从而提出了他的货币需求函数：L=L1(Y)+L2(r),其中，L代表对货币的需求，Y代表收入，r代表利率.

在凯恩斯的货币需求理论的基础上，后凯恩斯主义对其进行了发展。美国经济学家汉森将商品市场和货币市场结合起来建立了IS-LM模型，认为货币的交易需求不仅受到收入的影响，而且受到利率的影响。这是由于利率的变化会影响投资，进而影响收入，最终影响对货币的交易需求。此外，鲍莫尔的“平方根定理”，认为持有货币存在一定的机会成本，利率越高，投机机会越多，人们便会尽量减少手中持有的货币量。这两种理论都说明了利率与货币交易需求的反向变化关系，从而发展了凯恩斯货币需求理论中的交易需求部分。对于货币的预防需求而言，惠伦提出了“立方根定律”，说明了人们对货币预防需求的多少，主要取决于收入和支出的状况及持有货币的成本。其中利率是一个重要因素。且利率与货币的预防需求成反方向变化。并且托宾的资产选择理论也对凯恩斯的货币投机需求进行了发展。

由以上的分析可看出，不管是传统的凯恩斯的货币需求理论，还是后凯恩斯主义对其进行的发展，其一致性在于，利率和收入都是影响货币需求的重要因素，其中，收入与货币需求成正方向变化，而利率与货币需求呈反方向变化。

二．理论模型的设定

根据以上的经济理论的分析，在设立模型时将收入和利率作为决定货币需求总量的解释变量.由于三个变量之间数量级存在差异,若直接回归会存在一些潜在问题,为了回避这一问题,本文在设定模型时采用了双对数模型,此外,双对数模型中,各解释变量的参数即为弹性,具

有良好的经济解释意义.

模型设定如下：

lnＭ=β0+β1lnＹ+β2lnＲ+u i，

Ｍ--货币需求总量

Ｙ--收入

Ｒ--利率（%）

ui--随机扰动项

β0、β1、β2 --参数

注: 利率采用百分比,一方面可以避免对数取负,另一方面,可以用数学推导证明这种代入并不影响参数的意义, β2仍然表示利率对货币需求的弹性.

三数据来源及搜集处理方法

1 货币需求量M数据的搜集：

M用广义货币供应量M2代替，因为货币的供给主要是由中央银行来进行，而货币的需求则取决于流动性偏好，尤其是投机动机。由于流动性偏好是一种心理活动，难以操纵和控制，货币需求也就难以预测和控制，需要变动的是货币供应量。这种替代具有一定的合理性.

M= M2= M1+M0.

M0=现金流通量，

M1= M0+银行活期存款，

M2= M1+储蓄存款+定期存款。

广义货币的供给量可以从《中国金融统计年鉴》中查得，但是由于统计项目的调整，只能直接得到广义货币供给量1986-2001年的数据。对于1981-1985年的广义货币供给量通过试算方法得到. 根据1986年的《中国金融统计年鉴》，用M2=各项存款总额-财政存款+现金流通量，试算出各年的的广义货币供给量，将此试算值与以后年度的《中国金融统计年鉴》给出的M2值进行核对，发现两者是一致的。因此，可将以前年度的广义货币的试算值应用到模型中，这样就得到了M2的全部数据。

2 收入数据的搜集

对于收入的数据，用各年的国内生产总值GDP表示，1981-2001年间的GDP数据可以从《中国统计年鉴》中直接得到.

3 利率数据的搜集

在目前中国的利率体系下存在这多种利率,按借贷主体可以分为:银行利率,非银行金融机构利率,有价证券的利率和市场利率.从数据的代表性和可获得性两方面考虑,选用了中央银行的一年期再贷款利率.

央行的再贷款利率是中国人民银行向金融机构进行信用放贷时所使用的利率.从1984年起,再贷款利率成为中国中央银行的基准利率之一,起着宏观调控的作用.有关资料表明，1984-1993年，中央银行基础货币投放主要渠道是再贷款，95％以上的基础货币是通过再贷款投放出去的。由于该时段较长，占样本长度的一半，因此，用再贷款利率数据是合理的，且考虑到数据的可获得性，于是统一使用再贷款利率数据。对于利率有变动的年度，按天数进行加权平均。

数据来源：《中国金融年鉴》、《中国统计年鉴》、《中国人民银行统计季报》

这样,模型所需变量的数据都搜集齐了.下面就利用Eviews进行模拟.

四参数估计.

原始数据:

M Y R P obs 2299.96 4862.4 0.036 1.024******* 1981 2676.94 5294.7 0.0366 1.0189701897 1982 3193.57 5934.5 0.0432 1.01507092199 1983 4442.88 7171.0 0.0432 1.027******** 1984

5198.9 8964.4 0.04351 1.0883******* 1985

6720.9 10202.2 0.0468 1.06010928962 1986

8330.9 11962.5 0.0518 1.07290132548 1987 10099.6 14928.3 0.0708 1.185******** 1988 11949.6 16909.2 0.1025 1.177******** 1989 15293.4 18547.9 0.0892 1.021******** 1990 19349.9 21617.8 0.0742 1.028******** 1991 25402.2 26638.1 0.072 1.0538137576 1992 34879.8 34634.4 0.0911 1.131******** 1993 46923.5 46759.4 0.1062 1.21694782268 1994 60750.5 58478.1 0.1103 1.14796905222 1995 76094.9 67884.6 0.1091 1.06093793878 1996 90995.3 74462.6 0.1038 1.00794070937 1997 104498.5 78345.2 0.0708 0.97400210084 1998 119897.9 82067.5 0.0437 0.970072795902 1999 134610.3 89442.2 0.0378 0.984991662034 2000 158301.9 95933.3 0.0378 0.992099322799 2001

进行最小二乘估计,便可得到以下显示的结果.

Dependent Variable: LOG(M)

Method: Least Squares

Date: 09/12/00 Time: 22:58

Sample: 1981 2001

Included observations: 21

Variable Coefficient Std. Error t-Statistic Prob.

C -3.737201 0.130841 -28.56292 0.0000

LOG(Y) 1.381318 0.014172 97.46559 0.0000 LOG(100*R) -0.136378 0.034789 -3.920107 0.0010 R-squared 0.998379 Mean dependent var 9.937016 Adjusted R-squared 0.998199 S.D. dependent var 1.399459 S.E. of regression 0.059384 Akaike info criterion -2.678033 Sum squared resid 0.063475 Schwarz criterion -2.528816 Log likelihood 31.11935 F-statistic 5544.759 Durbin-Watson stat 1.178723 Prob(F-statistic) 0.000000 1 经济学检验

从模拟的结果可以看出 lnY的系数为正,1.381318.而ln (100*r)的系数为负, -0.136378.这正好与经济理论当中,收入与货币需求成正方向变化,而利率与货币需求成反方向变化.由此可见,从经济意义的角度来看,模型是合理的。

2 统计检验(α=0.05)

从模拟的结果来看, logY的t值为97.46559, log(100*r)的t值为-3.920107,而t的临界值为2.080表明系数没有通过t检验, 因此,拒绝解释变量对应变量没有显著影响的原假设,而接受备择假设.说明收入和利率对货币需求有显著的影响作用。且F值为5544.759, 而F的临界值为3.55.表明拒绝原假设,接受备择假设,即表明回归方程显著.

以下进行计量经济学检验:

1 J-B 正态检验

从检验的结果看, probability值为0.563694,即拒绝原假设反错误的概率为56.3694%,因此,接受原假设,即残差服从正态分布.

2 多重共线性检验

Correlation Matrix

LOG(Y/P) LOG(R*100) LOG(Y/P) 1 0.372971025318

LOG(R*100) 0.372971025318 1

从以上结果可以看出,两者的相关系数较小,即不存在多重共线性.

2异方差检验:

由于只有21个样本,因此主要采取ARCH检验来检验异方差的存在与否.

ARCH Test:

F-statistic 0.890996 Probability 0.469922 Obs*R-squared 2.885732 Probability 0.409581 Test Equation:

Dependent Variable: RESID^2

Method: Least Squares

Date: 09/12/00 Time: 22:52

Sample(adjusted): 1984 2001

Included observations: 18 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob.

C 0.002490 0.001439 1.730717 0.1055

RESID^2(-1) 0.410769 0.264166 1.554965 0.1423 RESID^2(-2) -0.268047 0.273208 -0.981111 0.3432 RESID^2(-3) 0.069684 0.266371 0.261605 0.7974 R-squared 0.160318 Mean dependent var 0.003144 Adjusted R-squared -0.019613 S.D. dependent var 0.003114 S.E. of regression 0.003144 Akaike info criterion -8.493484 Sum squared resid 0.000138 Schwarz criterion -8.295623 Log likelihood 80.44135 F-statistic 0.890996 从以上结果看Probability的值,拒绝H0反错误概率较大,同时残差序列的系数的t值并不显著,应该接受残差序列系数为零的原假设，即为模型不存在异方差. 另一方面,从White检验看,也不存在异方差.

White Heteroskedasticity Test:

F-statistic 0.845106 Probability 0.516929 Obs*R-squared 3.662919 Probability 0.453542 Test Equation:

Dependent Variable: RESID^2

Method: Least Squares

Date: 09/12/00 Time: 22:54

Sample: 1981 2001

Included observations: 21

Variable Coefficient Std. Error t-Statistic Prob.

C -0.143065 0.152989 -0.935134 0.3636

LOG(Y) 0.033727 0.035255 0.956644 0.3530

(LOG(Y))^2 -0.001709 0.001740 -0.982254 0.3406 LOG(100*R) -0.021206 0.035407 -0.598914 0.5576 (LOG(100*R))^2 0.005768 0.009131 0.631705 0.5365 R-squared 0.174425 Mean dependent var 0.003023 Adjusted R-squared -0.031969 S.D. dependent var 0.003022 S.E. of regression 0.003070 Akaike info criterion -8.530027 3 自相关检验

模拟结果显示DW值为1.178723,而通过查表得到d L的值为1.125,d u的值为1.538.DW 的值正好落在无决定区域,因此需要对自相关进行修正.利用Cochrane-Orcutt 法对自相关性进行修正,得到以下结果.

Dependent Variable: LOG(M)

Method: Least Squares

Date: 09/12/00 Time: 22:56

Sample(adjusted): 1982 2001

Included observations: 20 after adjusting endpoints

Convergence achieved after 6 iterations

Variable Coefficient Std. Error t-Statistic Prob.

C -3.580921 0.234682 -15.25862 0.0000

LOG(Y) 1.371571 0.022439 61.12427 0.0000 LOG(100*R) -0.162553 0.046406 -3.502824 0.0029 AR(1) 0.399709 0.220168 1.815473 0.0882 R-squared 0.998604 Mean dependent var 10.04683 Adjusted R-squared 0.998342 S.D. dependent var 1.339765 S.E. of regression 0.054558 Akaike info criterion -2.802242 Sum squared resid 0.047625 Schwarz criterion -2.603096 Log likelihood 32.02242 F-statistic 3813.850 Durbin-Watson stat 1.964503 Prob(F-statistic) 0.000000 从以上的结果可以看出DW值为1.964503,已经落在了无自相关区域,表明通过修正的模型已经不存在自相关.

通过以上的回归及检验,就可得到以下回归方程:

lnＭ=-3.580921+1.371571 lnＹ-0.162553 ln(Ｒ*100)

(-15.25862)( 61.12427) (-3.502824)

R^2=0.998604 DW=1.96450

以上是基于没有考虑通货膨胀因素,而获得的名义数据的回归模型,以下将引入通货膨胀因素,进行第二次回归.

模型设定如下:

ln(Ｍ/P)=β0+β1ln(Ｙ/P)+β2lnＲ+u i，

P=为环比的商品零售物价指数.

此处的利率仍使用名义数据，因为实际利率=（1+名义利率）/（1+通货膨胀率）-1，在计算中实际利率出现了负值，无法进行对数运算，所以仍使用名义数据。

回归结果如下:

Dependent Variable: LOG(M/P)

Method: Least Squares

Date: 12/17/02 Time: 21:19

Sample: 1981 2001

Included observations: 21

Variable Coefficient Std. Error t-Statistic Prob.

C -3.694274 0.119475 -30.92086 0.0000

LOG(Y/P) 1.371305 0.012735 107.6816 0.0000 LOG(R*100) -0.093264 0.031571 -2.954130 0.0085 R-squared 0.998639 Mean dependent var 9.880855 Adjusted R-squared 0.998487 S.D. dependent var 1.411501 S.E. of regression 0.054898 Akaike info criterion -2.835116 Sum squared resid 0.054248 Schwarz criterion -2.685899 Log likelihood 32.76872 F-statistic 6601.731 1 J-B正态检验其中probability值为0.501181, 即拒绝原假设反错误的概率为50.1181%,因此,接受原假设,即残差服从正态分布.

2 多重共线性检验

Correlation Matrix

LOG(Y/P) LOG(R*100)

LOG(Y/P) 1 0.372971025318

LOG(R*100) 0.372971025318 1

由于相关系数较小,因此不存在多重共线性.

3 异方差检验

ARCH Test:

F-statistic 0.752158 Probability 0.539130 Obs*R-squared 2.498485 Probability 0.475565 Test Equation:

Dependent Variable: RESID^2

Method: Least Squares

Date: 09/12/00 Time: 23:32

Sample(adjusted): 1984 2001

Included observations: 18 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob.

C 0.002204 0.001156 1.905598 0.0774

RESID^2(-1) 0.364751 0.265320 1.374757 0.1908 RESID^2(-2) -0.273532 0.273948 -0.998481 0.3350 RESID^2(-3) 0.059676 0.258584 0.230780 0.8208 R-squared 0.138805 Mean dependent var 0.002564 Adjusted R-squared -0.045737 S.D. dependent var 0.002241 S.E. of regression 0.002292 Akaike info criterion -9.125715 Sum squared resid 7.35E-05 Schwarz criterion -8.927854 Log likelihood 86.13143 F-statistic 0.752158 Durbin-Watson stat 1.803858 Prob(F-statistic) 0.539130 从probability值和t值可以判断不存在异方差.

同时从White检验也可以判定不存在异方差.

White Heteroskedasticity Test:

F-statistic 0.361176 Probability 0.832569 Obs*R-squared 1.739139 Probability 0.783596

Test Equation:

Dependent Variable: RESID^2

Method: Least Squares

Date: 09/12/00 Time: 23:34

Sample: 1981 2001

Included observations: 21

Variable Coefficient Std. Error t-Statistic Prob.

C -0.010154 0.122323 -0.083012 0.9349

LOG(Y/P) 0.005733 0.027864 0.205737 0.8396 (LOG(Y/P))^2 -0.000301 0.001376 -0.218873 0.8295 LOG(100*R) -0.017065 0.026660 -0.640111 0.5312 (LOG(100*R))^2 0.004856 0.006844 0.709556 0.4882 Adjusted R-squared -0.146480 S.D. dependent var 0.002287 S.E. of regression 0.002448 Akaike info criterion -8.982578 Sum squared resid 9.59E-05 Schwarz criterion -8.733882 Log likelihood 99.31707 F-statistic 0.361176

4 自相关检验

由于回归结果的DW值为0.975357,存在正相关,因此,进行修正,结果如下:

Dependent Variable: LOG(M/P)

Method: Least Squares

Date: 09/12/00 Time: 23:36

Sample(adjusted): 1982 2001

Included observations: 20 after adjusting endpoints

Variable Coefficient Std. Error t-Statistic Prob.

C -3.515829 0.249066 -14.11604 0.0000

LOG(Y/P) 1.361728 0.022328 60.98758 0.0000 LOG(100*R) -0.130750 0.045877 -2.849986 0.0116 AR(1) 0.497575 0.211904 2.348118 0.0321 R-squared 0.999001 Mean dependent var 9.989051 Adjusted R-squared 0.998813 S.D. dependent var 1.355884 S.E. of regression 0.046711 Akaike info criterion -3.112821 Sum squared resid 0.034911 Schwarz criterion -2.913674 Log likelihood 35.12821 F-statistic 5330.969 Durbin-Watson stat 2.084557 Prob(F-statistic) 0.000000 ln(Ｍ/P)=-3.515829+1.361728 ln(Y/P)-0.130750ln(Ｒ*100)

(-14.11604) ( 60.98758) (-2.849986)

R^2= 0.999001 DW=2.084557

以上的两次回归结果,从计量经济学角度来看,由于t值较大,可能会存在伪回归.因此为了进一步分析,下面利用图形考察,货币需求与收入和利率的关系.

1981-2001年利率的时间序列图

0.12

0.10

0.08

0.06

0.04

0.02

82848688909294969800

可以看出在此段时期内,利率波动较大.由于利率数据的不平稳,因而可能存在伪回归.

从上图可以看出,利率和货币需求的关系不总是与经济理论相符.在多数年份中,随着利

率的上升,货币需求仍在增加. 但从收入和货币需求的关系图中可以看出，两者关系近乎成一条直线.

从货币需求、收入和利率三者时间序列图可以看出，九十年代中期以前，利率呈现无规律的波动，而此时的货币需求一直在增加，这主要是由收入增加所引起。即：九十年代中期

789101112131.0

1.5

2.0 2.5

LOG(100*R)L O G (M /P )

789101112138

101112

LOG(Y/P)

L O G (M /P )

2468101214

以前，利率对货币需求几乎无解释作用，货币需求主要由收入决定。而在九十年代中期以后，利率呈下降趋势，此时的货币需求仍不断增加，但增幅大于收入的增幅，因此可以认为九十年代中期以后，利率对货币需求的作用逐渐显现出来。为了进一步探究两者之间的关系。我们引入了１９９５年第一季度到２００２年第三季度的货币需求和利率的数据，并将两者的有关图形显示如下：

从上图并结合年度数据中利率与货币需求的关系图中可以看出，从九十年代中期以后，利率与货币需求的关系已经符合经济理论。

从利率与货币需求的散点图可以看出，利率和货币需求明显成反方向变动关系。

五、经济现象浅析

从以上对年度数据和季度数据的分析。我们认为，虽然再贷款利率是央行根据货币市场需求进行调整的，但是由于中国货币市场的市场化程度较低，其代表性仍然很低。随着，金融体制的改革，再贷款利率的市场代表性提高。注：由于金融理论知识的欠缺，因此不能作出很好的经济解释。本论文的着重点并非在结论，而在于利用计量经济学这种定量的分析方法，解决现实中的问题。

论文评论：该片论文的最大优点是在模型的建立过程中比较完整地进行了J-B 正态检验、多重共显性检验、异方差性检验、自相关性检验、图形观察等一系列检验方法。一般来说，对于模型进行这几种常规检验基本可以确定模型的可用性和模型的意义。但不足之处是该论文虽然在两个模型中都检验出可以通过增加AR （1）来消除序列自相关性，但在修整模型中，作者并没有将AR （1）加入到模型方程中去。

9899

5.5

6.0

6.5

7.0

7.5

10.5

11.011.512.012.5

LOG(M)

L O G (100*R )

多重共线性的解决之法

第七章多重共线性教学目的及要求： 1、重点理解多重共线性在经济现象中的表现及产生的原因和后果 2、掌握检验和处理多重共线性问题的方法 3、学会灵活运用Eviews 软件解决多重共线性的实际问题。第一节多重共线性的产生及后果一、多重共线性的含义 1、含义在多元线性回归模型经典假设中，其重要假定之一是回归模型的解释变量之间不存在线性关系，也就是说，解释变量X 1，X 2，……，X k 中的任何一个都不能是其他解释变量的线性组合。如果违背这一假定，即线性回归模型中某一个解释变量与其他解释变量间存在线性关系，就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设，将给普通最小二乘法带来严重后果。 2、类型多重共线性包含完全多重共线性和不完全多重共线性两种类型。（1）完全多重共线性完全多重共线性是指线性回归模型中至少有一个解释变量可以被其他解释变量线性表示，存在严格的线性关系。如对于多元线性回归模型 i ki k i i i X X X Y μββββ+++++= 22110 （7-1）存在不全为零的数k λλλ,,,21 ，使得下式成立： X X X 2211=+++ki k i i λλλ （7-2）则可以说解释变量k X ,,X ,X 21 之间存在完全的线性相关关系，即存在完全多重共线性。从矩阵形式来看，就是0' =X X ，即1)(-

（2）不完全多重共线性不完全多重共线性是指线性回归模型中解释变量间存在不严格的线性关系，即近似线性关系。如对于多元线性回归模型（7-1）存在不全为零的数k λλλ,,,21 ，使得下式成立： X X X 2211=++++i ki k i i u λλλ （7-3）其中i u 为随机误差项，则可以说解释变量k X ,,X ,X 21 之间存在不完全多重共线性。随机误差项表明上述线性关系是一种近似的关系式，大体上反映了解释变量间的相关程度。完全多重共线性与完全非线性都是极端情况，一般说来，统计数据中多个解释变量之间多少都存在一定程度的相关性，对多重共线性程度强弱的判断和解决方法是本章讨论的重点。二、多重共线性产生的原因多重共线性在经济现象中具有普遍性，其产生的原因很多，一般较常见的有以下几种情况。（一）经济变量间具有相同方向的变化趋势在同一经济发展阶段，一些因素的变化往往同时影响若干经济变量向相同方向变化，从而引起多重共线性。如在经济上升时期，投资、收入、消费、储蓄等经济指标都趋向增长，这些经济变量在引入同一线性回归模型并作为解释变量时，往往存在较严重的多重共线性。（二）经济变量间存在较密切关系由于组成经济系统的各要素之间是相互影响相互制约的，因而在数量关系上也会存在一定联系。如耕地面积与施肥量都会对粮食总产量有一定影响，同时，二者本身存在密切关系。（三）采用滞后变量作为解释变量较易产生多重共线性一般滞后变量与当期变量在经济意义上关联度比较密切，往往会产生多重共线性。如在研究消费规律时，解释变量因素不但要考虑当期收入，还要考虑以往各期收入，而当期收入与滞后收入间存在多重共线性的可能很大。（四）数据收集范围过窄，有时会造成变量间存在多重共线性问题。三、多重共线性产生的后果由前述可知，多重共线性分完全多重共线性和不完全多重共线性两种情况，两种情况都会对模

(完整版)多重共线性检验与修正.doc

问题：选取粮食生产为例，由经济学理论和实际可以知道，影响粮食生产y 的因素有：农业化肥施用量x1，粮食播种面积x2，成灾面积x3，农业机械总动力x4，农业劳动力x5，由此建立以下方程： y=β0+β1x1+β2x2+β3x3+β4x4+β5x5，相关数据如下：解： 1、检验多重共线性（1）在命令栏中输入： ls y c x1 x2 x3 x4 x5，则有；可以看到，可决系数R2 和 F 值都很高，二自变量x1 到 x5 的 t 值均较小，并且x4 和 x5 的 t 检验不显著，说明方程很可能存在多重共线性。（2）对自变量做相关性分析：将x1—— x5 作为组打开， view —— covariance analysis—— correlation ，结果如下：可以看到x1 和 x4 的相关系数为 0.96，非常高，说明原模型存在多重共线性

2、多重共线性的修正（1）逐步回归法第一步：首先确定一个基准的解释变量，即从 x1， x2， x3， x4， x5 中选择解释 y 的最好的一个建立基准模型。分别用 x1， x2， x3， x4， x5 对 y 求回归，结果如下：从上面 5 个输出结果可以知道，y 对 x1 的可决系数R2=0.89（最高），因此选择第一个方程作为基准回归模型。即： Y = 30867.31062 + 4.576114592* x1 在基准模型的基础上，逐步将x2， x3 等加入到模型中，加入 x2，结果：

拟合优度R2=0.961395 ，显著提高；并且参数符号符合经济常识，且均显著。所以将模型修改为： Y= -44174.52+ 4.576460*x1+ 0.672680*x2 再加入 x3，结果：拟合优度R2=0.984174 ，显著提高；并且参数符号符合经济常识（成灾面积越大，粮食产量越低），且均显著。所以将模型修改为： Y=-12559.35+5.271306*x1+0.417257*x2-0.212103*x3 再加入 x4，结果：拟合优度R2=0.987158 ，虽然比上一次拟合提高了；但是变量x4 的系数为 -0.091271 ，符号不符合经济常识（农业机械总动力越高，粮食产量越高），并且 x4 的 t 检验不显著。因此应该从模型中剔除x4。

EVIEWS案例：(消除多重共线性)影响国内旅游市场收入的主要因素分析

第四章案例分析一、研究的目的要求近年来，中国旅游业一直保持高速发展，旅游业作为国民经济新的增长点，在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场，入境旅游外汇收入年均增长 22.6%，与此同时国内旅游也迅速增长。改革开放20多年来，特别是进入90年代后，中国的国内旅游收入年均增长14.4%，远高于同期GDP 9.76%的增长率。为了规划中国未来旅游产业的发展，需要定量地分析影响中国旅游市场发展的主要因素。二、模型设定及其估计经分析，影响国内旅游市场收入的主要因素，除了国内旅游人数和旅游支出以外，还可能与相关基础设施有关。为此，考虑的影响因素主要有国内旅游人数2X ，城镇居民人均旅游支出3X ，农村居民人均旅游支出4X ，并以公路里程5X 和铁路里程6X 作为相关基础设施的代表。为此设定了如下对数形式的计量经济模型： 23456123456t t t t t t t Y X X X X X u ββββββ=++++++ 其中：t Y ——第t 年全国旅游收入 2X ——国内旅游人数（万人） 3X ——城镇居民人均旅游支出（元） 4X ——农村居民人均旅游支出（元） 5X ——公路里程（万公里） 6X ——铁路里程（万公里）为估计模型参数，收集旅游事业发展最快的 1994—2003年的统计数据，如表4.2所示：表4.2 1994年—2003年中国旅游收入及相关数据

数据来源:《中国统计年鉴2004》利用Eviews 软件，输入Y 、X2、X3、X4、X5、X6等数据，采用这些数据对模型进行OLS 回归，结果如表4.3：表4.3 由此可见，该模型9954.02=R ，9897.02 =R 可决系数很高，F 检验值173.3525,明显显著。但是当05.0=α时776 .2)610()(025.02=-=-t k n t α,不仅2X 、6X 系数的t 检验不显著，而且6X 系数的符号与预期的相反，这表明很可能存在严重的多重共线性。计算各解释变量的相关系数，选择X2、X3、X4、X5、X6数据， Views/Open Selected/One Windows/Open Group 点”view/correlations ”得相关系数矩阵（如表4.4）：表4.4 由相关系数矩阵可以看出：各解释变量相互之间的相关系数较高，证实确实存在严重多重共线性。

多重共线性的检验与修正

计量经济学实验报告成绩课程名称计量经济学指导教师苏卫东实验日期 2014-6-24 院（系）财政与金融学院专业班级金融二专实验地点实验楼八机房学生姓名单一芳学号 201212041018 同组人无实验项目名称多重共线性的检验与修正一、实验目的和要求 1、理解多重共线性的含义与后果 2、掌握Eviews软件的操作和多重共线性的检验与修正二、实验原理 Eviews软件的操作和多重共线性的检验修正方法三、主要仪器设备、试剂或材料 Eviews软件，计算机四、实验方法与步骤 1、准备工作：建立工作文件，并输入数据 CREATE A 1974 1981; DATA Y X1 X2 X3 X4 X5 2、OLS估计： LS Y C X1 X2 X3 X4 X5; 3、计算简单相关系数 COR X1 X2 X3 X4 X5 4、多重共线性的解决 LS Y C X1; LS Y C X2; LS Y C X3; LS Y C X4; LS Y C X5;

LS Y C X1 X3; LS Y C X1 X3 X2; LS Y C X1 X3 X4; LS Y C X1 X3 X5 五、实验数据记录、处理及结果分析 1、建立工作组，输入以下数据： obs Y X1 X2 X3 X4 X5 1974 98.45 560.2 153.2 6.53 1.23 1.89 1975 100.7 603.11 190 9.12 1.3 2.03 1976 102.8 668.05 240.3 8.1 1.8 2.71 1977 133.95 715.47 301.12 10.1 2.09 3 1978 140.13 724.27 361 10.93 2.39 3.29 1979 143.11 736.13 420 11.85 3.9 5.24 1980 146.15 748.91 497.16 12.28 5.13 6.83 1981 144.6 760.32 501 13.5 5.47 8.36 1982 148.94 774.92 529.2 15.29 6.09 10.07 1983 158.55 785.3 552.72 18.1 7.97 12.57 1984 169.68 795.5 771.16 19.61 10.18 15.12 1985 162.14 804.8 811.8 17.22 11.79 18.25 1986 170.09 814.94 988.43 18.6 11.54 20.59 1987 178.69 828.73 1094.65 23.53 11.68 23.37 2、OLS估计 LS Y C X1 X2 X3 X4 X5 Dependent Variable: Y Method: Least Squares Date: 06/24/14 Time: 18:45 Sample: 1974 1987 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C -3.650950 30.00144 -0.121692 0.9061 X1 0.125752 0.059087 2.128275 0.0660 X2 0.072656 0.037445 1.940317 0.0883 X3 2.681426 1.258639 2.130418 0.0658 X4 3.405866 2.444896 1.393052 0.2011 X5 -4.430561 2.194164 -2.019248 0.0781 R-squared 0.970397 Mean dependent var 142.7129

多重共线性多重共线性实验案例与独立实验问题

实验五多重共线性模型的检验与处理（1）一、研究的目的要求近年来，中国旅游业一直保持高速发展，旅游业作为国民经济新的增长点，在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场，入境旅游外汇收入年均增长22.6%，与此同时国内旅游也迅速增长。改革开放20多年来，特别是进入90年代后，中国的国内旅游收入年均增长14.4%，远高于同期GDP 9.76%的增长率。为了规划中国未来旅游产业的发展，需要定量地分析影响中国旅游市场发展的主要因素。二、模型设定及其估计经分析，影响国内旅游市场收入的主要因素，除了国内旅游人数和旅游支出以外，还可能与相关基础设施有关。为此，考虑的影响因素主要有国内旅游人数2X ，城镇居民人均旅游支出3X ，农村居民人均旅游支出4X ，并以公路里程5X 和铁路里程6X 作为相关基础设施的代表。为此设定了如下对数形式的计量经济模型： 23456123456t t t t t t t Y X X X X X u ββββββ=++++++ 其中：t Y ——第t 年全国旅游收入 2X ——国内旅游人数（万人） 3X ——城镇居民人均旅游支出（元） 4X ——农村居民人均旅游支出（元） 5X ——公路里程（万公里） 6X ——铁路里程（万公里）为估计模型参数，收集旅游事业发展最快的1994—2003年的统计数据，如表4.2所示：利用Eviews 软件，输入Y 、X2、X3、X4、X5、X6等数据，采用这些数据对模型进行OLS 回归，结果如表4.3：表4.3

由此可见，该模型9954.02=R ，9897.02 =R 可决系数很高，F 检验值173.3525,明显显著。但是当05.0=α时776 .2)610()(025.02=-=-t k n t α,不仅2X 、6X 系数的t 检验不显著，而且6X 系数的符号与预期的相反，这表明很可能存在严重的多重共线性。计算各解释变量的相关系数，选择X2、X3、X4、X5、X6数据，点”view/correlations ”得相关系数矩阵（如表4.4）：表4.4 由相关系数矩阵可以看出：各解释变量相互之间的相关系数较高，证实确实存在严重多重共线性。三、消除多重共线性采用逐步回归的办法，去检验和解决多重共线性问题。分别作Y 对X2、X3、X4、X5、X6的一元回归，结果如表4.5所示：表4.5

(整理)多重共线性的检验与修正

附件二：实验报告格式（首页）山东轻工业学院实验报告成绩课程名称计量经济学指导教师实验日期 2013-5-25 院（系）商学院专业班级实验地点二机房学生姓名学号同组人无实验项目名称多重共线性的检验与修正一、实验目的和要求掌握Eviews软件的操作和多重共线性的检验与修正二、实验原理 Eviews软件的操作和多重共线性的检验修正方法三、主要仪器设备、试剂或材料 Eviews软件，计算机四、实验方法与步骤（1）准备工作：建立工作文件，并输入数据： CREATE EX-7-1 A 1974 1981; TATA Y X1 X2 X3 X4 X5 ; (2)OLS估计： LS Y C X1 X2 X3 X4 X5; (3)计算简单相关系数 COR X1 X2 X3 X4 X5 ; (4)多重共线性的解决 LS Y C X1; LS Y C X2; LS Y C X3; LS Y C X4; LS Y C X5; LS Y C X1 X3; LS Y C X1 X3 X2; LS Y C X1 X3 X4; LS Y C X1 X3 X5; 五、实验数据记录、处理及结果分析（1）建立工作组，输入以下数据： 98.45 560.20 153.20 6.53 1.23 1.89 100.70 603.11 190.00 9.12 1.30 2.03 102.80 668.05 240.30 8.10 1.80 2.71 133.95 715.47 301.12 10.10 2.09 3.00 140.13 724.27 361.00 10.93 2.39 3.29

第七章多共线性及其处理

第七章多重共线性及其处理第一部分学习辅导一、本章学习目的与要求 1．理解多重共线性的概念； 2．掌握多重共线性存在的主要原因； 3．理解多重共线性可能造成的后果； 4．掌握多重共线性的检验与修正的方法。二、本章内容提要本章主要介绍计量经济模型的计量经济检验。即多重共线性问题。多重共线性是多元回归模型可能存在的一类现象，分为完全共线与近似共线两类。模型的多个解释变量间出现完全共线性时，模型的参数无法估计。更多的情况则是近似共线性，这时，由于并不违背所有的基本假定，模型参数的估计仍是无偏、一致且有效的，但估计的参数的标准差往往较大，从而使得t 统计值减小，参数的显著性下降，导致某些本应存在于模型中的变量被排除，甚至出现参数正负号方面的一些混乱。显然，近似多重共线性使得模型偏回归系数的特征不再明显，从而很难对单个系数的经济含义进行解释。多重共线性的检验包括检验多重共线性是否存在以及估计多重共线性的范围两层递进的检验。而解决多重共线性的办法通常有逐步回归法、差分法以及使用额外信息、增大样本容量等方法。（一）多重共线性及其产生的原因当我们利用统计数据进行分析时，解释变量之间经常会出现高度多重共线性的情况。 1．多重共线性的基本概念多重共线性(Multicollinearity )一词由弗里希（Frish ）于1934年在其撰写的《借助于完全回归系统的统计合流分析》中首次提出。它的原义是指一个回归模型中的一些或全部解释变量之间存在有一种“完全”或准确的线性关系。如果在经典回归模型Y X βε=+中，经典假定（5）遭到破坏，则有()1R X k <+，此时称解释变量k X X X ,,,21ΛΛ间存在完全多重共线性。解释变量的完全多重共线性，也就是解释变量之间存在严格的线性关系，即数据矩阵X 的列向量线性相关。因此，必有一个列向量可由其余列向量线性表示。同时还有另外一种情况，即解释变量之间虽然不存在严格的线性关系，但是却有近似的线性关系，即解释变量之间高度相关。 2．多重共线性产生的原因多元线性回归模型产生多重共线性的原因很多，主要有：（1）经济变量的内在联系这是产生多重共线性的根本原因。（2）解释变量中含有滞后变量（3）经济变量变化趋势的“共向性” 必须指出，多重共线性基本上是一种样本现象。因为人们在设定模型时，总是尽量避免将理论上具有严格线性关系的变量作为解释变量收集在一起，因此，实际问题中的多重共线性并不是解释变量之间存在理论上或实际上的线性关系造成的，而是由所收集的数据(解释变量观察值)之间存在近似的线性关系所致。（二）多重共线性的影响多重共线性会产生以下问题：（1）增大了OLS 估计量的方差（2）难以区分每个解释变量的单独影响（3）回归模型缺乏稳定性（4）t 检验的可靠性降低（三）多重共线性的判别在应用多元回归模型中，人们总结了许多检验多重共线性的方法。 1．系数判定法

计量经济学多重共线性

2014-8-8 商学院王中昭教学内容一、多重共线性二、实际经济问题中的多重共线性三、多重共线性的后果四、多重共线性的检验五、克服多重共线性的办法和实例 §4.3 多重共线性

2014-8-8商学院王中昭对于模型Y i =β0+ β1x 1i + β2x 2i +…… βk x ki +μi 如果某两个或多个解释变量之间出现相关性，即：C 1x 1i +C 2X 2i +……C k X ki =0 其中C i 不全为0，即某一个解释变量是其他解释变量的线性组合，则称为完全多重共线性。完全多重共线性的情况并不多见，一般是出现不同程度的多重共线性。注意多重共线性不是指因变量与解释一、多重共线性概念

2014-8-8商学院王中昭 Y=Xβ+μ完全共线性:∣X′X ∣=0，(X′X)-1不存在，使B ^=(X′X)-1X′Y 无法求解。例如：, 0)(0020 1631084104213211 x x x 3213322113 21≠'=+-=++??????? ??=X X x x x X i i i i i i x c x c x c 这里，完全多重共线性

2014-8-8商学院王中昭完全多重共线性的情况不多，一般出现不同程度的多重共线性。多重共线性:∣X′X∣≈0,(X′X)-1存在，但 (X′X)-1主对角线上的元素很大。 ????? ?='≈'?≈+??????? ??=400300000300000100040030000030000010002100010004X)X ( ,0)( 0,0x x - x 199 .2993001001.4004001099.1992001101.1001001 x x x 1 -3i 2i 1i 3 21｜｜这里，X X X 近似多重共线性

多重共线性

城乡居民消费水平研究 —解决多重共线性一、文献综述长期以来，我国处于商品短缺的困扰之中，不得不采用配给制的办法限制居民的消费选择自由；随着供求关系的变化，人们的消费取向正在发生根本改变。因此,了解目前城乡居民的消费水平以及其影响因素对于把握国内不同群体消费需求的变化,指导生产、引导消费、开拓市场、发展循环经济、建立和谐社会具有重要意义。影响消费的因素很多，如价格水平、利率水平、收入水平、消费偏好、家庭财产、风俗习惯、制度模式等。其中，收入是影响消费的最重要因素。改革开放以来,我国居民的收入水平在不断提高,居民消费情况也有明显变化。在居民总体收入逐渐增加的同时,居民的收入差距也有所扩大,形成了高、中、低不同阶层的收入与消费群体。根据国家统计局的调查资料显示,不同消费群体之间的消费与投资倾向已有很大差异,受此影响,社会消费结构也已发生了较大变化。如今生活宽裕的高收入居民,十分关注生活质量的提高,消费倾向也出现明显变化,投资意识日益高涨。调查显示,越来越多的高收入居民,在消费时追求精神消费和服务消费,教育、文化、通信、保健、住宅等成为消费热点,追求时尚化与个性化日趋明显。高收入家庭的投资是社会民间投资中极为重要的部分,在国民经济运行中的作用不可低估. 中等收入群体占到城镇家庭总数的60%以上,收入占到居民收入总数的50%多,是我国消费的主体部分,他们的消费行为对我国整体消费状况的影响是最大的,对这一层次居民消费的启动将直接关系到我国经济启动的成败。这一消费群体的消费特征表现为对未来收入与支出不良预期的影响.所以基于这个问题的重要性，决定研究城乡居民的消费水平及其影响因素。二、数据资料初步分析数据的收集来源于2009年中华人民共和国国家统计局公布的年度数据，并选取城乡居民消费水平、城乡居民家庭人均可支配收入、职工平均工资、人均国内生产总值、城乡居民消费价格指数、城乡新建住房面积来研究其对城镇居民消费水平的影响。通过初步的线性回归发行这些数据都能较好的解释城镇居民消费水平。由于财富数据较难取得，所以用城乡新建住房面积来表示这一指标，并且取得较好的效果。所以将以上6个指标定位解释变量。其中城乡居民家庭人收入为城镇居民家庭人均可支配收入与农村居民家庭人均纯收入之和。

多重共线性案例分析实验报告

《多重共线性案例分析》实验报告

表2 由此可见，该模型，可决系数很高，F 检验值 173.3525,明显显著。但是当时,不仅、系数的t 检验不显著，而且系数的符号与预期的相反，这表明很可能存在严重的多重共线性。 9954.02=R 9897.02 =R 05.0=α776 .2)610()(025.02=-=-t k n t α2X 6X 6X

②.计算各解释变量的相关系数，选择X2、X3、X4、X5、X6数据，点”view/correlations ”得相关系数矩阵表3 由关系数矩阵可以看出：各解释变量相互之间的相关系数较高，证实确实存在严重多重共线性相。 4.消除多重共线性 ①采用逐步回归的办法，去检验和解决多重共线性问题。分别作Y 对X2、X3、X4、X5、X6的一元回归如下图所示变量 X2 X3 X4 X5 X6 参数估计值 0.0842 9.0523 11.6673 34.3324 2014.146 t 统计量 8.6659 13.1598 5.1967 6.4675 8.7487 0.9037 0.9558 0.7715 0.8394 0.9054 表4 按的大小排序为：X3、X6、X2、X5、X4。以X3为基础，顺次加入其他变量逐步回归。首先加入X6回归结果为： t=(2.9086) (0.46214) 2R 2 R 6 31784.285850632.7639.4109?X X Y t ++-=957152.02 =R

1995 1375.7 62900 464.0 61.5 115.70 5.97 1996 1638.4 63900 534.1 70.5 118.58 6.49 1997 2112.7 64400 599.8 145.7 122.64 6.60 1998 2391.2 69450 607.0 197.0 127.85 6.64 1999 2831.9 71900 614.8 249.5 135.17 6.74 2000 3175.5 74400 678.6 226.6 140.27 6.87 2001 3522.4 78400 708.3 212.7 169.80 7.01 2002 3878.4 87800 739.7 209.1 176.52 7.19 2003 3442.3 87000 684.9 200.0 180.98 7.30 表1：1994年—2003年中国游旅收入及相关数据

检验多重共线性

实验目的：在回归模型牵涉到多个自变量的时候，自变量之间可能会相互关联，即他们之间存在有多重共线性，本节实验的实验目的是如何用Eviews检测各个自变量之间是否存在的多重共线问题以及如何对多重共线性进行修正。我们实验的原始数据如图所示，判断钢产量y与生铁产量X1，发电量X2，固定资产投资X3，国内生产总值X4,铁路运输量X5之间的关系。实验步骤： 1：打开Eviews7.0. →File→Workfile，选择年度数据，在初始日期和结束日期分别输入“1978”和结束年份“1997”。点击“OK”确定。 2：在新建工作表中，点击Proc→Import→Read，选定需要导入的Excel工作表，在“Upper-left data cell”中输入数据在Excel中的初始位置“B2”，在“Excel 5+….”中输入“sheet1”，在“Name for serises、”中输入“y x1 x2 x3 x4 x5”点击“OK”即可。 3：在Eviews空白处输入：“ls y c x1 x2 x3 x4 x5”，回车即可，结果如下。

Dependent Variable: Y Method: Least Squares Date: 04/19/13 Time: 11:24 Sample: 1978 1997 Included observations: 20 Variable Coefficient Std. Error t-Statistic Prob. C 354.5884 435.6968 0.813842 0.4294 X1 0.026041 0.120064 0.216892 0.8314 X2 0.994536 0.136474 7.287380 0.0000 X3 0.392676 0.086468 4.541271 0.0005 X4 -0.085436 0.016472 -5.186649 0.0001 X5 -0.005998 0.006034 -0.994019 0.3371 R-squared 0.999098 Mean dependent var 5153.450 Adjusted R-squared 0.998776 S.D. dependent var 2512.131 S.E. of regression 87.87969 Akaike info criterion 12.03314 Sum squared resid 108119.8 Schwarz criterion 12.33186 Log likelihood -114.3314 Hannan-Quinn criter. 12.09145 F-statistic 3102.411 Durbin-Watson stat 1.919746 Prob(F-statistic) 0.000000 经查表可知，t（17）=1.345，结合上表可知，x1和x5没有通过t检验，而且F\检验较大，估计解释变量之间可能存在着多重共线性。相关性如下图所示：可知X1 X2 X3 X4 X5,之间存在着较强的多重共线

EViews计量经济学实验报告-多重共线性的诊断与修正

时间地点实验题目多重共线性的诊断与修正一、实验目的与要求：要求目的：1、对多元线性回归模型的多重共线性的诊断； 2、对多元线性回归模型的多重共线性的修正。二、实验内容根据书上第四章引子“农业的发展反而会减少财政收入”，1978－2007年的财政收入，农业增加值，工业增加值，建筑业增加值等数据，运用EV 软件，做回归分析，判断是否存在多重共线性，以及修正。三、实验过程：（实践过程、实践所有参数与指标、理论依据说明等）（一）模型设定及其估计经分析，影响财政收入的主要因素，除了农业增加值，工业增加值，建筑业增加值以外，还可能与总人口等因素有关。研究“农业的发展反而会减少财政收入”这个问题。设定如下形式的计量经济模型：i Y =1β+2β2X +3β3X +4β4X +5β5X +6β6X +7β7X +i μ 其中，i Y 为财政收入CS/亿元；2X 为农业增加值NZ/亿元；3X 为工业增加值GZ/亿元；4X 为建筑业增加值JZZ/亿元；5X 为总人口TPOP/万人；6X 为最终消费CUM/亿元；7X 为受灾面积SZM/千公顷。图1： 1978～2007年财政收入及其影响因素数据年份财政收入CS/亿元农业增加值NZ/亿元工业增加值GZ/亿元建筑业增加值 JZZ/亿元总人口 TPOP/万人最终消费 CUM/亿元受灾面积SZM/ 千公顷 1978 1132.3 1027.5 1607 138.2 96259 2239.1 50790 1979 1146.4 1270.2 1769.7 143.8 97542 2633.7 39370 1980 1159.9 1371.6 1996.5 195.5 98705 3007.9 44526 1981 1175.8 1559.5 2048.4 207.1 100072 3361.5 39790 1982 1212.3 1777.4 2162.3 220.7 101654 3714.8 33130 1983 1367 1978.4 2375.6 270.6 103008 4126.4 34710 1984 1642.9 2316.1 2789 316.7 104357 4846.3 31890 1985 2004.8 2564.4 3448.7 417.9 105851 5986.3 44365 1986 2122 2788.7 3967 525.7 107507 6821.8 47140 1987 2199.4 3233 4585.8 665.8 109300 7804.6 42090 1988 2357.2 3865.4 5777.2 810 111026 9839.5 50870 1989 2664.9 4265.9 6484 794 112704 11164.2 46991 1990 2937.1 5062 6858 859.4 114333 12090.5 38474 1991 3149.48 5342.2 8087.1 1015.1 115823 14091.9 55472 1992 3483.37 5866.6 10284.5 1415 117171 17203.3 51333 1993 4348.95 6963.8 14188 2266.5 118517 21899.9 48829 1994 5218.1 9572.7 19480.7 2964.7 119850 29242.2 55043

多重共线性题目的检验和处理

山西大学实验报告实验报告题目：多重共线性问题的检验和处理学院：专业：课程名称：计量经济学学号：学生姓名：教师名称：崔海燕上课时间：题电源备，检查料试卷资料试

一、实验目的：熟悉和掌握Eviews在多重共线性模型中的应用，掌握多重共线性问题的检验和处理。二、实验原理：1、综合统计检验法； 2、相关系数矩阵判断； 3、逐步回归法；三、实验步骤：（一）新建工作文件并保存打开Eviews软件，在主菜单栏点击File\new\workfile，输入start date 1978和end date 2006并点击确认，点击save键，输入文件名进行保存。（二）输入并编辑数据在主菜单栏点击Quick键，选择empty\group新建空数据栏，根据理论和经验分析，影响粮食生产（Y）的主要因素有农业化肥施用量（X1）、粮食播种面积（X2）、成灾面积（X3）、农业机械总动力（X4）和农业劳动力（X5），其中成灾面积的符号为负，其余均应为正。下表给出了1983——2000中国粮食生产的相关数据。点击name键进行命名，选择默认名称Group01,保存文件。 Y X1X2X3X4X5 1983387281660114047162091802231151 1984407311740112884152641949730868 1985379111776108845227052091331130 1986391511931110933236562295031254 1987402081999111268203932483631663 1988394082142110123239452657532249 1989407552357112205244492806733225 1990446242590113466178192870838914 1991435292806112314278142938939098 1992442642930110560258953030838669 1993456493152110509231333181737680 1994445103318109544313833380236628 1995466623594110060222673611835530 1996504543828112548212333854734820 1997494173981112912303094201634840 1998512304084113787251814520835177 1999508394124113161267314899635768 2000462184146108463343745257436043 2001452644254106080317935517236513 2002457064339103891273195793036870 200343070441299410325166038736546

计量经济学中多重共线性案例问题研究报告方案

计量经济学中多重共线性案例问题研究摘要：本论文主要通过案例来研究计量经济学中的多重共线性的问题，对案例进行EVIEWS分析,并利用诊断共线性的经验方法及修正共线性的经验方法和通过EVIEWS分析对案例中的多重共线性进行诊断与修正，以能够完成减弱多重共线性的目标。关键字：多重共线性诊断共线性的经验方法修正共线性的经验方法经典的线性回归模型的假定之一是各解释变量X之间不存在多重共线性。然而，在计量经济学中所说的多重共线性（mnlti-collinearity），不仅包含解释变量之间精确的线性关系，还包含解释变量之间近似的线性关系。下面来通过研究国内生产总值的增加会影响财政收入的增加还是减少的案例对多重共线性进行研究。一、研究的目的和要求国内生产总值GDP按照支出法的公式为：国内生产总值=消费+投资+政府购买支出+净出口，而财政收入的主要来源为各项税收收入如增值税等。只有经济持续的增长，才能提供稳定的税收来源。所以，影响财政收入的主要因素是税收收入。但是，税收收入还影响着国内生产总值。因此，为了中国未来经济的发展，需要定量的分析影响中国财政收入的因素。二、模型设定及其估计经过研究与分析，影响财政收入的主要因素，除了税收收入以外，还有与一些其他因素有关。为此，考虑的影响因素主要有财政支出CZZC/亿元用X2表示，国内生产总值GDP/亿元用X3表示，税收总额SSZE/亿元用X4表示。各影响变量与财政收入之间呈现正相关。因此设定了如下形式的计量经济模型来研究“国内生产总值的增加会减少财政收入吗”这个问题： Y t=β1+β2X2t+β3X3t+β4X4t+μt 式中，Yt为第t年国内财政收入（亿元）；X2为财政支出（亿元）；X3为国内生产总值（亿元）；X4为税收总额（亿元）。各解释变量前的回归系数预期都大于0. 为估计模型参数，1985～2011年阶段财政收入的统计数据，如下表：

实验六多元线性回归和多重共线性

实验六多元线性回归和多重共线性姓名：何健华学号：201330110203 班级：13金融数学2班一实验目的：掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。二实验要求：应用教材P140例子4.3.1案例做多元线性回归模型，并识别和修正多重共线性。三实验原理：普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。四预备知识：最小二乘法估计的原理、t 检验、F 检验、R 2值。五实验步骤：有关的研究分析表明，影响国内旅游市场收入的主要因素，除了国内旅游人数和旅游支出外，还可能与基础设施有关。因此考虑影响国内旅游收入Y （单位为亿元）的以下几个因素：国内旅游人数X1、城镇居民人均旅游支出X2（单位为元）、农村居民人均旅游支出X3（单位为元）、并以公路里程X4（单位为万公里）和铁路里程X5（单位为万公里）作为相关设施的代表，根据这些变量建立如下的计量经济模型： 01122334455y x x x x x ββββββμ=++++++ 为了估计上述模型，从《中国统计年鉴》收集到1994年到2003年的有关统计数据。 Year Y X1 X2 X3 X4 X5 1994 1023.5 52400 414.7 54.9 111.78 5.9 1995 1375.7 62900 464 61.5 115.7 5.97 1996 1638.4 63900 534.1 70.5 118.58 6.49 1997 2112.7 64400 599.8 145.7 122.64 6.6 1998 2391.2 69450 607 197 127.85 6.64 1999 2831.9 71900 614.8 249.5 135.17 6.74 2000 3175.5 74400 678.6 226.6 140.27 6.87 2001 3522.4 78400 708.3 212.7 169.8 7.01 2002 3878.4 87800 739.7 209.1 176.52 7.19 2003 3442.3 87000 684.9 200 180.98 7.3 1、请用普通最小二乘方法估计模型参数； 2、检验模型是否存在多重共线性，如果存在共线性，试采用适当的方法消除共线性。

3案例分析(多重共线性)

多重共线性的案例分析一、研究的目的要求近年来，中国旅游业一直保持高速发展，旅游业作为国民经济新的增长点，在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场，入境旅游外汇收入年均增长22.6%，与此同时国内旅游也迅速增长。改革开放20多年来，特别是进入90年代后，中国的国内旅游收入年均增长14.4%，远高于同期GDP 9.76%的增长率。为了规划中国未来旅游产业的发展，需要定量地分析影响中国旅游市场发展的主要因素。二、模型设定及其估计经分析，影响国内旅游市场收入的主要因素，除了国内旅游人数和旅游支出以外，还可能与相关基础设施有关。为此，考虑的影响因素主要有国内旅游人数2X ，城镇居民人均旅游支出3X ，农村居民人均旅游支出4X ，并以公路里程5X 和铁路里程6X 作为相关基础设施的代表。为此设定了如下对数形式的计量经济模型： 23456123456t t t t t t t Y X X X X X u ββββββ=++++++ 其中：t Y ——第t 年全国旅游收入 2X ——国内旅游人数（万人） 3X ——城镇居民人均旅游支出（元） 4X ——农村居民人均旅游支出（元） 5X ——公路里程（万公里） 6X ——铁路里程（万公里）为估计模型参数，收集旅游事业发展最快的1994—2003年的统计数据，如表4.1所示：利用Eviews 软件，输入Y 、X2、X3、X4、X5、X6等数据，采用这些数据对模型进行OLS 回归，结果如表4.2：表4.2

由此可见，该模型9954.02=R ，9897.02 =R 可决系数很高，F 检验值173.3525,明显显著。但是当05.0=α时776 .2)610()(025.02=-=-t k n t α,不仅2X 、6X 系数的t 检验不显著，而且6X 系数的符号与预期的相反，这表明很可能存在严重的多重共线性。计算各解释变量的相关系数，选择X2、X3、X4、X5、X6数据，点”Quick/Group statistics/correlations ”得相关系数矩阵（如表4.3）：表4.3 由相关系数矩阵可以看出：各解释变量相互之间的相关系数较高，证实确实存在严重多重共线性。三、消除多重共线性采用逐步回归的办法，去检验和解决多重共线性问题。分别作Y 对X2、X3、X4、X5、X6的一元回归，结果如表4.4所示：表4.4

文档之家

多重共线性验证及修正

多重共线性的解决之法

(完整版)多重共线性检验与修正.doc

EVIEWS案例：(消除多重共线性)影响国内旅游市场收入的主要因素分析

多重共线性的检验与修正

多重共线性 多重共线性实验案例与独立实验问题

(整理)多重共线性的检验与修正

第七章 多共线性及其处理

计量经济学多重共线性

多重共线性

最新多重共线性的解决之法

多重共线性案例分析实验报告

检验多重共线性

EViews计量经济学实验报告-多重共线性的诊断与修正

多重共线性题目的检验和处理

计量经济学中多重共线性案例问题研究报告方案

实验六多元线性回归和多重共线性

3案例分析(多重共线性)

多重共线性多重共线性实验案例与独立实验问题

第七章多共线性及其处理