第四章 多重共线性 答案(1)
- 格式:docx
- 大小:195.18 KB
- 文档页数:10
第四章课后习题 4.1 解1)存在22βˆαˆ=且33βˆγˆ=。
因为2X 和3X 之间的相关系数为零,即2X 和3X 相互之间不存在线性关系,两者是相互独立的,所以分别一元回归和二元回归两者的系数都不会发生变化。
利用公式证明如下:2)会。
3)如第一问解释,22βˆαˆ=,33βˆγˆ=是成立的,所以存在)αˆ()βˆ(22Var Var =,)αˆ()βˆ(33Var Var =。
4.2 解:根据我对多重共线性的认识,我认为任何一种逐步回归都存在弊端。
根据课本上对多重共线性的定义,不仅包括解释变量之间精确的线性关系,还包括解释变量之间近似的线性关系。
而逐步回归法是通过逐步筛选并剔除引起多重共线性的变量。
所以在采用逐步回归法时,难免会出现一些不符合要求的变量被剔除的情况,此变量岁引起多重共线性,但其对被解释变量也有一定的影响,直接剔除就是忽略其的影响,使得回归结果不够精确。
误差增大。
4.3解:将数据输入到Eviews中,可得如下图所示:图1注释:X2表示国内生产总值GDP,X3表示居民消费价格指数CPI。
利用软件,采用最小二乘法进行回归,结果如下图所示:图2 建立回归模型如下:i t X X Y μβββ+++33221ln ln ln =1)从回归结果中,可知此模型的参数1β=﹣3.06015,2β=1.656675,3β=﹣1.0570542) 利用软件求出lnx2和lnx3的相关系数,可得由上图可知lnx2,lnx3之间存在很强的线性相关性。
证实存在多重共线性。
根据题目要求分别进行三次回归:图3 图4 图5根据元以上回归结果可知,lnx2和lnx3在一元回归中分别对lny 影响显著,都通过了P 值法的检验;而在第三个回归结果中,可知lnx2和lnx3存在显著的线性关系,因为1C 没有通过P 值法检验,故修正后的模型为32ln 245971.2ln x x =。
故此题中存在严重的多重共线性。
第四章练习题参考解答练习题4.1 假设在模型i i i i u X X Y +++=33221βββ中,32X X 与之间的相关系数为零,于是有人建议你进行如下回归:ii i i i i u X Y u X Y 23311221++=++=γγαα(1)是否存在3322ˆˆˆˆβγβα==且?为什么? (2)吗?或两者的某个线性组合或会等于111ˆˆˆγαβ (3)是否有()()()()3322ˆvar ˆvar ˆvar ˆvar γβαβ==且? 4.2在决定一个回归模型的“最优”解释变量集时人们常用逐步回归的方法。
不我待在逐步回归中既可采取每次引进一个解释变量的程序(逐步向前回归),也可以先把所有可能的解释变量都放在一个多元回归中,然后逐一地将它们剔除(逐步向后回归)。
加进或剔除一个变量,通常是根据F 检验看其对ESS 的贡献而作出决定的。
根据你现在对多重共线性的认识,你赞成任何一种逐步回归的程序吗?为什么?4.3资料来源:《中国统计年鉴》,中国统计出版社2008年。
请考虑下列模型:i t t t u CPI GDP Y ++=ln ln ln 321βββ+ (1)利用表中数据估计此模型的参数。
(2)你认为数据中有多重共线性吗? (3)进行以下回归:it t i t t i t t v CPI C C GDP v CPI B B Y v GDP A A Y 321221121ln ln ln ln ln ln ++=+=+=++根据这些回归你能对数据中多重共线性的性质说些什么?(4)假设数据有多重共线性,但32ˆˆββ和在5%水平上个别地显著,并且总的F 检验也是显著的。
对这样的情形,我们是否应考虑共线性的问题?4.4 自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造解释变量数据矩阵X 才可能避免多重共线性的出现?4.5 克莱因与戈德伯格曾用1921-1950年(1942-1944年战争期间略去)美国国内消费Y 和工资收入X1、非工资—非农业收入X2、农业收入X3的时间序列资料,利用OLSE 估计得出了下列回归方程:37.107 95.0 (1.09) (0.66) (0.17) (8.92) 3121.02452.01059.1133.8ˆ2==+++=F R X X X Y (括号中的数据为相应参数估计量的标准误)。
多重共线性习题及答案多重共线性一、单项选择题1、当模型存在严重的多重共线性时,OLS估计量将不具备()A、线性B、无偏性C、有效性D、一致性2、经验认为某个解释与其他解释变量间多重共线性严重的情况是这个解释变量的VIF()A、大于B、小于C、大于5D、小于53、模型中引入实际上与解释变量有关的变量,会导致参数的OLS 估计量方差()A、增大B、减小C、有偏D、非有效4、对于模型y t=b0+b1x1t+b2x2t+u t,与r12=0相比,r12=0.5时,估计量的方差将是原来的()A、1倍B、1.33倍C、1.8倍D、2倍5、如果方差膨胀因子VIF=10,则什么问题是严重的()A、异方差问题B、序列相关问题C、多重共线性问题D、解释变量与随机项的相关性6、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在( )A 异方差B 序列相关C 多重共线性D 高拟合优度7、存在严重的多重共线性时,参数估计的标准差()A、变大B、变小C、无法估计D、无穷大8、完全多重共线性时,下列判断不正确的是()A、参数无法估计B、只能估计参数的线性组合C、模型的拟合程度不能判断D、可以计算模型的拟合程度二、多项选择题1、下列哪些回归分析中很可能出现多重共线性问题()A、资本投入与劳动投入两个变量同时作为生产函数的解释变量B、消费作被解释变量,收入作解释变量的消费函数C、本期收入和前期收入同时作为消费的解释变量的消费函数D、商品价格、地区、消费风俗同时作为解释变量的需求函数E、每亩施肥量、每亩施肥量的平方同时作为小麦亩产的解释变量的模型2、当模型中解释变量间存在高度的多重共线性时()A、各个解释变量对被解释变量的影响将难以精确鉴别B、部分解释变量与随机误差项之间将高度相关C、估计量的精度将大幅度下降D、估计对于样本容量的变动将十分敏感E、模型的随机误差项也将序列相关3、下述统计量可以用来检验多重共线性的严重性()A、相关系数B、DW值C、方差膨胀因子D、特征值E、自相关系数4、多重共线性产生的原因主要有()A、经济变量之间往往存在同方向的变化趋势B、经济变量之间往往存在着密切的关联C、在模型中采用滞后变量也容易产生多重共线性D、在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性E、以上都正确5、多重共线性的解决方法主要有()A、保留重要的解释变量,去掉次要的或替代的解释变量B、利用先验信息改变参数的约束形式C、变换模型的形式D、综合使用时序数据与截面数据E、逐步回归法以及增加样本容量6、关于多重共线性,判断错误的有()A、解释变量两两不相关,则不存在多重共线性B、所有的t检验都不显著,则说明模型总体是不显著的C、有多重共线性的计量经济模型没有应用的意义D、存在严重的多重共线性的模型不能用于结构分析7、模型存在完全多重共线性时,下列判断正确的是()A、参数无法估计B、只能估计参数的线性组合C、模型的判定系数为0D、模型的判定系数为1三、简述1、什么是多重共线性?产生多重共线性的原因是什么?2、什么是完全多重共线性?什么是不完全多重共线性?3、完全多重共线性对OLS估计量的影响有哪些?4、不完全多重共线性对OLS估计量的影响有哪些?5、从哪些症状中可以判断可能存在多重共线性?6、什么是方差膨胀因子检验法?四、判断(1)如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。
4.31)建立经济模型:i t t t CPI GDP Y μβββ+++=ln ln ln 321其中 Y 表示为商品进口额,GDP 表示为国内生产总值,CPI 表示为居民消费价格指数。
模型参数估计结果:t t t CPI GDP Y ln 057053.1ln 656674.1060149.3ln -+-=(0.337427)(0.092206) (0.214647)t= (-9.069059) (17.96703) (-4.924618)992218.02=R 991440.02=RF=1275.093(2)居民消费价格指数的回归系数的符号不能进行合理的经济意义解释,且CPI 与进口之间的简单相关系数呈现正向变动。
可能数据中有多重共线性。
计算相关系数:从上图可知, GDP 与CPI 之间存在较高的线性相关。
3)已知:i t t GDP A A Y 121ln ln μ++= i t t CPI B B Y 221ln ln μ++= i t t CPI C C GDP 321ln ln μ++=对以上三个模型分别进行回归,结果如下:t t GDP Y ln 218573.1090667.4ln +-=(0.384252) (0.035196)t= (-10.64579) (34.62222)982783.02=R 981963.02=R F=1198.698t t CPI Y ln 253662.1442420.5ln +-=(1.253662) (0.228046)t= (-4.341218) (11.68091)866619.02=R 860268.02=R F=136.4437t t CPI GDP 245971.2437984.1ln +-=(0.734328) (0.133577)t= (-1.958231) (16.81400)930855.02=R 927563.02=R F=282.7107单方程拟合效果都很好,回归系数显著,可决系数较高,GDP 和CPI 对进口分别有显著的单一影响,在这两个变量同时引入模型时影响方向发生了改变,这只有通过相关系数的分析才能发现。
第四章 多重共线性一、判断题1、多重共线性是一种随机误差现象。
(F )2、多重共线性是总体的特征。
(F )3、在存在不完全多重共线性的情况下,回归系数的标准差会趋于变小,相应的t 值会趋于变大。
(F )4、尽管有不完全的多重共线性,OLS 估计量仍然是最优线性无偏估计量。
(T )5、在高度多重共线的情形中,要评价一个或多个偏回归系数的个别显著性是不可能的。
(T )6、变量的两两高度相关并不表示高度多重共线性。
(F )7、如果分析的目的仅仅是预测,则多重共线性一定是无害的。
(T )8、在多元回归中,根据通常的t 检验,每个参数都是统计上不显著的,你就不会得到一个高的2R 值。
(F )9、如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。
( F )10、多重共线性问题的实质是样本问题,因此可以通过增加样本信息得到改善。
(T ) 11、虽然多重共线性下,很难精确区分各个解释变量的单独影响,但可据此模型进行预测。
(T )12、如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性。
(F )13、多重共线性的存在会降低OLS 估计的方差。
(F )14、随着多重共线性程度的增强,方差膨胀因子以及系数估计误差都在增大。
(T ) 15、解释变量和随机误差项相关,是产生多重共线性的原因。
(F ) 16、对于模型i ni n i 110i u X X Y ++++=βββ ,n 1i ,, =;如果132X X X -=,模型必然存在解释变量的多重共线性问题。
(T )17、多重共线性问题是随机扰动项违背古典假定引起的。
(F ) 18、存在多重共线性时,模型参数无法估计。
(F )二、单项选择题1、在线性回归模型中,若解释变量1X 和2X 的观测值成比例,既有12i i X kX =,其中k 为 非零常数,则表明模型中存在 ( B ) A 、异方差 B 、多重共线性 C 、序列相关 D 、随机解释变量2、 在多元线性回归模型中,若某个解释变量对其余解释变量的可决系数接近1,则表明模型中存在 ( C ) A 、异方差性 B 、序列相关C 、多重共线性D 、拟合优度低3、对于模型i i 22i 110i u X X Y +++=βββ,与0r 12=相比,当50r 12.=时,估计量1βˆ的方差()1βˆvar 将是原来的 ( B ) A 、 1 倍 B 、 1.33 倍 C 、1.96 倍 D 、 2 倍 4、如果方差膨胀因子VIF =10,则认为什么问题是严重的( C )A 、异方差问题B 、序列相关问题C 、多重共线性问题D 、 解释变量与随机项的相关性 5、经验认为某个解释与其他解释变量间多重共线性严重的情况是这个解释变量的VIF ( C )。
第四章 多重共线性一、判断题1、多重共线性是一种随机误差现象。
(F )2、多重共线性是总体的特征。
(F )3、在存在不完全多重共线性的情况下,回归系数的标准差会趋于变小,相应的t 值会趋于变大。
(F )4、尽管有不完全的多重共线性,OLS 估计量仍然是最优线性无偏估计量。
(T )5、在高度多重共线的情形中,要评价一个或多个偏回归系数的个别显著性是不可能的。
(T )6、变量的两两高度相关并不表示高度多重共线性。
(F )7、如果分析的目的仅仅是预测,则多重共线性一定是无害的。
(T )8、在多元回归中,根据通常的t 检验,每个参数都是统计上不显著的,你就不会得到一个高的2R 值。
(F )9、如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。
( F )10、多重共线性问题的实质是样本问题,因此可以通过增加样本信息得到改善。
(T ) 11、虽然多重共线性下,很难精确区分各个解释变量的单独影响,但可据此模型进行预测。
(T )12、如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性。
(F )13、多重共线性的存在会降低OLS 估计的方差。
(F )14、随着多重共线性程度的增强,方差膨胀因子以及系数估计误差都在增大。
(T ) 15、解释变量和随机误差项相关,是产生多重共线性的原因。
(F ) 16、对于模型i ni n i 110i u X X Y ++++=βββ ,n 1i ,, =;如果132X X X -=,模型必然存在解释变量的多重共线性问题。
(T )17、多重共线性问题是随机扰动项违背古典假定引起的。
(F ) 18、存在多重共线性时,模型参数无法估计。
(F )二、单项选择题1、在线性回归模型中,若解释变量1X 和2X 的观测值成比例,既有12i i X kX =,其中k 为 非零常数,则表明模型中存在 ( B ) A 、异方差 B 、多重共线性 C 、序列相关 D 、随机解释变量2、 在多元线性回归模型中,若某个解释变量对其余解释变量的可决系数接近1,则表明模型中存在 ( C ) A 、异方差性 B 、序列相关C 、多重共线性D 、拟合优度低3、对于模型i i 22i 110i u X X Y +++=βββ,与0r 12=相比,当50r 12.=时,估计量1βˆ的方差()1βˆvar 将是原来的 ( B ) A 、 1 倍 B 、 1.33 倍 C 、1.96 倍 D 、 2 倍 4、如果方差膨胀因子VIF =10,则认为什么问题是严重的( C )A 、异方差问题B 、序列相关问题C 、多重共线性问题D 、 解释变量与随机项的相关性 5、经验认为某个解释与其他解释变量间多重共线性严重的情况是这个解释变量的VIF ( C )。
A 、大于1 B 、小于1 C 、大于10 D 、小于10 6、模型中引入实际上与解释变量有关的变量,会导致参数的OLS 估计量方差( A ) A 、增大 B 、减小 C 、有偏 D 、非有效 7、存在严重的多重共线性时,参数估计的标准差( A )。
A 、变大B 、变小C 、无穷大D 、无法估计 8、完全多重共线性时,下列判断不正确的是( D )。
A 、参数无法估计B 、只能估计参数的线性组合C 、模型的拟合程度不能判断D 、可以计算模型的拟合程度9、模型中引入一个无关的解释变量( C )A 、对模型参数估计量的性质不产生任何影响B 、导致普通最小二乘估计量有偏C 、导致普通最小二乘估计量精度下降D 、导致普通最小二乘估计量有偏,同时精度下降三、多项选择题1、关于多重共线性的影响,下面哪些正确:( ABCD )A 、增大回归系数的标准差B 、难以区分单个自变量的影响C 、t 检验倾向于不显著D 、回归参数估计值不稳定 2、下列哪些回归分析中很可能出现多重共线性问题( ACE )。
A 、资本投入与劳动投入两个变量同时作为生产函数的解释变量B 、消费作被解释变量,收入作解释变量的消费函数C 、本期收入和前期收入同时作为消费的解释变量的消费函数D 、商品价格、地区、消费风俗同时作为解释变量的需求函数E 、每亩施肥量、每亩施肥量的平方同时作为小麦亩产的解释变量的模型 3、当模型中解释变量间存在高度的多重共线性时( ACD )。
A、各个解释变量对被解释变量的影响将难以精确鉴别B、部分解释变量与随机误差项之间将高度相关C、估计量的精度将大幅度下降D、估计对于样本容量的变动将十分敏感E、模型的随机误差项也将序列相关4、下述统计量可以用来检验多重共线性的严重性(ACD )。
A、相关系数B、DW值C、方差膨胀因子D、特征值E、自相关系数5、多重共线性产生的原因主要有(ABCDE )。
A、经济变量之间往往存在同方向的变化趋势B、经济变量之间往往存在着密切的关联C、在模型中采用滞后变量也容易产生多重共线性D、在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性E、以上都正确6、多重共线性的解决方法主要有(ABCDE )。
A、保留重要的解释变量,去掉次要的或替代的解释变量B、利用先验信息改变参数的约束形式C、变换模型的形式D、综合使用时序数据与截面数据E、逐步回归法以及增加样本容量7、关于多重共线性,判断错误的有(ABC )。
A、解释变量两两不相关,则不存在多重共线性B、所有的t检验都不显著,则说明模型总体是不显著的C、有多重共线性的计量经济模型没有应用的意义D、存在严重的多重共线性的模型不能用于结构分析8、模型存在完全多重共线性时,下列判断正确的是(AB )。
A、参数无法估计B、只能估计参数的线性组合C、模型的可决系数为0D、模型的可决系数为19、下列判断正确的有(ABC )。
A、在严重多重共线性下,OLS估计量仍是最佳线性无偏估计量。
B、多重共线性问题的实质是样本现象,因此可以通过增加样本信息得到改善。
C、虽然多重共线性下很难精确区分各个解释变量的单独影响,但可据此模型进行预测。
D、如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性。
10、检测多重共线性的方法有(AC )。
A、简单相关系数检测法B、样本分段比较法C 、 方差膨胀因子检测法D 、 可决系数增量贡献法E 、 工具变量法四、简答题1、什么是多重共线性?产生多重共线性的原因是什么?答:多重共线性是指解释变量之间存在完全或近似的线性关系。
产生多重共线性主要有下述原因:(1)经济变量之间具有共同变化趋势(2)模型中包含滞后变量(3)利用截面数据建立模型(4)样本数据的自身原因,例如抽样仅限于总体中解释变量取值的一个有限范围。
2、什么是完全多重共线性?什么是不完全多重共线性?答:完全多重共线:对于解释变量k 32X X X 1,,,, ,如果存在不全为0的数k 21λλλ,,, ,使得()n 21i 0X X X ki k i 33i 221,,, ==++++λλλλ则称解释变量k 32X X X 1,,,, 之间存在着完全的多重共线性。
不完全多重共线性:对于解释变量k 32X X X 1,,,, ,如果存在不全为0的数k 21λλλ,,, ,使得()n 21i 0v X X X i ki k i 33i 221,,, ==+++++λλλλ式中,i v 为随机变量,则称解释变量k 32X X X 1,,,, 之间存在着不完全的多重共线性。
3、完全多重共线性对OLS 估计量的影响有哪些? 答:(1)参数的估计值不确定,不能独立分辨各个解释变量对被解释变量的影响。
(2)参数估计值的方差无穷大。
4、不完全多重共线性对OLS 估计量的影响有哪些?答:(1)回归的参数估计值很不稳定,普通最小二乘估计不精确。
(2)参数估计值的方差与协方差增大。
(3)对参数区间估计时,置信区间趋于变大。
(4)严重多重共线性时,假设检验容易作出错误的判断,t 检验可能倾向于不显著,甚至可能回归系数的正负号得不到合理的经济解释。
5、从哪些症状中可以判断可能存在多重共线性?答:(1)模型总体性检验F 值和R 2值都很高,但各回归系数估计量的方差很大,t 值很低,系数不能通过显著性检验。
(2)回归系数值难以置信或符号错误。
(3)参数估计值对删除或增加少量观测值,以及删除一个不显著的解释变量非常敏感。
6、什么是方差膨胀因子检验法?答:所谓方差膨胀因子是存在多重共线性时回归系数估计量的方差与无多重共线性时回归系数估计量的方差对比而得出的比值系数。
若1VIF j =时,认为原模型不存在“多重共线性问题”;若1VIF j >时,则认为原模型存在“多重共线性问题”;若10VIF j ≥时,则模型的“多重共线性问题”的程度是很严重的,而且是非常有害的。
五、计算题1、考虑下表中的数据Y -10 -8 -6 -4 -2 0 2 4 6 8 10 X1 1 2 3 4 5 6 7 8 9 10 11 X2 1 3 5 7 9 11 13 15 17 19 21假设你做Y对X1和X2的多元回归,你能估计模型的参数吗?为什么?答:不能。
因为X1和X2存在完全的多重共线性,即X2=2 X1-1,或X1=0.5(X2+1)。
2、下表给出了以美元计算的每周消费支出(Y),每周收入(X1)和财富(X2)的假想数据。
(1)作Y对X1和X2的OLS(2)直观地判断这一回归方程中是否存在多重共线性?为什么?(3)分别作Y对X1和X2的回归,这些回归结果表明了什么?(4)作X2对X1的回归。
这一回归结果表明了什么?答:(1)21X 0350X 872033724Y ...ˆ-+=T (3.875) (2.773) (-1.160) R 2=0.9682(2)可能存在多重共线性。
因为财富的系数解释是随着财富的增加,消费支出的金额在减少,这与经济理论不相符。
而且,财富的系数不显著。
因此可能是由于多重共线性引起的。
(3)1X 509045524Y ..ˆ+=T (3.813) (14.243) R 2=0.9622X 048045226Y ..ˆ+=T (3.132) (10.575) R 2=0.9332回归结果表明两个解释变量对消费支出的影响都是显著的,并且解释能力较强。
(4)12X 373103643X ..ˆ+-=T (-0.046) (25.253) R 2=0.988回归结果表明每周的收入与财富是高度线性相关的,二者同时作为解释变量会产生严重的多重共线性。
3、某地区供水部门利用最近15年的用水年度数据得出如下估计模型:rain 1231price 8717pcy 0050pop 3630house 30509326water ......---++-=t=(-1.7) (0.9) (1.4) (-0.6) (-1.2) (-0.8)938F 930R 2.,.==其中,water-用水总量(百万立方米),house-住户总数(千户),pop-总人口(千人),pcy-人均收入(元),price-价格(元/100 立方米),rain-降水量(毫米)。