4.2 多重共线性产生的后果
- 格式:ppt
- 大小:165.00 KB
- 文档页数:7
第四章 多重共线性 思考题4.1 多重共线性的实质是什么 ? 为什么会出现多重共线性 ? 4.2 多重共线性对回归参数的估计有何影响 ?4.3 多重共线性的典型表现是什么 ? 判断是否存在多重共线性的方法有哪些 ? 4.4 针对出现多重共线性的不同情形 , 能采取的补救措施有哪些 ?4.5 在涉及相关的宏观经济总量指标如 GDP 、货币供应量、物价总水平、国民总收入、就业人数等时间序列的数据中一般都会怀疑有多重共线性 , 为什么 ?4.6 多重共线性的产生与样本容量的个数n 、解释变量的个数k 是有无关系 ? 4.7 具有严重多重共线性的回归方程能否用来进行预测 ? 4.8 岭回归法的基本思想是什么 , 它对降低共线性有何作用 ? 4.9 以下陈述是否正确 ? 请判断并说明理由。
1) 在高度多重共线性的情形中 , 要评价一个或多个偏回归系数的单个显著性是不可能的。
2) 尽管有完全的多重共线性 ,OLS 估计量仍然是BLUE 。
3) 如果有某一辅助回归显示出高的2j R 值,则高度共线性的存在是肯定无疑的。
4) 变量的两两高度相关并不表示高度多重共线性。
5) 如果其他条件不变 ,VIF 越高 ,OLS 估计量的方差越大。
6) 如果在多元回归中,根据通常的t 检验,全部偏回归系数分别都是统计上不显著的 ,你就不会得到一个高的2R 值。
7) 在 Y 对2X 和3X 的回归中 , 假如3X 的值很少变化 ,这就会使Var(3ˆβ)增大 , 在极端的情形下 , 如果全部3X 值都相同 ,Var(3ˆβ)将是无穷大。
8) 如果分析的目的仅仅是预测 , 则多重共线性是无害的。
练习题 4.1 假设在模型12233ii i i Y X X u βββ=+++中 ,2X 与3X 之间的相关系数为零 , 于是有人建议你进行以下回归。
1221i i i Y X u αα=++ 1332i i i Y X u γγ=++是否存在2ˆα=2ˆβ且3ˆγ=3ˆβ?为什么 ? 2) 1ˆβ会等于1ˆα或1ˆγ或两者的某个线性组合吗 ? 3) 是否有Var(2ˆβ)且Var(2ˆα)且Var (3ˆβ)=Var(3ˆγ)? 4.2 在决定一个回归模型的 " 最优 " 解释变量集时人们常用逐步回归的方法,在逐步回归中既可采取每次引进一个解释变量的程序 ( 逐步向前回归 ), 也可以先把所有可能的解释变 量都放在一个多元回归中 , 然后逐一地将它们剔除 ( 逐步向后回归 ) 。
用主成分法解决多重共线性问题一、多重共线性的表现线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系。
看似相互独立的指标本质上是相同的,是可以相互代替的,但是完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。
二、多重共线性的后果1.理论后果多重共线性是因为变量之间的相关程度比较高。
按布兰查德认为, 在计量经济学中, 多重共线性实质上是一个“微数缺测性”问题,就是说多重共线性其实是由样本容量太小所造成,当样本容量越小,多重共线性越严重。
多重共线性的理论主要后果:(1)完全共线性下参数估计量不存在;(2)近似共线性下OLS估计量非有效;(3)模型的预测功能失效;(4)参数估计量经济含义不合理2.现实后果(1)各个解释变量对指标最后结论影响很难精确鉴别;(2)置信区间比原本宽,使得接受假设的概率更大;(3)统计量不显著;(4)拟合优度的平方会很大;(5)OLS估计量及其标准误对数据微小的变化也会很敏感。
三、多重共线性产生的原因1.模型参数的选用不当,在我们建立模型时如果变量之间存在着高度的相关性2. 由于研究的经济变量随时间往往有共同的变化趋势,他们之间存在着共性。
例如当经济繁荣时,反映经济情况的指标有可能按着某种比例关系增长3. 滞后变量。
滞后变量的引入也会产生多重共线行,例如本期的消费水平除受本期的收入影响之外,还有可能受前期的收入影响,建立模型时,本期的收入水平就有可能和前期的收入水平存在着共线性。
四、多重共线性的识别1.方差扩大因子法( VIF)一般认为如果最大的VIF超过10,常常表示存在多重共线性。
2.容差容忍定法如果容差(tolerance)<=0.1,常常表示存在多重共线性。
3. 条件索引条件索引(condition index)>10,可以说明存在比较严重的共线性。
五、多重共线性的处理方法处理方法有多重增加样本容量、剔除因子法、PLS(偏最小二乘法)、岭回归法、主成分法。
多元回归中的多重共线性及其存在的后果
多重共线性,又称共线性估计,是多元统计分析中一个很重要的问题。
它是指变量之间的相互依赖性,从而影响回归分析的结果。
尽管回归模型中不存在多重共线性的原理非常简单,但是当被研究变量之间存在多重共线性时,会对分析结果造成极大的影响。
多重共线性会导致模型参数估计失真,并使其产生过大或者过小的残差。
这会导致回归分析所得出的模型偏离实际情况,所得结果可能不可靠。
此外,多重共线性也会降低模型的可解释性,因此,模型中构建的解释变量分析可能不准确。
识别多重共线性是解决多元线性回归问题的关键。
首先,可以通过VIF指标(变量影响因子)来检验变量之间的共线性。
该指标可以有效地发现模型中的重要自变量是否存在多重共线性。
此外,常规的因变量分析方法也可用于检验多重共线性。
常用方法有共线性健全性检验(CES)、Dwyer和O'Neill等等变量共线检验方法。
识别多重共线性并采取措施避免其对分析结果造成影响是多元线性回归中最重要的步骤。
多重共线性是多元线性回归中一个至关重要的问题,它可能会导致模型参数估计偏离实际情况,失真,同时还会降低模型的可解释性,所以检测多重共线性的步骤是有必要的。
将多重共线性考虑进去,可以避免影响模型分析结果的不利因素,以此来提高分析结果的准确性。