计量经济学讲义-3--第一章 线性回归基础
- 格式:doc
- 大小:343.00 KB
- 文档页数:4
4 最小二乘原理计量经济学最关心的理论模型是类似于y x αβ=+ 表示变量之间的关系。
1. 散点图为了弄清楚变量之间的关系,我们从画出他们的散点图开始比较好。
从画的图中我们可以大体上判断以下变量之间是呈直线关系,还是二次曲线关系。
这对准确建立模型很有帮助。
模型y x αβ=+代表只要我们知道x ,我们就可以完全知道y 。
但是现实中不是这样。
这时除了系统因素x 之外,还有其他别的因素影响y 。
此时我们用确率模型,1,2,,t t t Y X u t n αβ=++=L来表示。
其中,y 是被说明变量,或从属变量;x 是说明变量,或独立变量;u 是误差项,也可以叫做搅乱项。
2. 函数的设定与参数的意义不同的模型定义,它所定义的参数的意义不同。
为简单起见,在本节中,我们先省去误差项。
我们讨论一下参数的意义。
在y x αβ=+中,dydxβ=,β意味着x 发生一单位的变化时,y 相应地变化几个单位,也就是我们所熟悉的限界消费性向。
但是对于y x βα=来说,我们先两边取自然对数,log log log y x αβ=+,这时,log log d y d x β=,其中,log ,log dy dx d y d x y x ==,结果log log d y x dyd x y dxβ==。
β代表x 变化1%时,y 变化β%单位。
也就是弹力性。
3. 最小二乘法3-1. 基本符号样本平均 1111,n nt t t t X X Y Y n n ====∑∑偏离样本平均的平方和 ()22222111n nnxt tt t t t S x XX X nX =====-=-∑∑∑;()22222111n n nytt t t t t S y Y Y Y nY =====-=-∑∑∑()()111n nnxy t ttt t t t t t S x y XX Y Y X Y nXY =====--=-∑∑∑其中,,t t t t x X X y Y Y =-=-,小写代表偏离样本平均的程度,即偏差。
偏差有以下重要性质:()110n nt tt t x XX ===-=∑∑;()110n nttt t y Y Y ===-=∑∑证明:()121ntn t XX X X X X X X =-=-+-++-∑L1nt t X nX ==-∑111nn t t t t X n X n ==⎛⎫=- ⎪⎝⎭∑∑=0我们可以同样证明10ntt y==∑。
下面我们再看看()222211nnxtt t t S XX X nX ===-=-∑∑。
()()2222112nn xtt t t t S XX X X X X ===-=-+∑∑22112nn tt t t X X X nX ===-+∑∑ ()2212ntt X X nX nX ==-+∑221nt t X nX ==-∑我们用同样的方法可以求出2,y xy S S 。
3-2. 最小二乘原理我们定义Y X αβ=+的推定线为ˆˆˆYX αβ=+,其中ˆY 和ˆˆ,αβ分别代表Y 和,αβ的推定值,∧读为ha.to 。
当t X X =时,ˆˆˆt t Y X αβ=+。
观察值t Y 与推定值ˆt Y 之间的差,我们称之为残差(residual)。
在图中,用垂直于横轴的线段t e 来表示。
即,ˆˆˆt t t t te Y Y Y X αβ=-=--,t e 代表观察时点t 时,观察值与推定值的不一致的程度。
为了评价所有的观察时点1,2,,t n =L ,的不一致程度,我们用()2211ˆˆn ntttt t e Y X αβ===--∑∑作为衡量的尺度。
()2211ˆˆn nt t tt t e Y X αβ===--∑∑我们把21ntt e=∑称为残差平方和(residual sum ofsquares,RSS)。
但是我们不能用1ntt e=∑,31ntt e=∑和51ntt e=∑作为衡量不一致程度的工具。
因为与观察值无关,只要给出足够大的ˆˆ,αβ,1nt t e =∑,31nt t e =∑和51ntt e =∑可以任意地变小。
也就是说它们没有最小值。
但是,21ntt e=∑ 确不一样。
21ntt e=∑的值与ˆˆ,αβ有关。
所以我们只要找到使得21ntt e =∑最小的ˆˆ,αβ最为,αβ的推定值。
这就是最小二乘法。
3-3. 最小二乘推定量的导出对于模型,1,2,,t t t Y X u t n αβ=++=L 来说,,αβ的最小二乘推定量为ˆˆ,αβ,它们是使得残差平方和()2211ˆˆnnt t tt t e Y X αβ===--∑∑最小的,αβ的推定值。
()()垐?垐t t t t Y X Y Y X X Y X αββαβ--=---+--()垐ˆtt y x Y X βαβ=-+-- 两边平方 2ˆˆ()t tY X αβ-- ()()()2222垐垐垐垐?222t t t t t t y x Y X x y y Y x Y X βαββαββαβ=++---+----- ()21ˆˆnttt Y X αβ=--∑ ()()()222211111垐垐垐垐?222nnnnnt t t tt tt t t t t y x n Y X x y Y y Y X xβαββαββαβ======++---+-----∑∑∑∑∑前面我们曾经提到10ntt e==∑,进一步我们可以得到110,0nnt t t t x y ====∑∑,()21ˆˆnt tt Y X αβ=--∑()2222111垐?ˆ2nnntt t tt t t y x n Y X x yβαββ====++---∑∑∑我们用偏差平方和的写法把上面的残差平方和再重新改写一下,()21ˆˆnt tt Y X αβ=--∑()2222垐?ˆ2yx xyS S n Y X S βαββ=++--- ()2222垐?ˆ2y x xyS S n Y X S βαββ=++--- ()22222垐ˆxy xy x y x x S S n Y X S S S S αββ⎛⎫⎛⎫=--+-+- ⎪ ⎪ ⎪⎝⎭⎝⎭上式的右侧第三项中不含有ˆˆ,αβ,所以第三项不会随着ˆˆ,αβ的变化而变化。
第一项和第二项由都是平方的形式,因此只要第一项和第二项同时为0的是时候,残差平方和就为最小,也就是残差平方和为0。
()2ˆˆ0Y X αβ--= 2ˆ0xy x x S S S β⎛⎫-= ⎪⎝⎭这种求最小二乘推定量方法的优点是,不需要使用偏微分方法,也不需要讨论为使残差平方和最小而必须满足的二次条件。
4. 最小二乘回归线我们把ˆˆˆt tY X αβ=+称为最小二乘回归线或样本回归线。
我们把ˆˆY X αβ=-代入样本回归线中,我们发现 ()垐?ˆt t tY Y X X Y X X βββ=-+=+-,由此我们可以判断样本回归线经过样本平均点(),X Y 。
5. 练习题1). 使用下面的数据,用最小二乘法估计模型Y X u αβ=++。
X 6 11 17 8 13 Y13524。
第一种方法: x 6 11 17 8 13 55 sum(x) y1 352415 sum(y)xy 633 85 16 52 192 sum(xy)xx 36 121 289 64 169 679 sum(xx)()2251925515135ˆ0.36556795555370n XY X Y n X X β-⨯-⨯====⨯-⨯-∑∑∑∑∑;ˆˆY X nβα-=∑∑=-1.01另外一种求法:先求出均值,X Y ;求出small x,y;再求出2,,,x y xy x∑∑∑∑;2垐ˆ;xyY X xβαβ==-∑∑;。