第二章最小二乘法和线性回归_金融计量学

格式：ppt
大小：1.58 MB
文档页数：66

下载文档原格式

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

（四）第一类错误和第二类错误

错误地拒绝；错误的接受。
（五）P值和检验的势
30
第三节多变量线性回归模型的统计检验
一、多变量模型的简单介绍
多元线性回归一般方程：
yt 1 2 x2t 3 x3t ...... k xkt ut
t=1,2,3….T
33
可以得到多变量回归系数的估计表达式
ˆ 1 ˆ 2 1 ˆ X X X y M ˆ k
同样我们可以得到多变量回归模型残差的样本方差
ˆ u ˆ u s T k
2
1 2 ˆ 参数的协方差矩阵 var s X X
32
在多变量回归中残差向量为：
ˆ1 u u ˆ2 ˆ u M ˆT u
残差平方和为：
ˆ u ˆ u ˆ1 u ˆ2 RSS u ˆ1 u u ˆ2 2 2 ˆT u ˆ1 u ˆ2 K u ˆT2 u ˆt2 L u M ˆT u
ˆ）总体y值被分解为两部分：模型拟合值（ y ˆx u 和残差项（）， yt ˆ ˆt t t 注意：SRF中没有误差项，一般假定ｕt~N 0, 2
ˆx ˆ ˆ y t
ˆ u
9
样本回归函数与总体回归函数的关系
Y
Yi

Yi
SRF PRF
ˆ Y i
E(Yi X i )
ˆ ˆ－～N0,1 ~ N 0,1 的： var var 需要注意的是：如果残差不服从正态分布，但只要
则通常认为系数估计量还是服从正态分布的。
从正态分布，系数估计量也是服从正态分布
CLRM的其他假设条件还成立，且样本容量足够大，
ˆ ˆ ~ SE
模型的不确定性也就越大。如果s2很大，这意
味着估计直线不能很好地拟合散点；
16
2 x x （3）参数估计值的方差与 t 成反比。
其值越小，散点越集中，这样就越难准确地估计拟合直线；相反，如果 xt x 越大，散点
2Baidu Nhomakorabea
越分散，这样就可以容易地估计出拟合直线，并且可信度也大得多。比较图2－2就可以清楚地看到这点。
x y T xy ˆ x Tx
t t 2 t 2
t 1
ˆx ˆ y
12
(二)最小二乘估计量的性质和分布
经典线性回归模型的基本假设：
（1）E ut 0 ，即残差具有零均值；
（2）var u 2<∞,即残差具有常数方差，且对 t 于所有x值是有限的；（3）cov ui , u j 0 ，即残差项之间在统计意义上是相互独立的；
2 t
1
1 s 2 2 x T x t
其中， s
ˆ u
T 2
是残差的估计标准差。
15
参数估计量的标准差具有如下的性质：（1）样本容量T越大，参数估计值的标准差越小；
ˆ 都取决于s2。 s2是残差的方差（2） ˆ 和SE SE
估计量。 s2越大，残差的分布就越分散，这样
14
(三) OLS估计量的方差、标准差和其概率分布 1.OLS估计量的方差、标准差。给定假设(1)－(4)，估计量的标准差计算方程如下:
ˆ s SE
x T x x
2 t t
2
s
x T x Tx
2 t 2 t 2
ˆ s SE
2 x x t
T 1 2 1 1 R T K

24
二、假设检验
回归分析是要判断解释变量X是否是被解释变
量Y的一个显著性的影响因素。计量经济学中，
主要是针对变量的参数真值是否为零来进行显
著性检验的。
假设检验采用的逻辑推理方法是反证法
先假定原假设正确，然后根据样本信息，观察
xt被称作自变量/解释变量/原因变量； α、β为参数，或称回归系数；ｕt通常被称为随机误差/扰动项，简称误差项。
模型中引入ｕt的原因？对“线性”的理解？
8
总体回归方程（PRF）表示变量之间的真实关系，有时也被称为数据生成过程（DGP）， PRF中的α、β值是真实值样本回归方程（SRF）是根据所选样本估算的变量之间的关系函数，方程为：
其中:解释变量的数目为k-1(x2t,x3t…,xkt)个， j称为偏回归系数，（β1’β2’…..βk）分别衡量了解释变量对因变量y的边际影响的程度。
矩阵形式为
y X u
31
y是T×1矩阵，X是T×k矩阵，β是k×1矩阵，u是T×1矩阵
多元线性回归模型的基本假定：假设1，解释变量是非随机的或固定的，且各X之间互不相关（无多重共线性）。假设2，随机误差项具有零均值、同方差及不序列相关性。假设3，解释变量与随机项不相关。假设4，随机项满足正态分布。
由此假设而导致的结果是否合理，基于“小概率事件不易发生”原理判断是否接受原假设。
25
假设检验有两种方法：置信区间检验法（confidence interval approach）和显著性检验法（test of significance approach）。显著性检验法中最常用的是t检验和F检验，前者是对单个变量系数的显著性检验，后者是对多个变量系数的联合显著性检验。
17
图2－2 直线拟合和散点集中度的关系
18

2 x （4） t
项只影响截距的标准差，不影响斜率
的标准差。理由是： xt2 衡量的是散点与y轴的
2 距离。 x t 越大，散点离y轴越远，就越难准确
地估计出拟合直线与y轴的交点（即截距）；反之，则相反。
19
2．OLS估计量的概率分布给定假设条件(5)，即u t ～N 0, 2 ，则 yt 也服
ei
A
ui
Xi
X
10
一元线性回归主要解决下列一些问题： 2 （1）利用样本对未知参数α、β、进行估计；（2）对回归模型作显著性检验；（3）当x=x0时对Y的取值作预测。
二、参数的最小二乘估计
(一) 最小二乘法的基本原则
普通最小二乘法（简记OLS）;
最小二乘法的基本原则是：最优拟合直线应该使各点到直线的距离的和最小，也可表述为距离的平方和最小。实际上是使残差平方和（简 T ˆt2 最小。求偏导并另其为零可得：记RSS） u
因为
TSS=ESS+RSS
所以
ESS 2 R＝
2
R 0,1
TSS RSS RSS （2.39） 1 TSS TSS TSS
R2越大，说明回归线拟合程度越好；R2越小，说明回归线拟合程度越差。由上可知，通过考察R2 的大小，我们就能粗略地看出回归线的优劣。
23
但是，R2作为拟合优度的一个衡量标准也存在
26
（一）t 检验
（1）对总体参数提出假设 H0： 1=0，
ˆ t 1 S ˆ
H1：10
（2）以原假设H0构造t统计量，并由样本计算其值
1
（3）给定显著性水平，查t分布表得临界值t /2(n-2) （4）比较，判断若 |t|> t /2(n-2)，则拒绝H0 ，接受H1 ；若 |t| t /2(n-2)，则拒绝H1 ，接受H0
tT 2
ˆ ~ tT 2 ˆ SE

20
第二节
一元线性回归模型的统计检验
一、拟合优度检验
拟合优度可用R2 表示：模型所要解释的
是y相对于其均值的波动性，即
y
t
y
2
（总平方和，简记TSS），这一平方和可以分 2 2 ˆ y y ˆt2 。成两部分： y t y = t + u
*
ˆ tcrit SE ˆ ） ˆ tcritSE （ ˆ ，
落在置信区间外，我们
29
* H : 拒绝 0 的原假设；反之，不能拒绝。
（三）t检验与置信区间检验的关系因此，实际上t检验法与置信区间法提供的结果是完全一样的。
ˆ * -tcrit tcrit ˆ SE ˆ tcrit SE ˆ ˆ tcritSE ˆ *
◆怎样具体测定公司的发展与这种决定性因素的数量关系?
◆如何对未来公司的股票价格进行预测？哪些因素最重要？
2
本章要点
回归分析和回归函数
经典线性回归模型的最小二乘估计
拟合优度检验回归系数的t检验和置信区间检验多变量模型的回归系数的F检验回归模型预测模型选择与案例分析
4
回归的古典意义：高尔顿遗传学的回归概念 ( 父母身高与子女身高的关系) 回归的现代意义：一个应变量对若干解释变量变量依存关系的研究回归的目的（实质）：由固定的解释变量去估计和预测应变量的平均值
5
图2-1 货币供应量和GDP散点图
6
由图中的点确定线的过程就是回归。
对于变量间的相关关系，我们可以根据大量的
是被模型解释的部分，记为称为回归平方和，简记ESS 。
2 ˆ u t 是不能被模型所解释的残差平方和RSS。
21
ˆ y y
2
TSS、ESS、RSS的关系以下图来表示更加直观一些：
图2－4 TSS、ESS、RSS的关系
22
ESS 拟合优度 R ＝ TSS
2
（2.37）（2.38）
3
第一节
最小二乘法的基本属性
一、有关回归的基本介绍
金融、经济变量之间的关系，大体上可以分为两种（确定关系、非确定关系）：
（1）函数关系：Y=f(X1,X2,….,XP)，其中Y的值是由Xi（i=1,2….p）所唯一确定的。（2）相关关系: Y=f(X1,X2,….,XP) ，这里Y的值不能由Xi（i=1,2….p）精确的唯一确定。
一些问题：
（1）具有不同被解释变量的模型之间是无法来比较R2的大小的。
（2）通常只要增加解释变量， R2就会不断的增大，这样我们就无法判断出这些解释变量是否应该包含在模型中。（3）R2的值经常会很高，达到0.9或更高，所以我们无法判断模型之间到底孰优孰劣。通常用调整后的R2，记为
R
2
R2
（4）covut , xt 0，即残差项与变量x无关；
（5）ｕt~N 0, 2 ,即残差项服从正态分布
13
如果满足假设(1)－(4)，根据高斯-马尔可夫定理，它们是最优线性无偏估计量（简记BLUE）。
ˆ 具有一些特性：由OLS得到的估计量 ˆ 、
（1）无偏性，参数估计值的均值等于其真实值。（2）最小方差性，在所有线性无偏估计量里， OLS估计量具有最小方差。（3）有效性，由（1）和（2）可得。（4）一致性，随着样本容量增加，近似真实值。
第二章最小二乘法（OLS）和线性回归模型
1
引子: 我们通常选择什么样的股票给我们带来盈利呢？
目前中国的资本市场逐渐成熟，投资于股市成为众多企业乃至个人的重要理财方式。因此利用上市公司当年的公开的财务指标对来年盈利状况予以预测，就成为投资人最重要的决策依据。 ◆是什么决定性的因素影响到上市公司的股票价格？ ◆公司的发展与这种决定性因素的数量关系究竟是什么？
27
图2-5 双侧检验拒绝区域和非拒绝区域分布
28
（二）置信区间检验 ˆ及其（1）用OLS法回归方程得到β的估计值
ˆ 标准差SE 。
（2）选择一个显著性水平（通常为5%），这
相当于选择95%的置信度。查t分布表，获得自
由度为T-2的临界值 tcrit 。
（3）所建立的置信区间为（4）如果零假设值
统计资料，找出它们在数量变化方面的规律（即“平均”的规律），这种统计规律所揭示的关系就是回归关系，所表示的数学方程就是回归方程或回归模型。
回归分析揭示的是被解释变量与解释变量之间的平均关系。
7
简单线性回归方程(总体回归方程PRF)：
yt xt ut
yt被称作因变量/被解释变量/结果变量；

第二章最小二乘法和线性回归_金融计量学

相关主题

文档推荐

最新文档

第二章 最小二乘法和线性回归_金融计量学

相关主题

文档推荐

最新文档

第二章最小二乘法和线性回归_金融计量学