计量经济学重点内容
- 格式:docx
- 大小:91.51 KB
- 文档页数:5
1. 计量经济学是以经济理论为前提,利用数学、数理统计方法与计算技术,根据实际观测资料来研究带有随机影响的经济数量关系和规律的一门学科。
经济理论、数据和统计理论这三者对于真正了解现代经济生活中的数量关系都是必要的,但本身并非是充分条件。
三者结合起来就是力量,这种结合便构成了计量经济学。
经济理论的作用是对经济现象进行分析和解释,描述在一定条件下经济变量之间的相互关系。
体现在计量经济学模型之中。
2. 三大要素的经济理论:经济理论对于计量经济学是建立计量经济模型的依据和出发点。
计量经济学对于经济理论而言是理论到实际的桥梁和检验工具。
观测数据:主要是指统计数据和各种调查数据。
是所考察的经济对象的客观反映和信息载体,是计量经济工作处理的主要现实素材。
经济数据是计量经济分析的材料。
经济数据是经济规律的信息载体。
数据类型有时间序列数据、截面数据、平行数据、虚拟变量数据。
统计理论:是指各种数理统计方法,包括参数的估计,假设检验等内容。
是计量经济的主要数学基础,很多计量经济学方法都是在数理统计的基础上发展起来的。
3. 计量经济模型的应用:结构分析 经济预测 政策评价 检验与发展经济理论4. 回归的含义:回归分析是研究关于一个叫做被解释变量的变量对另一个或多个叫做解释变量的依赖关系。
其用意在于通过后者(在重复抽样中)的已知或被设定值去估计和(或)预测前者的(总体)均值。
回归分析构成计量经济学的方法论基础,主要内容包括:根据样本观察值对经济计量模型参数进行估计,求得回归方程;对回归方程、参数估计值进行显著性检验;利用回归方程进行分析、评价及预测。
回归分析的用途:通过自变量的值来估计应变量的值。
对独立性进行假设检验——根据经济理论建立适当的假设。
通过自变量的值对应变量进行预测。
上述多个目标的综合。
5. 回归关系与确定性关系:回归关系(统计关系):研究的是非确定现象随机变量间的关系。
确定性关系(函数关系):研究的是确定现象非随机变量间的关系。
计量经济学重点计量经济学复习资料一、名词解释1.广义计经济学:利用经济理论、统计学和数学定量研究经济现象的经济计量方法的统称,包括回归分析方法、投入产出分析方法、时间序列分析方法等。
2.狭义计经济学以揭示经济现象中的因果关系为目的,在数学上主要应用回归分析方法。
3.总体回归函数:指在给定Xi下Y分布的总体均值与Xi所形成的函数关系(或者说总体被解释变量的条件期望表示为解释变量的某种函数)。
4.样本回归函数:指从总体中抽出的关于Y, x的若干组值形成的样本所建立的回归函数。
6、随机的总体回归函数:含有随机千扰项的总体回归函数(是相对于条件期望形式而言的)。
5.线性回归模型:既指对变量是线性的,也指对参数β为线性的,即解释变量与参数β只以他们的I次方出现。
6.随机干扰项:即随机误差项,是一个随机变量,是针对总体回归函数而言的。
9、残差项:是一随机变量,是针对样本回归函数而言的。
7.条件期望:即条件均值,指X取特定值Xi时Y的期望值。
8.回归系数:回归模型中βo, β1等未知但却是固定的参数。
9.回归系教的估计量:指用β 0^ β1^等表示的用已知样本提供的信息所估计出来总体未知参数的结果。
10.最小二乘法:又称最小平方法,指根据使估计的剩余平方和最小的原则确定样本回归函数的方法。
11.最大似然法:又称最大或然法,指用生产该样本概率最大的原则去确定样本回归函数的方法。
12.估计的标准差:度量一个变量变化大小的测量值。
13.总离差平方和:用TSS表示,用以度量被解释变量的总变动。
14.回归平方和:用ESS表示:度量由解释变量变化引起的被解释变量的变化部分。
15.残差平方和:用RSS表示:度量实际值与拟合值之间的差异,是由除解释变量以外的其他因素引起的被解释变量变化的部分。
16.协方差:用Cov(X, Y)表示,度量XY两个变量关联程度的统计量。
17.拟合优度检验:检验模型对样本观测值的拟合程度,用R2表示,该值越接近1,模型对样木观测值拟合得越好。
1、经济变量:用来描述经济因素数量水平的指标。
2、解释变童:用来解释作为研究对象的变量(即因变量)为什么变动、如何变动的变量。
它对因变量的变额为发热所引5动做出解释。
3、被解释变量:是作为研究对象的变量。
它的变动是由•解释变量做出廉释的4、控制变量:在计量经济模型中人为设置的反映政黃要求、决策者意愿、经济系统运行条件和状态等方面的变量。
5、计量经济模型:为了研究分析某个系统中经济变量之问的数量关系而采用的随机代数模型。
6、相关关系:如果一个变量y的取值受另一个变量或另一组变量的彩响.但并不由它们惟一确定,则y与这个变量或这组变量之问的关系就是相关关系。
7、最小二乘法:用使估计的剩余平方和最小的原则确定样本回归函数的方法。
8、拟合优度:样本回归直线与样本观测数据之问的拟合程度。
(9、残差:样本回归方程的拟合值与观測值的误差。
10、显著性检验:利用样本结果,来证实一个虚拟假设的真伪的一种检豔程序。
11、偏相关系数:在Y. X|. 1三个变量中,当儿既定时,表示Y与X2之问相关关系的指标。
12、异方差性:在线性回归模型中,如果随机误差项的方差不是常数,即对不同的解释变量观测值彼此不同,则称葩机项U1具有异方差性。
13、序列相关性:对于模型Xi = % + 妙九 +色乜+•••+%%+“i = 12 …屮菠机误差项互相独立的基本假设表现为C"(冷"” =0 /> j,i,j = \2…』(I分)如果出现Cov(比,“ J) H 0 i H人i J = 12…屮即对于不同的样本点•随机误差项之问不再是完全互相独立,而是存在某种相关性,则认为出现了序列相关性。
14、自回归模型:15、广乂最小二乘法:是最有普遍意义的最小二乘法,普通最小二乘法和加权最小二乘法是它的特例。
16、相关系数:度量变量之问相关程度的一个系数,一般用P表示。
17、多重共线性:解释变量之问存在完全或不完全的线性关系。
计量经济学重点引言计量经济学是经济学的一个重要分支,旨在通过使用统计学和数学方法来对经济理论进行实证分析。
它的核心目标是通过利用经济数据和数学经济理论的相互关系,解释经济现象,并提供经济政策的科学依据。
本文将介绍计量经济学的一些重要概念和方法,用以帮助读者更好地理解和应用计量经济学。
一、回归分析回归分析是计量经济学中最基本的统计方法之一。
它用于研究因果关系和预测变量之间的关系。
回归分析的核心思想是找到一个最佳的函数来解释因变量和自变量之间的关系。
在回归分析中,因变量是我们希望解释或预测的变量,而自变量是我们认为与因变量相关的变量。
通过建立数学模型并对数据进行估计,我们可以得到最佳的函数来解释因变量和自变量之间的关系。
常用的回归模型包括线性回归模型、多元回归模型和非线性回归模型等。
二、时间序列分析时间序列分析是计量经济学中研究时间序列数据的一种方法。
时间序列数据是按照时间顺序排列的观测值序列,如股票价格、GDP增长率等。
时间序列分析的目标是建立一个统计模型来描述数据的变化趋势和周期性,并进行预测。
时间序列分析涉及到许多重要的概念,包括平稳性、滞后项、自相关性和滑动平均等。
通过对时间序列数据的建模和分析,可以揭示数据背后的规律和趋势,为经济决策提供重要的参考。
三、计量经济学中的假设检验在计量经济学中,假设检验是一个非常重要的工具,用于验证经济模型的有效性和推断。
假设检验的核心思想是根据样本数据对经济理论中的假设进行检验。
假设检验通常包括一个原假设和一个备择假设。
原假设是对经济理论的一个特定假设进行的陈述,备择假设是对原假设的一个否定陈述。
通过计算统计量和确定显著性水平,可以对原假设做出决策,判断是否拒绝原假设。
一些常见的假设检验方法包括t检验、F检验和卡方检验等。
通过假设检验,我们可以评估经济理论的有效性,并对经济政策和决策提供科学依据。
四、面板数据分析面板数据分析是计量经济学中应用最广泛的方法之一,用于处理同时包含多个数据点和时间点的数据集。
1.普通最小二乘法(Ordinary Least Squares,OLS):已知一组样本观测值{}n i Y X i i ,2,1:),(⋯=,普通最小二乘法要求样本回归函数尽可以好地拟合这组值,即样本回归线上的点∧i Y 与真实观测点Yt 的“总体误差”尽可能地小。
普通最小二乘法给出的判断标准是:被解释变量的估计值与实际观测值之差的平方和最小。
2.广义最小二乘法GLS :加权最小二乘法具有比普通最小二乘法更普遍的意义,或者说普通最小二乘法只是加权最小二乘法中权恒取1时的一种特殊情况。
从此意义看,加权最小二乘法也称为广义最小二乘法。
3.加权最小二乘法WLS :加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数。
4.工具变量法IV :工具变量法是克服解释变量与随机干扰项相关影响的一种参数估计方法。
5.两阶段最小二乘法2SLS, Two Stage Least Squares :两阶段最小二乘法是一种既适用于恰好识别的结构方程,以适用于过度识别的结构方程的单方程估计方法。
6.间接最小二乘法ILS :间接最小二乘法是先对关于内生解释变量的简化式方程采用普通小最二乘法估计简化式参数,得到简化式参数估计量,然后过通参数关系体系,计算得到结构式参数的估计量的一种方法。
7.异方差性Heteroskedasticity :对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差性。
8.序列相关性Serial Correlation :多元线性回归模型的基本假设之一是模型的随机干扰项相互独立或不相关。
如果模型的随机干扰项违背了相互独立的基本假设,称为存在序列相关性。
9.多重共线性Multicollinearity :对于模型i k i i X X X Y μββββ++⋯+++=i k 22110i ,其基本假设之一是解释变量X 1,X 2,…,Xk 是相互独立的。
计量经济学第一章use 打开数据 describe 查看数据集情况 summary 描述统计tabstat +[stats] 计算描述性统计量(指定)table+[contents] 类别变量+连续变量列联表 table/ tabulate 类别变量频次表 histogram 直方图第二章一元回归线性模型:基本思想∑∑∑∑--==2222Xn X Y X n Y X xy x b ii i iiiX b Y b 21-=第三章 第四章 一元、多元线性回归模型:假设检验 随机扰动项、参数的方差、标准误计算sort 排序 order 排序drop 去除记录 keep 保留记录generate 生产新变量 replace 给变量赋新值 rename 给变量重命名统计检验1模型的拟合优度检验:R2判定系数(可决系数)调整的可决系数:范围在0和1之间,越接近1,说明模型具有较高的拟合优度2方程的显著性检验:F 统计量,prob (F )F >F(k-1,n-k),拒绝原假设H0,即显著。
F<F(k-1,n-k),则暂时不拒绝,不显著。
显著性概率为0,小于给定显著性水平(0.05),表明模型对总体拟合显著 3变量的显著性检验:T 统计量 (服从n-2,n-k ),p 值Β2一般为0,T>2.306为显著,T<2.306为不显著(5%水平) 线性回归模型的基本假设:假设1:模型具有线性性(针对模型)。
Y 是参数βi 的线性组合,不一定要求是变量X 的线性组合。
假设2 :解释变量X 与u 不相关(针对扰动项)。
数学表达:cov(Xi,ui)=0通常说法:X 具有外生性 假设3:给定X ,扰动项的期望或均值为零(针对扰动项)。
数学表达:,i=1,2, …,n 假设4:同方差假定(针对扰动项)。
数学表达:Var (ui) = σμ2 = Var (Yi) i=1,2, …,n. 假设5:无自相关(针对扰动项)。
计量经济学重点第一章经济计量学的特征及研究范围1、经济计量学的定义P11经济计量学是利用经济理论、数学、统计推断等工具对经济现象进行分析的一门社会科学;2经济计量学运用数理统计学分析经济数据,对构建于数理经济学基础之上的模型进行实证分析,并得出数值结果;2、学习计量经济学的目的计量经济学与其它学科的区别P1-P21计量经济学与经济理论经济理论:提出的命题和假说,多以定性描述为主计量经济学:依据观测或试验,对大多数经济理论给出经验解释,进行数值估计2计量经济学与数理经济学数理经济学:主要是用数学形式或方程或模型描述经济理论计量经济学:采用数理经济学家提出的数学模型,把这些数学模型转换成可以用于经验验证的形式3计量经济学与经济统计学经济统计学:涉及经济数据的收集、处理、绘图、制表计量经济学:运用数据验证结论3、进行经济计量的分析步骤P2-P31建立一个理论假说2收集数据3设定数学模型4设立统计或经济计量模型5估计经济计量模型参数6核查模型的适用性:模型设定检验7检验源自模型的假设8利用模型进行预测4、用于实证分析的三类数据P3-P41时间序列数据:按时间跨度收集到的定性数据、定量数据;2截面数据:一个或多个变量在某一时点上的数据集合;3合并数据:包括时间序列数据和截面数据;一类特殊的合并数据—面板数据纵向数据、微观面板数据:同一个横截面单位的跨期调查数据第二章线性回归的基本思想:双变量模型1、回归分析P18用于研究一个变量称为被解释变量或应变量与另一个或多个变量称为解释变量或自变量之间的关系2、回归分析的目的P18-P191根据自变量的取值,估计应变量的均值;2检验建立在经济理论基础上的假设;3根据样本外自变量的取值,预测应变量的均值;4可同时进行上述各项分析;3、总体回归函数PRFP19-P221概念:反映了被解释变量的均值同一个或多个解释变量之间的关系2表达式:①确定/非随机总体回归函数:EY|Xi =B1+B2XiB1:截距;B2:斜率从总体上表明了单个Y同解释变量和随机干扰项之间的关系②随机/统计总体回归函数:Yi =B1+B2Xi+μiμi:随机扰动项随机误差项、噪声B1+B2Xi:系统/确定性部分μi:非系统/随机部分4、随机误差项P221定义:代表了与被解释变量Y有关但未被纳入模型变量的影响;每一个随机误差项对于Y的影响是非常小的,且是随机的;随机误差项的均值为02性质①误差项代表了未纳入模型变量的影响;②反映人类行为的内在随机性;③代表了度量误差;④反映了模型的次要因素,使得模型描述尽可能简单;5、样本回归函数P22-P251概念:是总体回归函数的近似2表达式①确定/非随机样本回归函数:i =b1+b2Xib 1:截距;b2:斜率②随机/统计样本回归函数:Yi =b1+b2Xi+eiei :残差项残差,ei= Yi-iB1+B2Xi:系统/确定性部分μ:非系统/随机部分6、条件期望与非条件期望1EY|Xi条件期望:在解释变量X给定条件下Y的条件期望,可以通过X给定条件下的条件概率分布得到;2非条件期望:在不考虑其他随机变量取值情况时,某个随机变量的期望值;它可以通过该随机变量的非条件分布或边缘分布得到;6、线性回归模型回归参数为线性B的模型7、回归系数/回归参数线性回归模型中的B参数8、回归系数的估计量bs说明了如何通过样本数据来估计回归系数Bs,计算出的回归系数的值称为样本回归估计值9、随机总体回归函数与随机样本回归函数的关系1随机样本回归函数:从所抽取样本的角度说明了被解释变量Yi 同解释变量Xi及残差ei之间的关系;2随机总体回归函数:从总体的角度说明了被解释变量Yi 同解释变量Xi及随机误差项μ之间的关系;10、关于线性回归的两种解释P25-P261变量线性:应变量的条件均值是自变量的线性函数此解释下的非线性回归:EY= B1+B2Xi2;EY= B1+B2×1/Xi2参数线性:应变量的条件均值是参数B的线性函数此解释下的非线性回归:EY= B1+B22Xi线性回归在教材中指的是参数线性的回归11、多元线性回归的表达式P261确定/非随机总体回归函数:EX=B1+B2X2i+B3X3i+B4X4i2随机/统计总体回归函数:Yi = B1+B2X2i+B3X3i+B4X4i+μi12、最小二乘法OLS法P26-P281最小二乘以残差被解释变量的实际值同拟合值之间的差平方和最小的原则对回归模型中的系数进行估计的方法;1表达式2重要性质①用OLS法得出的样本回归线经过样本均值点:;②残差的均值总为0;③对残值与解释变量的积求和,其值为0,即这两个变量不相关:④对残差与i 估计的Yi的积求和,其值为0,即第三章双变量模型:假设检验1、古典线性回归模型的假设P41-P441回归模型是参数线性的,但不一定是变量线性的:Yi =B1+B2Xi+μi2解释变量X与扰动误差项μ不相关3给定Xi ,扰动项的期望或均值为0:Eμ| Xi=04μi 的方差为常数,或同方差:varμi=σ2每个Y值以相同的方差分布在其均值周围,非这种情况为异方差5无自相关假定:两个误差项之间不相关,covμi ,μj=06回归模型是正确假定的:实证分析的模型不存在设定偏差或设定误差2、OLS估计量运用最小二乘法计算出的总体回归参数的估计量3、普通最小二乘估计量的方差与标准误P44-P461的方差与标准误①方差:②标准误:2的方差与标准误①方差:②标准差:3的计算公式n-2为自由度:独立观察值的个数4:回归标准误,常用于度量估计回归线的拟合优度,值越小,Y的回归值越接近根据回归模型得到的估计值4、OLS估计量的性质P461b1和b2是线性估计量:它们是随机变量Y的线性函数2b1和b2是无偏估计量:Eb1=B1,Eb2=B23Eσ^2=σ^2:误差方差的OLS估计量是无偏的4b 1和b 2是有效估计量:varb 1小于B 1的任意一个线性无偏估计量的方差,varb 2小于B 2的任意一个线性无偏估计量的方差 5、OLS 估计量的抽样分布或概率分布P47-P481新加的假设:在总体回归函数Yi=B 1+B 2X i +μi 中,误差项μi 服从均值为0,方差为σ^2的正态分布:μi ~N0,σ^2 2OLS 估计量服从的分布情况:b 1~NB 1,σ2b1 b 2~NB 2,σ2b26、假设检验P48-P53 1使用公式近似2方法①置信区间法②显着性检验法:对统计假设的检验过程 3几个相关检验①t 检验法:基于t 分布的统计假设检验过程 ②双边检验:备择假设是双边假设的检验 ③单边检验:备择假设是单边假设的检验 7、判定系数r 2P53-P56 1重要公式:TSS=ESS+RSS①总平方和TSS=:真实Y 值围绕其均值的总变异;②解释平方和ESS=:估计的Y值围绕其均值=的变异,也称为回归平方和由解释变量解释的部分③残差平方和RSS=:Y变异未被解释的部分2r2判定系数的定义:度量回归线的拟合程度回归模型对Y变异的解释比例/百分比3r2的性质①非负性②0≤r2≤14r2的计算公式5r的计算公式8、同方差性方差相同9、异方差性方差不同10、BLUE最佳线性无偏估计量,即该估计量是无偏估计量,且在所有的无偏估计量中方差最小11、统计显着拒绝零假设的简称第四章多元回归:估计与假设检验1、三变量线性回归模型EYi =B1+B2Xt+ B3X3tY i =B1+B2X2t+ B3X3t+μi2、偏回归系数B2,B3:1B2:在X3保持不变的情况下,X2单位变动引起Y均值EY的变动量2B3:在X2保持不变的情况下,X3单位变动引起Y均值EY的变动量3、多元线性回归模型的若干假定P73-P74 1回归模型是参数线性的,并且是正确设定的2X2,X3与扰动误差项μ不相关①X2,X3非随机:自动满足②X2,X3随机:必须独立同分布于误差项μ3误差项的期望或均值为0:Eμi=04同方差假定:varμi=σ25误差项μi ,μi无自相关:两个误差项之间不相关,covμi,μji≠j6解释变量X2和X3之间不存在完全共线性,即两个解释变量之间无严格的线性关系X2不能表示为另一变量X3的线性函数7随机误差μ服从均值为0,同方差为σ^2的正态分布:μi~N0,σ2 4、多重共线性问题1完全共线性:解释变量之间存在的精确的线性关系2完全多重共线性:解释变量之间存在着多个精确的线性关系5、多元回归函数的估计P74-P756、OLS估计量的方差与标准误P75-P761b1的方差与标准误2b1的方差与标准误3b3的方差与标准误7、多元判定系数P76-P778、多元回归的假设检验P78 方法类似于第三章9、检验联合假设P80-P811联合假设:H0:B2=B3=0H:R2=0多元回归的总体显着性检验2三变量回归模型的方差分析表2F分布公式10、F与R2之间的重要关系P82-P83 1关系式2R2形式的方差分析表11、设定误差P84会导致模型中遗漏相关变量12、校正判定系数P84-P851作用衡量了解释变量能解释的离差占被解释变量总离差的比例2公式3性质①如果k>1,则≤R2,即随着模型中解释变量个数的增加,校正判定系数越来越小于非校正判定系数②虽然未校正判定系数R2总为正,但校正判定系数可能为负13、受限最小二乘法P86-P871受限模型:B2=B3=02非受限模型:包含了所有相关变量3受限最小二乘法:对受限模型用OLS估计参数4非受限最小二乘法:对非受限模型用OLS估计参数5判定对模型施加限制是否有效的F分布公式14、显着性检验1单个多元回归系数的显着性检验①提出零假设和备择假设;②选择适当的显着性水平;③在零假设为真的情况下,计算t统计量;④将t统计量的绝对值|t|同相应自由度和显着性水平下的临界值相比较;⑤如果t统计量大于临界值,则拒绝零假设;该步骤中务必要使用合适的单边或双边检验;2所有偏斜率系数的显着性检验①零假设:H0:B2=B3=...=Bk=0,即所有的偏回归系数均为0;②备择假设:至少一个偏回归系数不为0;③运用方差分析和F检验;④如果F统计量的值大于相应显着性水平下的临界值,拒绝零假设,否则接受;⑤3在1和2中可以不事先选择好显着性水平,只需得到相应统计量的p值,如果p 值足够小,我们就可以拒绝零假设;第五章回归模型的函数形式1、不同的函数形式P121模型形式斜率强性线性双对数对数—线性线性—对数倒数逆对数2、多元对数线性回归模型P104-P1073、线性趋势模型P1104、多项式回归模型P116-P1175、过原点的回归P1186、标准化变量的回归P120第六章虚拟变量回归模型1、虚拟变量P133-P134因变量受到一些定性变量的影响,这类定性变量称为虚拟变量,用D表示虚拟变量,虚拟变量的取值通常为0和12、虚拟变量陷阱P136引入的虚拟变量个数应该比研究的类别少一个,否则就会造成完全多重共线,即通常说的虚拟变量陷阱3、虚拟变量回归模型的类型包含一个定量变量、一个定性变量的回归模型1只影响截距加法模型2只影响斜率乘法模型3同时影响截距与斜率混合模型4、交互效应P142:交互作用虚拟变量5、分类变量和定性变量这类变量的取值不是一般的数据数值变量或定量变量,它们通常代表所研究的对象是否具有的某种特征;6、方差分析模型ANOVA解释变量仅包含定型变量或虚拟变量的回归模型;7、协方差分析模型ANOCVA回归模型中的解释变量有些是线性的,有些是定量的;8、差别截距虚拟变量包含此变量的模型能够分辨被解释变量的均值在不同类别之间是否相同; 9、差别斜率虚拟变量包含此变量的模型能够分辨不同类别之间被解释变量均值变化率的变化范围第七章模型选择:标准与检验1、好的模型具有的性质P164-P1651简约性:模型应尽可能简单;2可识别性:每个参数只有一个估计值;3拟合优度:用模型中所包含的解释变量尽可能地解释应变量的变化;4理论一致性:构建模型时,必须有一定的理论基础;5预测能力:选择理论预测与实践吻合的模型;2、产生设定误差的原因1研究者对所研究问题的相关理论了解不深2研究者没有关注本领域前期的研究成果3研究者在研究中缺乏相关数据4数据测量时的误差3、设定误差的类型P1651遗漏相关变量:“过低拟合”模型P165-P168实际模型:估计模型:后果:①如果遗漏变量X3与模型中的变量X2相关,则a1和a2是有偏的;也就是说,其均值或期望值与真实值不一致;②a1和a2也是不一致的,即无论样本容量有多大,偏差也不会消失;③如果X2和X3不相关,则b32为零,即a2是无偏的,同时也是一致的;④根据两变量模型得到的误差方差是真实误差方差σ2的有偏估计量;⑤此外,通常估计的a2的方差是真实估计量方差的有偏估计量;即使等于零,这一方差仍然是有偏的;⑥通常的置信区间和假设检验过程不再可靠;置信区间将会变宽,因此可能会“更频繁地”接受零假设:系数的真实值为零;2包括不相关变量:“过度拟合”模型P168-169正确模型:错误模型:后果:①过度拟合模型的估计量是无偏的也是一致的;②从过度拟合方程得到的σ2的估计量是正确的;③建立在t检验和F检验基础上的标准的置信区间和假设检验仍然是有效的;④从过度拟合模型中估计的a是无效的——其方差比真实模型中估计的b的方差大;因此,建立在a的标准误上的置信区间比建立在b的标准误上的置信区间宽,尽管前者的假设检验是有效的;总之,从过度拟合模型中得到的OLS估计量是线性无偏估计量,但不是最优先性无偏估计量;3不正确的函数形式P170-171如果选了错误的函数形式,则估计的系数可能是真实系数的有偏估计量;4度量误差①应变量中度量误差对回归结果的影响i. OLS估计量是无偏的;ii. OLS估计量的方差也是无偏的;iii. 估计量的估计方差比没有度量误差时的大,因为应变量中的误差加入到了误差项中;②解释变量的度量误差对回归结果的影响i. OLS估计量是有偏的;ii. OLS估计量也是不一致的;③解决方法:如果解释变量中存在度量误差,建议使用工具变量或替代变量;4、设定误差的诊断1诊断非相关变量P172-P1742对遗漏变量和不正确函数形式的检验P174-P175①判定系数R2和校正后的R2;②估计的t值;③与先验预期相比,估计系数的符号;3在线性和对数线性模型之间选择:MWD检验P175-P176:线性模型:Y是X的线性函数①设定如下假设;HH:对数线性模型:lnY是X或lnX的线性函数1②估计线性模型,得到Y的估计值③估计线性对数模型,得到lnY的估计值④求⑤做Y对X和的回归,如果根据t检验的系数是统计显着的,则拒绝H0⑥求⑦做lnY对X或lnX和的回归,如果的系数是统计显着的,则拒绝H14回归误差设定检验:RESETP177-P178①根据模型估计出Y值;②把的高次幂,,等纳入模型以获取残差和之间的系统关系;由于上图表明残差和估计的Y值之间可能存在曲线关系,因而考虑如下模型③令从以上模型中得到的为,从前一个方程得到的为,然后利用如下F检验判别从以上方程中增加的是否是统计显着的;④如果在所选的显着水平下计算的F值是统计显着的,则认为原始模型是错误设定的;第八章多重共线性:解释变量相关会有什么后果1、完全多重共线性P183-P185回归模型的某个解释变量可以写成其他解释变量的线性组合;设X2可以写成其他某些解释变量的线性组合,即:X 2=a3X3+a4X4…+akXk至少有一个ai≠0,i= 2,3,…k称存在完全多重共线性2、高度多重共线性P185-P187X2与其他解释变量高度共线性,即可以近似写成其他解释变量的线性组合X 2=a3X3+a4X4…+akXk+i至少有一个ai ≠0,i= 2, 3,…k, vi是随机误差项;3、产生多重共线的原因1时间序列解释变量受同一因素影响经济发展、政治事件、偶然事件、时间趋势经济变量的共同趋势2模型设立:解释变量中含有当期和滞后变量4、多重共线性的理论后果P187-P188OLS估计量仍然是最优无偏估计量1在近似共线性的情形下,OLS估计量仍然是无偏的;2近似共线性并未破坏OLS估计量的最小方差性;3即使在总体回归方程中变量X之间不是线性相关的,但在某个样本中,X变量之间可能线性相关;5、多重共线性的实际后果P188-P1891OLS估计量的方差和标准误较大;2置信区间变宽;3t值不显着;4R2值较高;5OLS估计量及其标准误对数据的微小变化非常敏感6回归系数符号有误;7难以评估各个解释变量对回归平方和ESS或者R2的贡献6、多重共线性的诊断P189-P1921观察回归结果R2较高,F很大,但t值显着的不多;多重共线性的经典特征R2较高,F检验拒绝零假设,但各变量的t检验表明,没有或少有变量系数是统计显着的;2简单相关系数法解释变量两两高度相关;变量相关系数比如超过,则可能存在较为严重的共线性;这一标准并不总是可靠,相关系数较低时,也有可能存在共线性3检查偏相关系数不一定可行4判定系数法辅助回归某个解释变量对其余的解释变量进行回归如果判定系数很大,F检验显着,即X与其他解释变量存在多重共线i5方差膨胀因子7、多重共线性的补救P195-P1981从模型中删除引起共线性的变量①找出引起多重共线性的解释变量,将它排除出去最为简单的克服多重共线性问题的方法;②逐步回归法i. 逐步引入如果拟合优度变化显着—新引入的变量是一个独立解释变量;选择解释变量的原则:a. 调整的R2增加,每个∣t∣增加,则保留引入变量;b. 调整的R2下降,每个∣t∣变化不大,则删除引入变量;ii. 逐步剔除①排除变量时应该注意:i. 由实际经济分析确定变量的相对重要性,删除不太重要的变量;ii. 如果删除变量不当,会导致模型设定误差;2获取额外的数据或新的样本3重新考虑模型4先验信息5变量变换将原模型变换为差分模型可有效消除存在于原模型中的多重共线性一般,增量之间的线性关系远比总量之间的线性关系弱得多; 第九章异方差:如果误差方差不是常数会有什么后果1、异方差的定义随机误差项ui 的方差随着解释变量Xi的变化而变化,即:2、异方差的性质P205-P208OLS估计仍是线性无偏,但不具最小方差1线性性2无偏性3方差式1不具有最小方差,式2具有最小方差3、异方差性的后果P209-P210经典模型假定下,OLS估计量是最优线性无偏估计量BLUE;去掉同方差假定:1OLS估计量仍是线性的;2OLS估计量仍是无偏的;3OLS估计量不再具有最小方差性,即不再是最优有效估计量;4OLS估计量的方差通常是有偏的;5偏差的产生是由于,即不再是真实σ2的无偏估计量;6建立在t分布和F分布之上的置信区间和假设检验是不可靠的,如果沿用传统的检验方法,可能得出错误的结论;4、异方差的检验1图形检验P211-P212e2对一个或多个解释变量或Y的拟合值作图; 2帕克检验Park TestP212-P214假定误差方差与解释变量相关形式:步骤:①做OLS估计求平方,取对数②对ei③做辅助回归④检验零假设:B=023格莱泽检验Glejser TestP214假定误差方差与解释变量相关形式:步骤:①做OLS估计②对e求绝对值i③做辅助回归方程=0④检验零假设:B24怀特检验White TestP215-P216和交叉乘积呈线性关系假定误差方差与X、X2步骤:①OLS估计得残差②做辅助回归③检验统计量5、异方差的修正1加权最小二乘法WLSWeighted Least SquaresP217-P222①方差已知原模型:加权后的模型:误差项的方差为:1加权的权数:②方差未知成比例:i. 误差方差与Xi模型变换:ii. 误差方差与Xi2成比例:模型变换:2怀特异方差校正的标准误P222-P223①如果存在异方差,则对于通过OLS得到的估计量不能进行t检验和F检验;②怀特估计方法③大样本情形下回归标准差和回归系数的一致估计量,可以进行t检验和F检验;第十章自相关:如果误差项相关会有什么结果1、自相关的定义P233按时间或空间顺序排列的观察值之间存在的相关关系;2、自相关的性质P233-P2341若古典线性回归模型中误差项ui不存在自相关Covui,uj=Eui,uj=0,i≠j2若误差项之间存在着依赖关系—ui存在自相关Covui,uj=Eui,uj≠0,i≠j3、产生自相关的原因P235-P2361惯性2设定偏误①模型中遗漏了重要变量;②模型选择了错误的函数形式;i. 从不正确的模型中得到的残差会呈现自相关;ii. 检验是否由于模型设定错误而导致残差自相关的方法:3蛛网现象4数据的加工①在用到季度数据的时间序列回归中,这些数据通常来自于每月数据;这种数据加工方式减弱了每月数据的波动而引进数据的匀滑性;②用季度数据描绘的图形要比用月度数据看来匀滑得多;这种匀滑性本身可能使扰动项中出现自相关;③内插法或外推法:用这些方法加工得到的数据都会给数据带来原始数据没有的系统性,这种系统性可能会造成误差自相关;4、自相关的后果P236-P2371OLS估计得到的仍为线性、无偏估计;2OLS估计不再具有有效性;3OLS估计量的方差有偏:低估了估计量的标准差;4通常所用的t检验和F检验是不可靠的;5计算得到的误差方差是真实σ2的无偏估计量,并且很有可能低估了真实的σ2;6通常计算的R2不能测度真实的R27通常计算的预测方差和标准误也是无效的5、自相关的诊断1图形法—时序图P237-P239①误差u并不频繁地改变符号,而是几个正之后跟着几个负,几个负之后跟着t几个正,则呈正自相关;②扰动项的估计值呈循环型,而是相继若干个正的以后跟着几个负的,表明存在正自相关;③扰动项的估计值呈锯齿型一个正接一个负,随时间逐次改变符号,表明存在负自相关;2检验P239-P242①定义值d值近似1 =-1完全负相关d=42 =0无自相关d=23 =1完全正相关d=0②DW检验的判断准则6、自相关的修正ρ的估计主要方法1ρ=1:一阶差分方法P244假定误差项之间完全正相关 Y t = α+βX t +u tu t = u t-1+tY t - Y t-1= βX t -X t-1+t2从DW 统计量中估计ρP244-P245 3从OLS 残差e t 中估计Cochrane-OrcuttP245-P246①e t = e t-1+t②利用OLS 残差,得的估计量 ③迭代,得的收敛值。
1.截面数据,时间序列,面板数据定义。
2.截面数据:同一时间(时期或时点)某个指标在不同空间的观测数据。
时间序列数据:把反映某一总体特征的同一指标的数据,按照一定的时间顺序和时间间隔(如月度.季度.年度)排列起来,这样的统计数据称为时间序列数据。
时间序列数据可以是时期数据,也可以是时点数据。
面板数据:指时间序列数据和截面数据相结合的数据。
如在具名手指调查中收集的对各个固定调查户在不同时期的调查数据。
3.有限分布滞后模型定义被解释变量受解释变量的影响分布在解释变量不同时期的滞后值上,即模型形如具有这种滞后分布结构的模型称为分布滞后模型,其中 s 为滞后长度。
根据滞后长度 s取为有限和无限,模型分别称为有限分布滞后模型和无限分布滞后模型。
4.设定误差定义考虑所建模型是否遗漏了重要的变量?是否包含了多余的变量?所选模型的函数形式是否正确?随机扰动项的设定是否合理?变量的数据收集是否有误差?所有这些,计量经济学中被统称为设定误差。
5.时间序列平稳性阶数判定所谓时间序列的平稳性,是指时间序列的统计规律不会随着时间的推移而发生变化。
6.t,F检验统计量表达式ESS(-1)~F(-1,)RSS(-)kF k n-kn k=7.OLS参数估计的统计学性质(1)线性特征;(2)无偏特征;(3)最小方差特性*222^^22ˆˆ~(2)ˆˆ()()t t nSE SEβββββ-==-二 名词解释:1.最小二乘法:又称最小平方法,指根据使估计的剩余平方和最小的原则确定样本回归函数的方法。
2. 多元线性回归模型:在现实经济活动中往往存在一个变量受到其他多个变量的影响的现象,表现为在线性回归模型中有多个解释变量,这样的模型成为多元线性回归模型,多元指多个变量3. 偏回归系数:在多元回归模型中,每一个解释变量前的参数即为偏回归系数,它测度了当其他解释变量保持不变时,该变量增加1个单位对解释变量带来的平均影响程度。
4、调整的多元可决系数 :又称多元判定系数,是一个用于描述伴随模型中解释变量的增加和多个解释变量对被解释变量的联合影响程度的量。
1.经济变量:经济变量是用来描述经济因素数量水平的指标。
(3分)2.解释变量:是用来解释作为研究对象的变量(即因变量)为什么变动、如何变动的变量。
(2分)它对因变量的变动做出解释,表现为方程所描述的因果关系中的“因”。
(1分)3.被解释变量:是作为研究对象的变量。
(1分)它的变动是由解释变量做出解释的,表现为方程所描述的因果关系的果。
(2分)4.内生变量:是由模型系统内部因素所决定的变量,(2分)表现为具有一定概率分布的随机变量,是模型求解的结果。
(1分)5.外生变量:是由模型系统之外的因素决定的变量,表现为非随机变量。
(2分)它影响模型中的内生变量,其数值在模型求解之前就已经确定。
(1分)6.滞后变量:是滞后内生变量和滞后外生变量的合称,(1分)前期的内生变量称为滞后内生变量;(1分)前期的外生变量称为滞后外生变量。
(1分)7.前定变量:通常将外生变量和滞后变量合称为前定变量,(1分)即是在模型求解以前已经确定或需要确定的变量。
(2分)8.控制变量:在计量经济模型中人为设置的反映政策要求、决策者意愿、经济系统运行条件和状态等方面的变量,(2分)它一般属于外生变量。
(1分)9.计量经济模型:为了研究分析某个系统中经济变量之间的数量关系而采用的随机代数模型,(2分)是以数学形式对客观经济现象所作的描述和概括。
(1分)10.函数关系:如果一个变量y的取值可以通过另一个变量或另一组变量以某种形式惟一地、精确地确定,则y与这个变量或这组变量之间的关系就是函数关系。
(3分)11.相关关系:如果一个变量y的取值受另一个变量或另一组变量的影响,但并不由它们惟一确定,则y与这个变量或这组变量之间的关系就是相关关系。
(3分)12.最小二乘法:用使估计的剩余平方和最小的原则确定样本回归函数的方法,称为最小二乘法。
(3分)13.高斯-马尔可夫定理:在古典假定条件下,OLS估计量是模型参数的最佳线性无偏估计量,这一结论即是高斯-马尔可夫定理。
一、名词解释53分=15分斜体表明仅供参考计量经济学:以经济理论和经济数据的事实为依据,运用数学和统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科;最小二乘法:指在满足古典假设的条件下,用使估计的剩余平方和最小的原则确定样本回归函数的方法,简称OLS随机扰动项:总体回归函数中,各个Y值与条件期望的Y值的偏差,又称随机误差项;是代表那些对Y有影响但又未纳入模型的诸多因素的影响;总体回归函数:在给定解释变量Xi 条件下,总体被解释变量Yi的期望轨迹,函数式表示为EYi∣Xi=fXi=β0+β1Xi样本回归函数:在总体中抽取若干个样本构成新的总体,然后在新的总体下,给定解释变量Xi,被解释变量Yi 的期望轨迹,函数式表示为EYi∣Xi=Yi^= β^+β1^Xi系数显着性检验:t检验对回归系数对应的解释变量是否对被解释变量有显着影响的统计学检验方法方程显着性检验:F检验对模型的被解释变量与所有解释变量之间的线性关系在整体上是否显着的统计学检验方法高斯-马尔可夫定理:在古典假设的条件下,OLS估计量是总体参数的最佳线性无偏估计量,即BULE;拟合优度:为说明多元线性回归模型中对观测值的拟合情况,可以考察在Y的总变差中能由解释变量所解释的那部分变差的比重,即回归平方和与总体平方和的比值,R2=ESS/TSS=1-RSS/TSS.调整的可决系数:是一个用于描述多个解释变量对被解释变量的联合影响程度的统计量,相对可决系数而言,克服了随解释变量的增加而变大的缺陷;表达式为R—2=1-n-1RSS/n-kTSS多重共线性:指解释变量之间存在的完全或近似的线性关系异方差:模型中随机误差项不再满足经典假设的同方差假定,其方差随观测个体的变化而变化,即Dεi =σi2加权最小二乘法:在拟合存在异方差的模型中,对不同的σi 2区别对待重小轻大原则,构造权数Wi=1/σi2,根据最小二乘原理,使加权的残差平方和最小,从而估计参数,这种求解参数估计式的方法为加权最小二乘法;自相关:又称序列相关,是指在总体回归模型的随机误差项ui 之间存在相关关系就,即covui,uj≠0.i≠j判断题101分=10分1、随机误差项ui 与残差项ei是一回事; 乂2、总体回归函数给出了对应于每一个自变量的因变量的值; 乂3、线性回归模型意味着因变量是自变量的线性函数;乂4、在线性回归模型中,解释变量是原因,被解释变量是结果; √5、在实际中,一元回归没什么用,因为因变量的行为不可能仅由一个解释变量来解释;乂6、尽管有完全的多重共线性,OLS估计量仍然是最优线性无偏估计量;乂7、在高度多重共线的情形中,要评价一个或多个偏回归系数的个别显着性是不可能的;乂8、如果有某一辅助回归显示出高的2iR值,则高度共线性的存在是肯定无疑的了; √9、变量的两两高度相关并不表示高度多重共线性; 乂10、如果分析的目的仅仅是预测,则多重共线性是无害的; √11、在多元回归中,根据通常的t检验,每个参数都是统计上不显着的,你就不会得到一个高的2R值;乂12、变量不存在两两高度相关表示不存在高度多重共线性; 乂13、当异方差出现时,最小二乘估计是有偏的和不具有最小方差特性; 乂14、当异方差出现时,常用的t检验和F检验失效; √15、在异方差情况下,通常OLS估计一定高估了估计量的标准差; 乂16、如果OLS回归的残差表现出系统性,则说明数据中有异方差性; √17、如果回归模型遗漏一个重要的变量,则OLS残差必定表现出明显的趋势; √18、在异方差情况下,通常预测失效; √19、当模型存在高阶自相关时,可用D-W 法进行自相关检验; 乂20、当模型的解释变量包括内生变量的滞后变量时,D-W 检验就不适用了; √21、DW 值在0和4之间,数值越小说明正相关程度越大,数值越大说明负相关程度越大;√22、假设模型存在一阶自相关,其他条件均满足,则仍用OLS 法估计未知参数,得到的估计量是无偏的,不再是有效的,显着性检验失效,预测失效; √23、当存在自相关时,OLS 估计量是有偏的,而且也是无效的; 乂 24、消除自相关的一阶差换变换假定自相关系数必须等于-1; 乂25、发现模型中存在误差自相关时,都可以利用差分法来消除自相关; √26、在自回归模型中,由于某些解释变量是被解释变量的滞后变量,如t t t t u y x y +++=-1321βββ 那么杜宾—沃森D —W 检验法不适用; √27、在杜宾—沃森D —W 检验法中,我们假定误差项的方差是同方差; √28、模型t t t u x y ++=21ββ中的2R 与t t t t t v x x y y +-=---)(121β中的2R 不可以直接进行比较; √ 三、汉译英15分 1、Autocorrelation also known asserial correlation, is theof awith itself, in linear regression analysis, if the errors are serially dependent => autocorrelation/serial correlation Likely causes: 1. Omit variable that ought to be included. 2. Misspecification of the functional form. This is most obvious where a straight line is put through a curve of dots. This would clearly show up in plots of residuals. 3. Errors of measurement in the dependent variable. If the errors are not random then the error term will pick up any systematic mistakes. The Problem :OLS is not the best estimation method.is unbiased, consistent, inefficient It will underestimate the true variance. So the t values will look too good, will reject H0 when it is trueTests :1. Plot the residuals over time or against a particular variable and see if there is a . Durbin Watson Statistic:Solutions :increase number of observations specify correctly GLS1、自相关又称序列相关,在线性回归分析中,如果随机误差是连续相关的,自相关是μ1,μ2,…,μn 序列自身的相关; 产生原因:1.忽略了遗漏变量2.函数形式的设定偏误;例如,将本应该是曲线的模型设定为线性曲线的模型,这将会在残差图中明确地表现出来;3.相关变量的处理错误;如果误差不是随机的,那么将会产生系统误差;后果:普通最小二乘法OLS 不是最好的估计方法无偏的,一致的,无效的 它将低估参数估计值的真实方差,从而过高估计t 统计量的值,当H 0为真时,拒绝H 0;检验:1.按照时间顺序或者一个特定的变量绘制回归残差项的图形并且观察是否逐次有规律地变化;检验法解决方法:增大样本容量 准确定义 GLS 广义的最小二乘法回归 2、The econometrics literature focuses on use of the bootstrap in hypothesis testing,which relies on approximation of probabilities in the tails of the distributions of statistics. Other applications are to confidence intervals, estimation of standard errors, and bias education. The bootstrap is straightforward to implement for smooth √N -consistent estimators based on iid samples, though bootstraps with asymptotic refinements are underutilized. Caution is needed in other settings, including non-smooth estimators such as the median, nonparametric estimators, and inference for data that are not iid.计量经济学文献侧重于假设检验中的自举估计方法的使用,它依赖于检验统计量尾部概率分布的近似值;其他的应用是对置信区间,标准误差估计和偏差的评判;通常统计量不是渐进充分的,但对于独立同分布的自举样本,且统计量是光滑√N 一致统计量时,自举估计量较容易实现;,对于样本不是独立同分布或者统计量是非光滑估计量和非参数估计量等其它情形,自举推断较复杂; 3、The Durbin –Watsontest has become so venerable that practitioners often forget the assumptions underlying the test. In particular, the assumptions that 1 the explanatory variables are non-stochastic; 2 the error term follows the normal distribution;3 the regression models do not include the lagged values of the regressand; and 4 only the first-order serial correlation is taken into account are very important for the application of the DW test. It should also be added that a significant DW statistic may not necessarily indicate autocorrelation. Rather, it may be an indication of omission of relevant variables from the model.注:venerable 珍贵的,神圣的;regressand 回归元,在计量经济学中常指被解释变量;normal distribution 正态分布;the first-order serial correlation 一阶自相关;DW检验如此高大上以至于检验人员经常忘记相关的假设检验,特别是,如下假设1被解释变量是非随机的2误差项遵循正态分布3回归模型不包括解释变量的滞后值4在应用DW检验最重要的一点是只考虑一阶自相关;同样应该注意的是,一个重要的DW统计量可能不一定表明自相关关系,而是这个序列模型遗漏了相关变量的一个迹象而已;四、简答题4~5个共20分1、回归分析与相关分析的区别与联系联系:回归分析与相关分析都是研究变量间的统计学课题;回归分析是在相关分析和因果分析的基础上,去研究解释变量对被解释变量的影响,相关分析中相关系数的确定是建立在回归分析的基础上的,二者互相补充、相辅相成;2、经典假设的内容是什么零均值假定;同方差假定;无自相关假定;随机扰动项与解释变量不相关;正态性假定;3、影响随机误差项的主要因素有哪些模型设定误差;变量的观测误差;经济变量的内在随机性;影响因素数据无法取得4、产生多重共线性的背景判断方法处理方法对模型的主要影响产生背景:经济变量之间有共同变化的趋势;模型中包含滞后变量;利用截面数据建立模型;样本数据自身的问题;判断方法:简单相关系数法、方差膨胀因子法、条件系数法、经验法、逐步回归检测法处理方法:增大样本数、剔除变量、岭回归完全多种共线性对模型的影响:参数的估计值不确定;参数估计值的方差无限大;严重多重共线性对模型的影响:参数估计的方差和协方差增大;参数估计的置信区间趋于变大;假设检验容易作出错误的判断;可能造成可决系数R^2较高,F检验的显着性很高,但t检验却可能不显着;5、异方差的影响检测手段补救措施影响:对估计参数的统计特性的影响有参数的OLS估计仍然具有无偏性但是其方差不再是最小的;古典假设下的假设检验即t、F检验不再成立;检测手段:图示法、Glejser检验、Goldfeld-Quanadt检验、White检验、ARGH检验;补救措施:加权最小二乘法、模型对数变换、对模型变换;怀特检验White检验的步骤了解120~121、加权最小二乘法的思想;6、自相关的后果同异方差对估计参数的统计特性的影响有参数的OLS估计仍然具有无偏性但是其方差不再是最小的;古典假设下的假设检验即t、F检验不再成立标准误被低估,t值高估7、DW检验的步骤、五个区域及其应用条件步骤:构建原假设H0:ρ=0;构建统计量DW≈21-ρ^;查DW分布表,得到相应DL和DU;判定模型自相关状态;五个区域:0≤DW≤DL 正相关;DL<DW≤DU不确定;DU<DW<4-DU无自相关;4-DU ≤DW<4-DL不能判定;4-DL≤DW≤4应用条件:解释变量X为非随机的;随机误差项为一阶自回归形式;线性模型的解释变量中不包含滞后的被解释变量;只适用于有常数项的回归模型;数据序列无缺失项;8、在回归模型中,如果模型的随机干扰项无自相关,但是我们错误的判定模型中有一阶自相关,并使用了广义差分模型,将会产生什么后果五、计算分析题2个30分;计算、软件输出结果的分析1、一元线性回归中相关参数估计,比如参数如何求得;R2的相关问题;t、F统计量的表达;标准误的计算;2、Eviews 案例输出结果的解释,主要就是F 值,t 值,R 2值,回归模型式,残差能否反映自相关或者异方差问题类似这些;多重共线性、异方差、自相关的判断 六、证明题一个10分第二章1、OLS 回归线的性质证明 见课本29~30页 1样本回归线通过样本均值2i i i n Y Y Y∧∧-的均值等于实际值Y 的均值3剩余项i e 的均值为零,由最小二乘准则知 4被解释变量i Y ∧与剩余项e i 不相关i ,iY e r ∧∧=因为2222222222222(y x )(x )(y x )x y x x x 0i i i i i i i i i i iiiy e y βββββββ∧∧∧∧∧∧∧∧∧∑=∑-=∑-=∑-∑=∑-∑=, 所以 i ,iY e r ∧=05解释变量i X 与剩余项e i 不相关X ,i i e X r ==由OLS 正规方程式有12()0i i i i i Y X X X e ββ∧∧∑--=∑=,所以 X ,i i e r =02、OLS 估计量的线性、无偏性、有效性的证明 见课本32~34页1线性: 2无偏性: 3有效性。
1.普通最小二乘法(Ordinary Least Squares,OLS):已知一组样本观测值{}n i Y X i i ,2,1:),(⋯=,普通最小二乘法要求样本回归函数尽可以好地拟合这组值,即样本回归线上的点∧i Y 与真实观测点Yt 的“总体误差”尽可能地小。
普通最小二乘法给出的判断标准是:被解释变量的估计值与实际观测值之差的平方和最小。
2.广义最小二乘法GLS :加权最小二乘法具有比普通最小二乘法更普遍的意义,或者说普通最小二乘法只是加权最小二乘法中权恒取1时的一种特殊情况。
从此意义看,加权最小二乘法也称为广义最小二乘法。
3.加权最小二乘法WLS :加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数。
4.工具变量法IV :工具变量法是克服解释变量与随机干扰项相关影响的一种参数估计方法。
5.两阶段最小二乘法2SLS, Two Stage Least Squares :两阶段最小二乘法是一种既适用于恰好识别的结构方程,以适用于过度识别的结构方程的单方程估计方法。
6.间接最小二乘法ILS :间接最小二乘法是先对关于内生解释变量的简化式方程采用普通小最二乘法估计简化式参数,得到简化式参数估计量,然后过通参数关系体系,计算得到结构式参数的估计量的一种方法。
7.异方差性Heteroskedasticity :对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差性。
8.序列相关性Serial Correlation :多元线性回归模型的基本假设之一是模型的随机干扰项相互独立或不相关。
如果模型的随机干扰项违背了相互独立的基本假设,称为存在序列相关性。
9.多重共线性Multicollinearity :对于模型i k i i X X X Y μββββ++⋯+++=i k 22110i ,其基本假设之一是解释变量X 1,X 2,…,Xk 是相互独立的。
1.计量经济学重点2. 三大要素的经济理论:经济理论关于计量经济学是建立计量经济模型的依据和动身点。
计量经济学关于经济理论而言是理论到实际的桥梁和检验工具。
观测数据:要紧是指统计数据和各种调查数据。
是所考察的经济对象的客观反映和信息载体,是计量经济工作处理的要紧现实素材。
经济数据是计量经济分析的材料。
经济数据是经济规律的信息载体。
数据类型有时刻序列数据、截面数据、平行数据、虚拟变量数据。
统计理论:是指各种数理统计方法,包括参数的估量,假设检验等内容。
是计量经济的要紧数学基础,专门多计量经济学方法差不多上在数理统计的基础上进展起来的。
3. 计量经济模型的应用:结构分析 经济推测 政策评判 检验与进展经济理论4. 回来的含义:回来分析是研究关于一个叫做被说明变量的变量对另一个或多个叫做说明变量的依靠关系。
其用意在于通过后者(在重复抽样中)的已知或被设定值去估量和(或)推测前者的(总体)均值。
回来分析构成计量经济学的方法论基础,要紧内容包括:依照样本观看值对经济计量模型参数进行估量,求得回来方程;对回来方程、参数估量值进行显著性检验;利用回来方程进行分析、评判及推测。
回来分析的用途:通过自变量的值来估量应变量的值。
对独立性进行假设检验——依照经济理论建立适当的假设。
通过自变量的值对应变量进行推测。
上述多个目标的综合。
5. 回来关系与确定性关系:回来关系(统计关系):研究的是非确定现象随机变量间的关系。
确定性关系(函数关系):研究的是确定现象非随机变量间的关系。
6. 回来关系与因果关系:回来关系研究一个变量对另一个变量的统计依靠关系,从逻辑上说,统计关系式本身并不意味着任何因果关系。
7. 回来分析与相关分析:回来分析/相关分析研究一个变量对另一个(些)变量的统计依靠关系,但它们并不意味着一定有因果关系。
有相关关系并不意味着一定有因果关系。
相关分析对称地对待任何(两个)变量,两个变量都被看作是随机的。
计量经济学主要内容计量经济学是经济学的一个重要分支,主要研究经济现象的定量分析方法和技术。
它利用数学和统计学的工具,对经济理论进行定量验证和实证分析,从而深入理解经济现象,预测经济变量,制定政策建议等。
1.线性回归模型:线性回归是计量经济学的基础,用来分析因变量与一个或多个自变量之间的关系。
模型包括单变量回归、多变量回归,以及时间序列回归等。
通过最小二乘法估计回归系数,得出各变量之间的关系。
2.假设检验与参数估计:计量经济学关注是否能够拒绝某个假设,比如回归系数是否显著不为零。
常用的假设检验有t检验、F检验等。
参数估计包括点估计和区间估计,用来衡量回归系数的精确程度。
3.多重共线性与异方差性:多重共线性指自变量之间高度相关,会影响回归结果的稳定性。
异方差性指误差项方差不恒定,可能影响参数估计的有效性。
计量经济学提供了识别和处理这些问题的方法。
4.时间序列分析:时间序列分析用于研究随时间变化的经济数据,如GDP、通货膨胀率等。
常用的时间序列模型有ARIMA模型、ARCH模型等,可以预测未来的经济变量。
5.面板数据分析:面板数据包含横截面数据和时间序列数据,可以更全面地分析经济现象。
计量经济学研究如何处理面板数据,识别面板数据模型并进行估计。
6.工具变量与因果推断:工具变量用于解决自变量与误差项相关的问题,帮助进行因果推断。
通过选择适当的工具变量,可以减少内生性问题的影响。
7.计量经济学软件与实证应用:计量经济学使用各种统计软件如Eviews、Stata、R等来进行实证研究,分析经济政策效果、市场预测等实际问题。
8.非线性模型与时间序列经济学:除了线性模型,计量经济学也研究非线性模型,如Logit、Probit模型等。
时间序列经济学关注于经济数据的趋势和周期性变动。
第一章导论计量经济学定义:计量经济学(Econometrics)是一门应用数学、统计学和经济理论来分析、估计和检验经济现象与理论的科学。
通过使用统计数据和经济模型,计量经济学试图量化经济关系,以更好地理解经济变量之间的相互作用。
研究的问题(相关关系):计量经济学的目的是研究经济变量之间的关系,例如:1. 消费与收入的关系。
2. 教育与工资的关系。
3. 利率与投资的关系。
第二章 OLS (普通最小二乘法):OLS 是一种用于估计线性回归模型中未知参数的方法。
它通过最小化误差平方和来找到回归线。
在一元线性回归中,我们通常使用普通最小二乘法(OLS)来估计模型参数。
对于模型 Y = α + βX + ε,我们可以使用以下公式来计算α和β:β= Σ( (X - mean(X)) (Y - mean(Y)) ) / Σ( (X - mean(X))^2 ) α̂ = mean(Y) - β̂ * mean(X)这里,mea n(X) 是 X 变量的平均值(即ΣX/n),mean(Y) 是 Y 变量的平均值(即ΣY/n)。
在这些公式中,mean 表示求平均值。
Σ 表示对所有数据点求和,n 是样本大小。
这里α_hat 是截距的估计值,β_hat 是斜率的估计值。
结论及推论:1. 在高斯马尔可夫假设下,OLS 估计量是最佳线性无偏估计量(BLUE)。
2. 当误差项的方差是常数时,OLS 估计量是有效的。
3. 如果模型是正确规范的,并且误差项是独立且同分布的,那么 OLS 估计量是一致的。
4. 如果误差项与解释变量相关,或者存在遗漏变量,那么 OLS 估计量可能是有偏的。
5. OLS 提供了估计的标准误差、t 统计量和其他统计量,这些可以用于进行假设检验和构建置信区间。
第三章一元回归:(1)总函、样函:总函数和样本函数是线性回归模型的两种表现形式。
总函数(总体函数)表示整体样本的关系,一般形式为Y = β0 + β1X + ε。
计量经济学知识点计量经济学是一门融合了经济学、统计学和数学的交叉学科,它运用数学和统计方法来分析经济数据,从而揭示经济现象之间的数量关系和规律。
以下将为您介绍一些计量经济学的重要知识点。
一、回归分析回归分析是计量经济学的核心方法之一。
简单线性回归模型是最基础的形式,它假设因变量(Y)与一个自变量(X)之间存在线性关系,可以用方程 Y =β₀+β₁X +ε 来表示。
其中,β₀是截距,β₁是斜率,ε 是随机误差项。
在进行回归分析时,我们需要估计参数β₀和β₁。
常用的估计方法是最小二乘法,其目标是使残差平方和最小。
通过计算得到的回归系数可以解释自变量对因变量的影响程度。
多元线性回归则是将简单线性回归扩展到多个自变量的情况,模型变为 Y =β₀+β₁X₁+β₂X₂+… +βₖXₖ +ε。
回归分析还需要进行一系列的检验,包括模型的拟合优度检验(如R²统计量)、变量的显著性检验(t 检验)和整体模型的显著性检验(F 检验)等。
二、异方差性异方差性是指误差项的方差不是恒定的,而是随着自变量的取值不同而变化。
这会导致最小二乘法估计的有效性受到影响。
为了检测异方差性,可以使用图形法(如绘制残差图)或统计检验方法(如怀特检验)。
如果发现存在异方差性,可以采用加权最小二乘法等方法进行修正。
三、自相关性自相关性指的是误差项在不同观测值之间存在相关性。
常见的自相关形式有正自相关和负自相关。
自相关性会使估计的标准误差产生偏差,影响参数估计的有效性和假设检验的结果。
常用的检测方法有杜宾瓦特森检验。
解决自相关问题可以采用广义差分法等方法。
四、多重共线性多重共线性是指自变量之间存在较强的线性关系。
这会导致回归系数估计值不稳定,难以准确解释变量的影响。
可以通过计算方差膨胀因子(VIF)来判断是否存在多重共线性。
解决多重共线性的方法包括删除相关变量、增大样本容量或使用岭回归等方法。
五、虚拟变量虚拟变量常用于表示定性的因素,例如性别、季节、地区等。
计量经济学复习重点第一章1. 计量经济学的性质计量经济学是以经济理论和经济数据的事实为依据,运用数学和统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。
研究的主体(出发点、归宿、核心):经济现象及数量变化规律研究的工具(手段):模型数学和统计方法方法手段要服从研究对象的本质特征(与数学不同),方法是为经济问题服务计量经济研究的三个方面理论:即说明所研究对象经济行为的经济理论(计量经济研究的基础)数据:对所研究对象经济行为观测所得到的信息(计量经济研究的原料或依据)方法:模型的方法与估计、检验、分析的方法(计量经济研究的工具与手段2. 计量经济学与相关学科的联系与区别联系:●计量经济学研究的主体—经济现象和经济系的数量规律●计量经济学必须以经济学提供的理论原则和经济运行规律为依据●经济计量分析的结果:对经济理论确定的原则加以验证、充实、完善区别:●经济理论重在定性分析,并不对经济关系提供数量上的具体度量●计量经济学对经济关系要作出定量的估计,对经济理论提出经验的内容3. 学习计量经济学的必要性4. 计量经济学研究的基本思路和步骤模型设定(选择变量和数学关系式)、估计参数(确定变量间的数量关系)、模型检验(检验所得结论的可靠性)、模型应用(作经济分析和经济预测)5。
模型的设定、参数估计、模型检验的要求模型设定要求●要有科学的理论依据●选择适当的数学形式(单一方程、联立方程线性形式、非线性形式)●模型要兼顾真实性和实用性●包含随机误差项●方程中的变量要具有可观测性参数估计要求参数的估计值:所估计参数的具体数值参数的估计式:估计参数数值的公式6. 模型中的变量及其类型从变量的因果关系区分:被解释变量(应变量)—-要分析研究的变量解释变量(自变量)—说明应变量变动主要原因的变量(非主要原因归入随机误差项)从变量的性质区分内生变量—其数值由模型所决定的变量,是模型求解的结果外生变量—其数值由模型以外决定的变量(相关概念:前定内生变量、前定变量) 注意:外生变量数值的变化能够影响内生变量的变化,内生变量却不能反过来影响外生变量7. 计量经济研究中数据的类型时间数列数据(同一空间、不同时间)、截面数据(同一时间、不同空间)、混合数据(面板数据 Panel Data)、虚拟变量数据8。
计量经济学第一章use 打开数据 describe 查看数据集情况 summary 描述统计tabstat +[stats] 计算描述性统计量(指定) table+[contents] 类别变量+连续变量列联表 table/ tabulate 类别变量频次表 histogram 直方图第二章 一元回归线性模型:基本思想第三章 第四章 一元、多元线性回归模型:假设检验随机扰动项、参数的方差、标准误计算统计检验1模型的拟合优度检验:R2判定系数(可决系数)调整的可决系数:范围在0和1之间,越接近1,说明模型具有较高的拟合优度2方程的显着性检验:F 统计量,prob (F )F >F(k-1,n-k),拒绝原假设H0,即显着。
F<F(k-1,n-k),则暂时不拒绝,不显着。
显着性概率为0,小于给定显着性水平(),表明模型对总体拟合显着 3变量的显着性检验:T 统计量 (服从n-2,n-k ),p 值 Β2一般为0,T>为显着,T<为不显着(5%水平) 线性回归模型的基本假设:假设1:模型具有线性性(针对模型)。
Y 是参数βi 的线性组合,不一定要求是变量X 的线性组合。
假设2 :解释变量X 与u 不相关(针对扰动项)。
数学表达:cov(Xi,ui)=0通常说法:X 具有外生性假设3:给定X ,扰动项的期望或均值为零(针对扰动项)。
数学表达:E(?i |Xi)=0,i=1,2, …,n 假设4:同方差假定(针对扰动项)。
数学表达:Var (ui) = ??2= Var (Yi) i=1,2, …,n. 假设5:无自相关(针对扰动项)。
数学表达:Cov(?i, ?j ) = 0= Cov(Y i, Y j ) i≠j 假设6:回归模型设定是正确的(表面是针对模型,实质上是针对扰动项)sort 排序 order 排序 drop 去除记录 keep 保留记录 generate 生产新变量 replace 给变量赋新值 rename 给变量重命名2R假设7:扰动项符合正态分布(针对扰动项)数学表达:?i~N(0, ??2 )?Y i~N(β0+β1X, ??2 ) 第五章线性回归模型拓展(函数形式,变量测度单位)第六章虚拟变量回归有截距,m个类别(取值),仅引入m-1个虚拟变量,无截距可以m个第七章模型设定误差1包含无关变量:后果(F,T检验)参数估计是无偏且一致的估计,但不是有效的估计,检验仍然有效,但方差增大,接收错误假设的概率较高。
2遗漏重要变量:后果(残差图)如果遗漏的变量X2与X1相关,那么是有偏且不一致的估计;如果X2与X1不相关,那么是无偏的,但是有偏的同理,参数估计量的方差估计也是有偏的,再次,参数显着性检验结果不可靠。
第八,九,十章异方差、多重共线性、自相关检验异方差多重共线性自相关含义例如:后果:自相关降低解U中包含未知x X中包含x,xx U,x异方差在截面数据中较常见,在时间序列中较少,多重共线性是样本现象。
是程度问题,不是有无问题时间序列中常见后果1、参数OLS估计仍然是线性无偏的2、2、方差估计是错误的3、3、从而t检验效率降低。
(无偏非有效)3不同函数形式的选择MWD检验,散点图4测量误差:应变量有误差:OLS估计量是无偏的。
OLS估计量的方差也是无偏的。
估计量的估计方差比没有测量误差时的大。
自变量有误差:OLS估计量是有偏的(趋零偏误)OLS估计量的方差也是有偏的。
判断题1、简单线性回归模型与多元线性回归模型的基本假定是相同的。
错,在多元线性回归模型里除了对随机误差项提出假定外,还对解释变量之间提出无多重共线性的假定。
2、在模型中引入解释变量的多个滞后项容易产生多重共线性。
对,在分布滞后模型里多引进解释变量的滞后项,由于变量的经济意义一样,只是时间不一致,所以很容易引起多重共线性。
3、DW 检验中的d 值在0 到4 之间,数值越小说明模型随机误差项的自相关度越小,数值越大说明模型随机误差项的自相关度越大。
错,DW值在0到4之间,当DW落在最左边(0<d<dL )、最右边( 4?dL<d<4 )时,分别为正自相关、负自相关;中间(du<d<4-du)为不存在自相关区域;其次为两个不能判定区域。
4、在计量经济模型中,随机扰动项与残差项无区别。
错,它们均为随机项,但随机误差项表示总体模型的误差,残差表示样本模型的误差;另外,残差=随机误差项+参数估计误差。
5、在经济计量分析中,模型参数一旦被估计出来,就可将估计模型直接运用于实际的计量经济分析。
错,参数一经估计,建立了样本回归模型,还需要对模型进行检验,包括经济意义检验、统计检验、计量经济专门检验等。
6、线性回归模型意味着因变量是自变量的线性函数。
错,线性回归模型本质上指的是参数线性,而不是变量线性。
同时,模型与函数不是同一回事。
7、多重共线性问题是随机扰动项违背古典假定引起的。
错,应该是解释变量之间高度相关引起的。
8、通过虚拟变量将属性因素引入计量经济模型,引入虚拟变量的个数与样本容量大小有关。
错,引入虚拟变量的个数样本容量大小无关,与变量属性,模型有无截距项有关。
9、双变量模型中,对样本回归函数整体的显着性检验与斜率系数的显着性检验是一致的。
正确,要求最好能够写出一元线性回归中,F统计量与t统计量的关系,即F=t^2的来历;或者说明一元线性回归仅有一个解释变量,因此对斜率系数的t检验等价于对方程的整体性检验。
11、在实际中,一元回归几乎没什么用,因为因变量的行为不可能仅由一个解释变量来解释。
错,在实际中,在一定条件下一元回归是很多经济现象的近似,能够较好地反映回归分析的基本思想,在某些情况下还是有用的。
13、虚拟变量只能作为解释变量。
错,虚拟变量还能作被解释变量。
14、设估计模型为。
表明模型有很好的拟合优度,则模型不存在伪(虚假)回归。
错,可能存在伪(虚假)回归,因为可决系数较高,而 DW 值过低。
15、随机扰动项的方差与随机扰动项方差的无偏估计没有区别。
错,随机扰动项的方差反映总体的波动情况,对一个特定的总体而言,是一个确定的值。
16、经典线性回归模型(CLRM)中的干扰项不服从正态分布的,OLS 估计量将有偏的。
错,即使经典线性回归模型(CLRM)中的干扰项不服从正态分布的,OLS 估计量仍然是无偏的。
17、虚拟变量的取值原则上只能取0 或1。
对,虚拟变量的取值是人为设定的,主要表征某种属性或特征或其它的存在与否,0 或1 正好描述了这种特性。
当然,依据研究问题的特殊性,有时也可以取其它值。
18、拟合优度检验和F 检验是没有区别的。
错(1)F-检验中使用的统计量有精确的分布,而拟合优度检验没有;(2)对是否通过检验,可决系数(修正可决系数)只能给出一个模糊的推测;而F 检验可以在给定显着水平下,给出统计上的严格结论。
20、双变量模型中,对样本回归函数整体的显着性检验与斜率系数的显着性检验是一致的;正确,最好能够写出一元线性回归模型;F统计量与T统计量的关系,即的F=t^2的来历;或者说明一元线性回归仅有一个解释变量,因此对斜率系数的t检验等价于对方程的整体性检验。
22、在模型12233tttYXX βββ=+++的回归分析结果报告中,……则表明解释变量。
对yt 的影响是显着的。
错,解释变量X2t和X3t对Y t的联合影响是显着的。
23、结构型模型中的每一个方程都称为结构式方程,结构方程中,解释变量只可以是前定变量。
错误,结构方程中,解释变量可以是前定变量,也可以是内生变量。
24、通过虚拟变量将属性因素引入计量经济模型,引入虚拟变量的个数与模型有无截距项无关。
错误,模型有截距项时,如果被考察的定性因素有m个相互排斥属性,则模型中引入m-1个虚拟变量,否则会陷入“虚拟变量陷阱”,模型无截距项时,若被考察的定性因素有m个相互排斥属性,可以引入m个虚拟变量,这时不会出现多重共线性。
25、在对参数进行最小二乘估计之前,没有必要对模型提出古典假定。
错误,在古典假定条件下,OLS估计得到的参数估计量是该参数的最佳线性无偏估计(具有线性、无偏性、有效性)。
总之,提出古典假定是为了使所作出的估计量具有较好的统计性质和方便地进行统计推断。
26、当异方差出现时,常用的t和F检验失效正确,由于异方差类,似于t比值的统计量所遵从的分布未知;即使遵从t分布,由于方差不在具有最小性。
这时往往会夸大t检验,使得t检验失效;由于F分布为两个独立的χ^2变量之比,故依然存在类似于t分布中的问题27、解释变量与随机误差项相关,是产生多重共线性的主要原因。
错误,产生多重共线性的主要原因是:经济本变量大多存在共同变化趋势;模型中大量采用滞后变量;认识上的局限使得选择变量不当;……。
29、由间接最小二乘法与两阶段最小二乘法得到的估计量都是无偏估计。
错误,间接最小二乘法适用于恰好识别方程的估计,其估计量为无偏估计;而两阶段最小二乘法不仅适用于恰好识别方程,也适用于过度识别方程。
两阶段最小二乘法得到的估计量为有偏、一致估计。
32、在经济计量分析中,模型参数一旦被估计出来,就可将估计模型直接运用于实际的计量经济分析。
错。
参数一经估计,建立了样本回归模型,还需要对模型进行检验,包括经济意义检验、统计检验、计量经济专门检验等。
33、假定个人服装支出同收入水平和性别有关,由于性别是具有两种属性(男、女)的定性因素,因此,用虚拟变量回归方法分析性别对服装支出的影响时,需要引入两个虚拟变量。
错,是否引入两个虚拟变量,应取决于模型中是否有截距项。
如果有截距项则引入一个虚拟变量;如果模型中无截距项,则可引入两个虚拟变量。
34、随机扰动项的方差与随机扰动项方差的无偏估计没有区别。
错,随机扰动项的方差反映总体的波动情况,对一个特定的总体而言,是一个确定的值。
35、在简单线性回归中可决系数2R与斜率系数的t检验的没有关系。
错误,可决系数是对模型拟合优度的综合度量,其值越大,说明在Y的总变差中由模型作出了解释的部分占的比重越大,模型的拟合优度越高,模型总体线性关系的显着性越强。
反之亦然。
斜率系数的t检验是对回归方程中的解释变量的显着性的检验。
在简单线性回归中,由于解释变量只有一个,当t检验显示解释变量的影响显着时,必然会有该回归模型的可决系数大,拟合优度高。
36、异方差性、自相关性都是随机误差现象,但两者是有区别的。
正确。
异方差的出现总是与模型中某个解释变量的变化有关。
…自相关性是各回归模型的随机误差项之间具有相关关系。
……37、通过虚拟变量将属性因素引入计量经济模型,引入虚拟变量的个数与模型有无截距项无关。
错误,模型有截距项时,如果被考察的定性因素有m个相互排斥属性,则模型中引入m-1个虚拟变量,否则会陷入“虚拟变量陷阱”;模型无截距项时,若被考察的定性因素有m个相互排斥属性,可以引入m个虚拟变量,这时不会出现多重共线性。