计量经济学第二章主要公式
- 格式:doc
- 大小:265.00 KB
- 文档页数:6
中级计量经济学讲义_第二章第一节...上课材料之三:第二节分布函数(Distribution function),数学期望(Expectation) 与方差(Variance)本节主要介绍概率及其分布函数,数学期望,方差等方面的基础知识。
一、概率(Probability)1、概率定义(Definition of Probability)在自然界和人类社会中有着两类不同的现象,一类是决定性现象,其特征是在一定条件必然会发生的现象;另一类是随机现象,其特征是在基本条件不变的情况下,观察到或试验的结果会不同。
换句话说,就个别的试验或观察而言,它会时而出现这种结果,时而出现那样结果,呈现出一种偶然情况,这种现象称为随机现象。
随机现象有其偶然性的一面,也有其必然性的一面,这种必然性表现为大量试验中随机事件出现的频率的稳定性,即一个随机事件出现的频率常在某了固定的常数附近变动,这种规律性我们称之为统计规律性。
频率的稳定性说明随机事件发生可能性大小是随机事件本身固定的,不随人们意志而改变的一种客观属性,因此可以对它进行度量。
对于一个随机事件A ,用一个数P (A )来表示该事件发生的可能性大小,这个数P (A )就称为随机事件A 的概率,因此,概率度量了随机事件发生的可能性的大小。
对于随机现象,光知道它可能出现什么结果,价值不大,而指出各种结果出现的可能性的大小则具有很大的意义。
有了概率的概念,就使我们能对随机现象进行定量研究,由此建立了一个新的数学分支——概率论。
概率的定义定义在事件域F 上的一个集合函数P 称为概率,如果它满足如下三个条件:(i )P (A )≥0,对一切∈A F (ii )P (Ω)=1;(iii )若∈i A ,i=1,2…,且两两互不相容,则∑∑∞=∞==??11)(i ii i AP A P性质(iii )称为可列可加性(conformable addition )或完全可加性。
推论1:对任何事件A 有)(1)(A P A P -=;推论2:不可能事件的概率为0,即0)(=φP ;推论3:)()()()(AB P B P A P B A P -+=?。
Chapter 2. Review of Probability2.1 Random Variables and Probability Distributions概率Probability:在大量重复实验下,事件发生的频率趋向的某个稳定值。
例如,记事件“下雨”为A,其发生的概率为P()A。
条件概率Conditional Probability :例:已知明天会出太阳,下雨的概率有多大?记事件“出太阳”为B 。
则在出太阳的前提条件下降雨的“条件概率”(conditional probability )为,P()P()P()A B A B B ∩≡其中,“∩”表示事件的交集(intersection ),故P()A B ∩为“太阳雨”的概率,参见图2.1。
条件概率是计量经济学的重要概念之一。
图2.1、条件概率示意图独立事件Independence :如果条件概率等于无条件概率,即P()P()A B A =,即B 是否发生不影响A 的发生,则称,A B 为相互独立的随机事件。
此时,P()P()P()P()A B A B A B ∩≡=,故P()P()P()A B A B ∩=也可以将此式作为独立事件的定义。
全概公式如果事件组{}12,,,(2)n B B B n ≥ 两两互不相容,()0(1,,)i P B i n >∀= ,且12n B B B ∪∪∪ 为必然事件(即在12,,,n B B B 中必然有某个i B 发生,“∪”表示事件的并集,union ),则对任何事件A 都有(无论A 与{}12,,,n B B B 是否有任何关系),1P()P()P()ni i i A B A B ==∑全概公式把世界分成了n 个可能的情形,再把每种情况下的条件概率“加权平均”而汇总成无条件概率(权重为每种情形发生的概率)。
该公式有助于理解后面的迭代期望定律。
离散型随机变量Discrete Random Variable :假设随机变量X 的可能取值为{}12,,,,k x x x ,其对应的概率为{}12,,,,k p p p ,即(P )k k p X x ≡=,则称X 为离散型随机变量,其分布律可以表示为,1212k k X x x x pp p p其中,0k p ≥,1kkp=∑。
计量经济学主要公式1. 简介计量经济学是一门研究经济现象的定量分析方法。
在计量经济学中,有许多重要的公式被广泛应用于经济数据的分析和解释。
本文将介绍计量经济学中的一些主要公式,并对其进行解释和应用。
2. 最小二乘法估计最小二乘法估计是计量经济学中最常用的估计方法之一。
它用于确定数据之间的线性关系,并找到使得预测值与真实值之间的平方差最小化的最佳拟合线。
最小二乘法估计的公式如下:Y = β0 + β1X + ε其中,Y表示因变量,X表示自变量,β0和β1是待估计的参数,ε表示误差项。
最小二乘法估计的目标是最小化误差项的平方和,即使得∑ε^2最小化。
3. 弹性系数弹性系数是衡量变量之间相互影响程度的指标。
在计量经济学中,弹性系数经常被用来衡量因变量对自变量的变化的敏感度。
常见的弹性系数有价格弹性、收入弹性等。
弹性系数的计算公式如下:E = (ΔY / Y) / (ΔX / X)其中,E表示弹性系数,ΔY表示因变量的变化量,ΔX表示自变量的变化量,Y表示因变量的原始值,X表示自变量的原始值。
弹性系数的绝对值越大,表示变量之间的相互影响越大。
4. 汇总函数汇总函数用于描述宏观经济关系中的总量变量之间的关系。
计量经济学中常用的汇总函数包括线性汇总函数和非线性汇总函数。
线性汇总函数的一般形式如下:Y = a + b1X1 + b2X2 + ... + bnXn其中,Y表示因变量,X1、X2、…、Xn表示自变量,a表示截距,b1、b2、…、bn表示回归系数。
线性汇总函数可以用于宏观经济模型的建立和政策分析。
5. 假设检验假设检验是计量经济学中用于检验统计推断的一种方法。
通过对样本数据进行分析,假设检验可以判断统计推断是否具有显著性。
常用的假设检验有t检验、F检验等。
假设检验的一般步骤包括建立原假设和备择假设、计算检验统计量、确定临界值和进行推断。
假设检验的结果通常用p值来表示。
6. 时间序列分析时间序列分析是计量经济学中研究时间序列数据的方法。
第二章 一元线性回归模型1.随机误差项形成的原因:① 在解释变量中被忽略的因素 ② 变量观测值的观测误差 ③ 模型的关系误差或设定误差 ④ 其他随机因素的影响。
2.总体回归方程和样本回归方程的区别和联系:总体回归方程是对总体变量间关系的定量表述,条件均值E(Y|X=x)是x 的一个函数 ,记作:E(Y|X=x)=f(x),其中,f(x)为x 的某个函数 ,它表明在X=x 下,Y 的条件均值与x 之间的关系。
但实际中往往不可能得到总体的全部资料 ,只能先从总体中抽取一个样本,获得样本回归方程 ,并用它对总体回归方程做出统计推断。
通过样本回归方程按照一定的准则近似地估计总体回归方程 ,但由于样本回归方程随着样本的不同而有所不同,所以这种高估或低估是不可避免的。
3.随机误差项的假定条件:(1)零均值:随机误差项具有零均值,即E( )=0,i=1,2,… (2)随机误差项具有同方差: 即每个 对应的随机误差项 具有相同的常数方差。
Var( )=Var( )= ,i=1,2,… (3)无序列相关:即任意两个 和 所对应的随机误差项 、 是不相关的。
Cov( , )=E( )=0,i j,i,j=1,2,… (4)解释变量X 是确定性变量,与随机误差项不相关。
Cov( , )=E( )=0,此假定保证解释变量X 是非随机变量。
(5) 服从正态分布, ~N(0, )4.为什么用决定系数 评价拟合优度,而不用残差平方和作为评价标准?判定系数 = = 1- ,含义为由解释变量引起的被解释变量的变化占被解释变量总变化的比重,用来判定回归直线拟合的优劣。
该值越大说明拟合得越好。
而残差平方和值的大小受变量值大小的影响,不适合具有不同量纲的模型的比较。
5.可决系数 说明了什么?在简单线性回归中它与斜率系数的t 检验的关系是什么?可决系数 是对模型拟合优度的综合度量 ,其值越大,说明在Y 的总变差中由模型作出了解释的部分占得比重越大 ,模 型的拟合优度越高 ,模型总体线性关系的显著性越强。
第二章主要公式资料地址:/jl1、回归模型概述(1)相关分析与回归分析经济变量之间的关系:函数关系、相关关系相关关系:单相关和复相关,完全相关、不完全相关和不相关,正相关与负相关,线性相关和负相关,线性相关和非线性相关。
相关分析:——总体相关系数XY ρ=——样本相关系数()()nii XY XX Y Y r --=∑——多个变量之间的相关程度可用复相关系数和偏相关系数度量 回归分析:相关关系 + 因果关系(2)随机误差项:含有随机误差项是计量经济学模型与数理经济学模型的一大区别。
(3)总体回归模型总体回归曲线:给定解释变量条件下被解释变量的期望轨迹。
总体回归函数:(|)()i i E Y X f X =总体回归模型:(|)()i i i i i Y E Y X f X μμ=+=+ 线性总体回归模型:011,2,...,i i iY X i n ββμ=++=(4)样本回归模型样本回归曲线:根据样本回归函数得到的被解释变量的轨迹。
(线性)样本回归函数: 01ˆˆˆi i Y X ββ=+ (线性)样本回归模型:01ˆˆˆi i iY X e ββ=++ 2、一元线性回归模型的参数估计(1)基本假设① 解释变量:是确定性变量,不是随机变量var()0i X =② 随机误差项:零均值、同方差,在不同样本点之间独立,不存在序列相关等()01,2,...,i E i n μ==2var()1,2,...,i i n μσ==cov(,)0;,1,2,...,i j i j i j n μμ=≠=③ 随机误差项与解释变量:不相关cov(,)01,2,...,i i X i n μ==④ (针对最大似然法和假设检验)随机误差项:2~(0,)1,2,...,i N i n μσ=⑤ 回归模型正确设定。
【前四条为线性回归模型的古典假设,即高斯假设。
满足古典假设的线性回归模型称为古典线性回归模型。
】 (2)参数的普通最小二乘估计(OLS ) 目标:21minnii e=∑对于一元线性回归模型:011,2,...,i i i Y X i n ββμ=++=正规方程组:011011ˆˆ2[()]0ˆˆ2[()]0ni i i ni i i i Y X X Y X ββββ==⎧--+=⎪⎪⎨⎪--+=⎪⎩∑∑ 解得:011112211ˆˆ()()ˆ()n n i i i i i i n ni i i i Y X X X Y Y x y X X x βββ====⎧=-⎪⎪⎪--⎨==⎪⎪-⎪⎩∑∑∑∑(3)最大似然估计(ML )对于一元线性回归模型:011,2,...,i i i Y X i n ββμ=++=重要的基本假设:2~(0,)1,2,...,cov(,)0;,1,2,...,var()01,2,...,i i j i N i n i j i j n X i nμσμμ⎧=⎪=≠=⎨⎪==⎩ 得到:201~(,)1,2,...,i i Y N X i n ββσ+=【且cov(,)0;,1,2,...,i j Y Y i j i j n =≠=,这个对最大似然法的估计很重要】则目标:12,,...,n Y Y Y 的联合概率密度最大,即()2012112121ˆˆ()2max (,,...,)()()()1ni i i n n Y X nf Y Y Y f Y f Y f Y eββσ=---=⋅⋅⋅∑=最终结果与OLS 得到的结果相同。
(4)OLS 估计量的性质① 线性性11ˆni i i v Y β==∑,其中21ii nii x v x==∑01ˆni ii wY β==∑,其中1i i w Xv n =- ② 无偏性1111ˆ...n n i i i i i i v Y v ββμ=====+∑∑ → 1111ˆ()()ni i i E v E ββμβ==+=∑ 0011ˆ...nni i i i i i wY w ββμ=====+∑∑ → 0001ˆ()()ni i i E w E ββμβ==+=∑ ③ 有效性2121ˆvar()n ii xσβ==∑,22121ˆvar()nii nii Xnxσβ===∑∑可以证明,OLS 得到的方差最小。
④ 一致性随着样本量的增大,参数的估计量以概率趋向于真值11ˆlim()p ββ=,00ˆlim()p ββ=(5)OLS 回归函数的性质① 样本回归线过样本均值点(,)X Y ,即01ˆˆY X ββ=+ ② 被解释变量估计值的均值等于实际值的均值,即ˆYY = ③ 残差和为零,即10nii e==∑④ 解释变量与残差的乘积之和为零,即10ni ii X e==∑⑤ 解释变量的估计与残差的乘积之和为零,即1ˆ0ni ii Y e==∑(6)随机误差项的估计OLS 估计量(无偏):2211ˆ2n i i e n σ==-∑ML 估计量(有偏):2211ˆn i i e n σ==∑ 3、拟合优度检验(1)离差分解总体平方和(or 总离差平方和)()2211nnii i i TSS y Y Y ====-∑∑回归平方和()21ˆni i ESS Y Y ==-∑残差平方和()21ˆni ii RSS Y Y ==-∑有TSS ESS RSS =+(2)决定系数21ESS RSSR TSS TSS==- 【总离差中,能够解释的部分所占的比重】4、统计推断(1)参数估计的分布(T 检验)对于一元线性回归模型:011,2,...,i i iY X i n ββμ=++=由正态分布的基本假设和估计量的性质(线性性、无偏性、有效性),参数的估计量有如下性质:2210021ˆ~(,)nii nii XN nxσββ==∑∑,21121ˆ~(,)nii N xσββ=∑000ˆ~(0,1)ˆ()N SE βββ-,其中0ˆ()SE β==111ˆ~(0,1)ˆ()N SE βββ-,其中1ˆ()SE β==由于2σ未知,用2ˆσ代替,则0ˆ()SE β不再为常数。
此时, 统计量1=000ˆˆ()SE βββ-,其中,0ˆβ服从正态分布,(1)ˆ()SE β===−−−说明说明(1):i e 服从正态分布,则2i e 服从2χ分布,残差平方和的自由度为n-2,故221~(2)nii en χ=-∑用估计量2ˆσ代替以后的统计量1=000ˆˆ()t SE βββ-−−−−→服从分布正态分布分布故:000^ˆ~(2)ˆ()t t n SE βββ-=-同理:111^1ˆ~(2)ˆ()t t n SE βββ-=-(2)区间估计002ˆˆ()t SE αββ∧⎡⎤±⎢⎥⎣⎦,112ˆˆ()t SE αββ∧⎡⎤±⎢⎥⎣⎦ (3)参数的假设检验原假设*011:H ββ=,备择假设*111:H ββ≠ → 双边检验 原假设*011:H ββ≥,备择假设*111:H ββ< → 单边检验 统计量:*111^1ˆ~(2)ˆ()t t n SE βββ-=-临界值(临界水平为α):2t α → 双边t α → 单边判断规则:如果12t t α>,则拒绝原假设; → 双边如果1t t α>,则拒绝原假设; → 单边【在实际应用中,一般取*10β=;当检验结果为拒绝原假设时,表明该参数显著地不为零,即认为该参数对应的变量具有显著的影响能力。
】(4)结果表达【必须采用规范的表达方式】2ˆ414.0450.515(6.462)(30.773)0.992i iY X R =+=或2414.0450.515(6.462)(30.773)0.992i i iY X R μ=++=5、预测(1)总体均值的点预测(也是个别值的点预测)0010ˆˆˆ(|)i E Y X Y X ββ==+ (2)总体均值(|)i E Y X 的预测置信区间002ˆˆ()Y t SE Y α∧⎡⎤±⎢⎥⎣⎦其中,0ˆ()SE Y ∧=(3)个别值0Y 的预测置信区间002ˆ()Y t SE e α∧⎡⎤±⎢⎥⎣⎦其中,0e = 【由于误差项的存在,个别值的波动更加明显,因此其方差更大。
在实际做题中,如果未特别说明,都是计算均值的置信区间。
】。