第3章 空间计量模型的极大似然估计
- 格式:pdf
- 大小:2.21 MB
- 文档页数:50
空间计量方法模型空间经济计量模型主要解决回归模型中复杂的空间相互作用与空间依存性结构问题(Anselin ,1988)。
长期以来,在主流的经济学理论中,空间事物无关联及均质性假定的局限,以及普遍使用忽视空间效应的普通最小二乘法 (OLS)进行模型估计,使得在实际应用中往往存在模型的设定偏差问题,进而导致经济学研究得出的各种结果和推论不够完整、科学,缺乏应有的解释力(吴玉鸣,2007)。
空间计量经济学 (Anselin ,1988)理论认为一个地区空间单元上的某种经济地理现象或某一属性值与邻近地区空间单元上同一现象或属性值是相关的。
几乎所有的空间数据都具有空间依赖性或空间自相关性的特征,空间依赖的存在打破了大多数经典统计和计量分析中相互独立的基本假设。
也就是说,各区域之间的数据存在与时间序列相关、相对应的空间相关。
根据空间计量经济学方法原理,空间计量分析的思路如下:首先采用空间统计分析Moran 指数法检验因变量是否存在空间自相关性;如果存在空间自相关性,则以空间计量经济学理论方法为基础,建立空间计量经济模型,进行空间计量估计和检验。
1.空间自相关性检验空间相关性存在与否,实际应用研究中常常使用空间自相关指数Moran’I ,其计算公式如下所示:∑∑∑∑==-==---=ni nj ijj ni nj i ijW S Y Y Y Y WI Moran 11211,)()( (3)其中,∑∑=-=-=-=ni i n i i Y n Y Y Y n S 1121;)(1,i Y 表示第i 地区的观测值;n 为地区总数(本文为28);ij W 为二进制的邻接空间权值矩阵,表示其中的任一元素,采用邻接标准或距离标准,其目的是定义空间对象的相互邻接关系,便于把地理信息系统(GIS)数据库中的有关属性放到所研究的地理空间上来对比。
一般邻接标准的ij W 为:⎩⎨⎧=不相邻;区域和当区域相邻;区域和当区域j i j i W ij 01 。
空间计量模型的估计方法我折腾了好久空间计量模型的估计方法,总算找到点门道。
说实话,这事儿我一开始也是瞎摸索。
我最开始接触的时候,真是一头雾水。
我就先从那些基础的计量方法看起,什么最小二乘法啊,感觉它就像是我们平常数数一样,要找那个最合理的数。
但把它用到空间计量模型里,根本不行,这就是我开始时犯的错,以为传统计量方法直接就能套过来。
后来我知道空间计量模型有它特殊的地方。
我试过用极大似然估计法。
这个方法呢,我给你打个比方,就像是你在一个大森林里找一颗最特别的树。
你得一点点去试探评估,哪里的树最符合你心里想的那种特别的样子。
在这个过程中,我的数据处理就特别重要。
要先把空间权重矩阵搞定。
这个矩阵就像是一个巨大的关系网,每个元素之间的距离或者相关关系都要准确的放在里面,要是这里弄错了,整个极大似然估计就乱套了。
我有一次就是没有仔细核对空间权重矩阵的设定,结果得出来的估计结果就差得老远,我还以为我的代码或者公式用错了呢,费了好大功夫才发现是这个关系网没搭好。
还有个方法是广义矩估计法。
这个方法我觉得比较难理解。
我在尝试的时候就感觉像是在走迷宫一样,有时候走着走着就不知道到哪儿了。
每一步计算的逻辑得理得特别清楚。
就像你在迷宫里得记住你每个转弯的规则,这个估计方法里就是每一步的计算依据你得清楚。
我也试过一些软件来做空间计量模型的估计。
像R和Stata。
在R里面有很多相关的包,比如说spdep包。
但是刚开始用的时候我也是各种报错,原因很多时候就是对函数的参数设置不对,就好比你想让机器人干活,但是你给它的指令不精确。
在Stata里面呢,命令其实也有很多细节,我是一边看官方文档,一边一点点试,跟试密码似的。
比如说做空间滞后模型估计的时候,我在Stata里输入命令输错一个字母,结果就完全不对。
所以我建议啊,如果用软件,一定要仔细阅读文档,对函数和命令的每个部分都要理解,哪怕稍微有点含糊的地方都可能导致结果出错。
不过这些软件如果用得好的话,能给咱们节省不少时间呢。
空间计量模型选择、估计、权重、检验(Spatialeffect)应读者的要求,推送⼀篇关于空间计量⽅⾯的⽂章。
空间计量模型,主要⽤来解决空间被解释变量⾃相关和测量误差⽅⾯的问题;⽽且两个空间事物存在交互效应和异质性,因此,存在常系数回归和变异系数的回归区分。
空间计量经济学是计量经济学的⼀个分⽀,研究的是如何在横截⾯数据和⾯板数据的回归模型中处理空间相互作⽤(空间⾃相关)和空间结构(空间不均匀性)结构分析。
它与地学统计和空间统计学相似。
从某种程度上⽽⾔,空间计量经济学与空间统计学之间的不同和计量经济学与统计学之间的不同⼀样。
由于对其理论上的关⼼以及将计量经济模型应⽤到新兴⼤型编码数据库中的要求,近年来这个领域获得了快速发展。
空间数据分析和建模技巧与GIS的结合,现已⼴泛应⽤于经济政策分析中,尤其是实产和房地产经济[Anselin (1998a), Can(1998)], 环境和资源经济[Bockstael (1996), Geoghegan, Waingerand Bockstael (1997)], 发展经济[Nelson and Gray (1997)].当⾯临空间⾃相关时,标准的计量分析技巧通常会失效,⽽这种情形经常在地理或横截⾯数据集中出现,这也是空间计量得以迅速发展的原因之⼀。
传统的统计理论是⼀种建⽴在独⽴观测值假定基础上的理论。
然⽽,在现实世界中,特别是遇到空间数据问题时,独⽴观测值在现实⽣活中并不是普遍存在的(Getis, 1997)。
对于具有地理空间属性的数据,⼀般认为离的近的变量之间⽐在空间上离的远的变量之间具有更加密切的关系(Anselin & Getis,1992)。
正如著名的Tobler地理学第⼀定律所说:“任何事物之间均相关,⽽离的较近事物总⽐离的较远的事物相关性要⾼。
”(Tobler,1979)地区之间的经济地理⾏为之间⼀般都存在⼀定程度的Spatial Interaction,Spatial Effects):Spatial Dependenceand Spatial Autocorrelation)。
极大似然估计方法极大似然估计(Maximum Likelihood Estimation,MLE)方法是一种用于估计参数的统计方法,它基于观测到的样本数据,通过选择最大化观测数据出现的概率的参数值来估计未知参数。
极大似然估计是概率论和统计学中最重要的方法之一,广泛应用于各个领域的数据分析与建模中。
极大似然估计方法的核心思想是基于某一参数下观测数据出现的概率,选择使得这个概率最大的参数值。
具体而言,给定一个观测数据集合X,其来自于一个具有参数θ的概率分布,我们要估计未知参数θ的值。
极大似然估计的目标是找到一个参数值θ^,使得给定θ^条件下观测数据集合X出现的概率最大。
数学上,极大似然估计可以通过最大化似然函数来求解。
似然函数是一个参数的函数,表示给定某个参数θ下观测数据出现的概率。
似然函数的定义如下:L(θ|X) = P(X|θ)数的函数,表示给定某个参数θ下观测数据出现的概率。
极大似然估计的目标是寻找一个参数θ^,使得似然函数最大化,即:θ^ = arg max L(θ|X)为了方便计算,通常将似然函数转化为其对数形式,即对数似然函数:l(θ|X) = log L(θ|X)本文将主要介绍如何利用极大似然估计来估计参数。
具体而言,将分为两个部分:首先是介绍极大似然估计的理论基础,包括似然函数和对数似然函数的定义,以及如何通过最大化似然函数来估计参数;其次是通过一个实际的例子,展示如何使用极大似然估计来求解参数。
理论基础似然函数是极大似然估计的核心概念之一。
似然函数是一个参数的函数,表示给定某个参数θ下观测数据出现的概率。
似然函数的定义如下:L(θ|X) = P(X|θ)数的函数,表示给定某个参数θ下观测数据出现的概率。
似然函数的值越大,则表示给定参数θ的取值越可能产生观测数据X。
对数似然函数是似然函数的对数变换,通常在实际计算中会更加方便。
它的定义如下:l(θ|X) = log L(θ|X)对数似然函数和似然函数存在着一一对应关系,因此在求解参数时,两者等价。
空间计量经济模型的理论与应用第一部分空间计量经济模型介绍 (2)第二部分模型理论基础与原理 (5)第三部分空间相关性分析方法 (8)第四部分常用空间计量模型构建 (10)第五部分模型估计与检验方法 (14)第六部分应用案例与实证分析 (19)第七部分空间计量模型的局限性 (22)第八部分展望与未来研究方向 (25)第一部分空间计量经济模型介绍空间计量经济模型是一种将地理空间因素纳入传统经济学模型的分析方法,它通过在传统的线性模型中引入空间相关系数来考虑地区间的相互作用和影响。
这种模型起源于 20 世纪 70 年代,并逐渐成为经济学、地理学、城市规划等领域的重要工具。
本文将从理论与应用两个方面对空间计量经济模型进行详细介绍。
一、理论基础1.空间数据特性空间数据通常具有以下特点:(1)空间邻接性:相邻地区的变量之间往往存在相互影响。
(2)空间异质性:不同地区的自然环境、人文条件等差异会导致数据表现出不同的特性。
(3)空间相关性:同一地区内的多个变量之间可能存在着内在的联系,从而使得数据具有一定的空间自相关性。
2.空间计量模型的分类根据空间效应的不同,空间计量经济模型可分为两大类:(1)局部空间模型:这类模型关注的是单个区域的数据,如空间滞后模型(SLM)和空间误差模型(SEM),它们分别考虑了邻居地区的影响和空间内相关性的效果。
(2)全局空间模型:这类模型考虑的是整个研究区域的空间效应,如空间杜宾模型(SDM)和空间卡尔曼滤波模型(SKF),它们能够捕捉到区域间广泛存在的相互作用关系。
二、空间计量模型的构建1.空间权重矩阵在构建空间计量模型时,首先要确定空间权重矩阵。
空间权重矩阵用于衡量地区之间的空间关联程度,常见的有邻接矩阵、距离衰减矩阵等。
例如,在邻接矩阵中,如果两个地区相邻,则它们之间的权值为1;否则,权值为 0。
2.模型选择根据所要解决的问题和数据特点,可以选择相应的空间计量模型。
例如,当研究区域内部存在明显的空间自相关性时,可以采用空间误差模型或空间滞后模型;当研究区域之间的互动效应较强时,则应选用空间杜宾模型。
极大似然估计参数回归模型极大似然估计是统计学中常用的一种参数估计方法,它通过寻找使得观测数据出现的概率最大化的参数值来估计模型的参数。
在回归分析中,极大似然估计可以用来估计线性回归模型的参数。
假设我们有一个简单的线性回归模型,表示为:Y = β0 + β1X + ε。
其中,Y是因变量,X是自变量,β0和β1是我们要估计的参数,ε是误差项。
我们的目标是通过观测数据来估计β0和β1的值,使得观测数据出现的概率最大化。
假设我们有n个观测数据,表示为{(x1, y1), (x2, y2), ..., (xn, yn)},我们假设误差项ε服从正态分布,即ε~N(0, σ^2)。
我们可以建立似然函数来描述观测数据出现的概率。
对于第i 个观测数据,其观测值yi可以表示为:yi = β0 + β1xi + εi.其中,εi服从正态分布N(0, σ^2)。
似然函数可以表示为:L(β0, β1,σ^2) = Π(1/√(2πσ^2)) exp(-(yi β0β1xi)^2 / (2σ^2))。
为了简化计算,通常我们会对似然函数取对数,得到对数似然函数:l(β0, β1, σ^2) = Σ(-log(√(2πσ^2))) Σ((yi β0β1xi)^2 / (2σ^2))。
然后通过最大化对数似然函数来估计参数β0和β1的值。
这通常可以通过数值优化算法来实现,比如梯度下降法或者牛顿法。
通过极大似然估计,我们可以得到对参数β0和β1的估计值,从而建立起回归模型。
这种方法在统计学和机器学习中被广泛应用,能够帮助我们通过观测数据来估计模型参数,从而进行预测和推断。
极大似然估计法步骤极大似然估计法(Maximum Likelihood Estimation,MLE)是一种常用的参数估计方法,它利用样本数据来估计概率模型的参数。
它的基本思想是选择参数值使得观测到的样本出现的概率最大化。
极大似然估计法被广泛应用于统计学、机器学习以及其他领域。
极大似然估计法的步骤可以概括为以下几个主要步骤:1.确定参数化模型:首先,必须确定概率模型的形式和参数化,以便进行参数估计。
例如,对于二项分布模型,我们需要确定参数p 表示成功概率。
2.构建似然函数:接下来,需要构建似然函数。
似然函数是指在给定模型参数条件下观测到的样本的条件概率密度(或离散情况下的概率质量函数)。
似然函数的形式可以根据不同的概率模型进行定义。
例如,对于离散情况下的伯努利分布,似然函数可以表示为:L(p) = p^k * (1-p)^(n-k),其中k是观测到的成功次数,n是总的观测次数。
对于连续情况下的正态分布,似然函数可以表示为:L(μ,σ) = (2πσ^2)^(-n/2) * exp[-(1/2σ^2) * Σ(xi-μ)^2]。
3.对数似然函数的求解:通常,为了便于计算和优化,我们会使用对数似然函数进行求解。
对数似然函数和似然函数具有相同的最大值点,但其大大简化了计算过程。
4.最大化对数似然函数:确定参数的MLE估计值等于使得对数似然函数最大化时的参数值。
常见的最大化方法包括数值方法(如牛顿法、梯度下降法等)和解析方法。
对于某些简单的模型,可以通过求导数等条件判断来获得解析解。
例如,对于伯努利分布中的参数p,可以通过求取对数似然函数的一阶导数,并令其等于0,解得MLE估计值为p = k/n。
5.参数估计:得到MLE估计值后,就可以根据估计参数进行进一步的分析和预测了。
通常,MLE估计值具有良好的频率特性,即当样本数量趋近于无穷大时,估计值收敛到真实参数。
极大似然估计法的优点在于其较好的性质和理论基础。