计量经济学基础-非线性回归模型
- 格式:doc
- 大小:537.50 KB
- 文档页数:6
第四章 非线性回归模型的线性化以上介绍了线性回归模型。
但有时候变量之间的关系是非线性的。
例如 y t = α 0 + α11βt x + u t y t = α 0 t x e 1α+ u t上述非线性回归模型是无法用最小二乘法估计参数的。
可采用非线性方法进行估计。
估计过程非常复杂和困难,在20世纪40年代之前几乎不可能实现。
计算机的出现大大方便了非线性回归模型的估计。
专用软件使这种计算变得非常容易。
但本章不是介绍这类模型的估计。
另外还有一类非线性回归模型。
其形式是非线性的,但可以通过适当的变换,转化为线性模型,然后利用线性回归模型的估计与检验方法进行处理。
称此类模型为可线性化的非线性模型。
下面介绍几种典型的可以线性化的非线性模型。
4.1 可线性化的模型⑴ 指数函数模型y t = t t ubx ae + (4.1)b >0 和b <0两种情形的图形分别见图4.1和4.2。
显然x t 和y t 的关系是非线性的。
对上式等号两侧同取自然对数,得Lny t = Lna + b x t + u t (4.2)令Lny t = y t *, Lna = a *, 则y t * = a * + bx t + u t (4.3) 变量y t * 和x t 已变换成为线性关系。
其中u t 表示随机误差项。
010203040501234XY 1图4.1 y t =tt u bx ae+, (b > 0) 图4.2 y t =tt u bx ae+, (b < 0)⑵ 对数函数模型y t = a + b Ln x t + u t (4.4)b >0和b <0两种情形的图形分别见图4.3和4.4。
x t 和y t 的关系是非线性的。
令x t * = Lnx t , 则y t = a + b x t * + u t (4.5)变量y t 和x t * 已变换成为线性关系。
图4.3 y t = a + b Lnx t + u t , (b > 0) 图4.4 y t = a + b Lnx t + u t , (b < 0)⑶ 幂函数模型y t = a x t b t u e (4.6)b 取不同值的图形分别见图4.5和4.6。
非线性回归模型概述在统计学和机器学习领域,回归分析是一种重要的数据分析方法,用于研究自变量和因变量之间的关系。
在实际问题中,很多情况下自变量和因变量之间的关系并不是简单的线性关系,而是呈现出复杂的非线性关系。
为了更准确地描述和预测这种非线性关系,非线性回归模型应运而生。
一、非线性回归模型的基本概念非线性回归模型是指因变量和自变量之间的关系不是线性的数学模型。
在非线性回归模型中,因变量的取值不仅仅是自变量的线性组合,还可能包括自变量的非线性函数,如平方项、指数项、对数项等。
因此,非线性回归模型可以更灵活地拟合各种复杂的数据模式。
二、常见的非线性回归模型1. 多项式回归模型:多项式回归是一种简单而常用的非线性回归模型,通过增加自变量的高次项来拟合数据的非线性关系。
例如,二次多项式回归模型可以表示为:Y = β0 + β1X + β2X^2 + ε,其中X^2为自变量X的平方项。
2. 对数回归模型:对数回归模型适用于因变量和自变量之间呈现出对数关系的情况。
通过对自变量或因变量取对数,将非线性关系转化为线性关系进行建模。
3. 指数回归模型:指数回归模型适用于因变量和自变量之间呈现出指数关系的情况。
通过对自变量或因变量取指数,将非线性关系转化为线性关系进行建模。
4. 幂函数回归模型:幂函数回归模型是一种常见的非线性回归模型,适用于因变量和自变量之间呈现出幂函数关系的情况。
例如,Y =β0X^β1 + ε,其中β1为幂函数的指数。
三、非线性回归模型的优缺点1. 优点:(1)能够更准确地描述和预测复杂的非线性关系;(2)具有较强的灵活性,可以适应各种数据模式;(3)能够提高模型的拟合度和预测准确性。
2. 缺点:(1)相较于线性回归模型,非线性回归模型通常更复杂,需要更多的参数估计;(2)容易出现过拟合问题,需要谨慎选择模型复杂度;(3)对数据的要求较高,需要充分理解数据背后的非线性关系。
四、非线性回归模型的应用领域非线性回归模型在各个领域都有着广泛的应用,特别是在生物学、经济学、工程学、医学等领域。
中级计量经济学讲义_第九章非线性回归模型第九章非线性回归模型回归模型的一般形式是i i i x h y εβ+=),( (1)很明显,线性模型只是一种特殊情况,我们应该讨论更一般的模型(1)。
例如,εβββ++=x e y 321 (2)不能变换到线性形式。
1 线性化回归非线性回归模型是εβ+=),(x h y(为简化记号,我们去掉了观测值的下标)非线性回归模型的许多结果是基于在参数向量的一个特定值0β处(如由经验得到的数据时)对),(βx h 的一个线性泰勒级数来近似:)(),(),(),(000k k kkx h x h x h ββββββββ-??+?=∑(3)这被称为线性化回归模型。
整理各项可得),(),(),(),(00ββββββββββββ==∑∑??+??-?kkkkkk x h x h x h x h令0~k x 等于第k 个偏微分0/),(k x h ββ??。
对于0β的一个给定值,这0~k x 是数据而不是含未知参数的函数。
于是∑∑+-?k k kk k x x h x h βββ0000~]~[),(ββ'+'-=0000~~x x h或εββ+'+'-?0000~~x x h y把已知项移到方程左边,可得回归模型:εββ+'='+-=0000~~~x x h y y (4)有了0β值,我们就可以计算0~~x y 和并通过线性最小二乘法估计(4)中的参数。
然后,进行再次的迭代和回归,直至收敛和满足我们的精度要求。
[例] 对于(2)所给的非线性回归模型,线性化方程中的回归量是,(.)~,1(.)~03202101x e h x h x βββ=??==??=x xe h x 0302303(.)~βββ=??=有了一组参数0β0303020201010302010~~~),,,(~x x x x h y y ββββββ+++-= 可以对前面为估计321,βββ和而定义的三个变量进行回归。
非线性回归模型概述非线性回归模型是一种用于建立非线性关系的统计模型,它可以用来描述自变量和因变量之间的复杂关系。
与线性回归模型相比,非线性回归模型可以更准确地拟合非线性数据,并提供更准确的预测结果。
在本文中,我们将对非线性回归模型进行概述,包括其基本原理、常见的非线性回归模型以及应用案例。
一、非线性回归模型的基本原理非线性回归模型的基本原理是通过拟合非线性函数来描述自变量和因变量之间的关系。
与线性回归模型不同,非线性回归模型的函数形式可以是任意的非线性函数,例如指数函数、对数函数、幂函数等。
通过最小化残差平方和来确定模型的参数,使得模型的预测值与观测值之间的差异最小化。
二、常见的非线性回归模型1. 多项式回归模型多项式回归模型是一种常见的非线性回归模型,它通过多项式函数来拟合数据。
多项式回归模型的函数形式为:y = β0 + β1x + β2x^2 + ... + βnx^n其中,y是因变量,x是自变量,β0、β1、β2...βn是模型的参数,n是多项式的阶数。
通过最小二乘法来估计模型的参数,可以得到最佳的拟合曲线。
2. 对数回归模型对数回归模型是一种常用的非线性回归模型,它通过对数函数来拟合数据。
对数回归模型的函数形式为:y = β0 + β1ln(x)其中,y是因变量,x是自变量,β0、β1是模型的参数。
对数回归模型适用于自变量和因变量之间呈现指数增长或指数衰减的情况。
3. 指数回归模型指数回归模型是一种常见的非线性回归模型,它通过指数函数来拟合数据。
指数回归模型的函数形式为:y = β0e^(β1x)其中,y是因变量,x是自变量,β0、β1是模型的参数。
指数回归模型适用于自变量和因变量之间呈现指数增长或指数衰减的情况。
三、非线性回归模型的应用案例非线性回归模型在实际应用中具有广泛的应用领域,以下是一些常见的应用案例:1. 生物学研究非线性回归模型在生物学研究中被广泛应用,例如用于描述生物体的生长曲线、药物的剂量-反应关系等。
以上介绍了线性回归模型.但有时候变量之间地关系是非线性地.例如y t = 0 + 1+ u ty t = 0 + u t上述非线性回归模型是无法用最小二乘法估计参数地.可采用非线性方法进行估计.估计过程非常复杂和困难,在20世纪40年代之前几乎不可能实现.计算机地出现大大方便了非线性回归模型地估计.专用软件使这种计算变得非常容易.但本章不是介绍这类模型地估计.文档收集自网络,仅用于个人学习另外还有一类非线性回归模型.其形式是非线性地,但可以通过适当地变换,转化为线性模型,然后利用线性回归模型地估计与检验方法进行处理.称此类模型为可线性化地非线性模型.下面介绍几种典型地可以线性化地非线性模型.文档收集自网络,仅用于个人学习4.1 可线性化地模型⑴指数函数模型y t= (4.1)文档收集自网络,仅用于个人学习b>0 和b<0两种情形地图形分别见图 4.1和4.2.显然x t和y t地关系是非线性地.对上式等号两侧同取自然对数,得文档收集自网络,仅用于个人学习Lny t = Lna + b x t + u t(4.2)文档收集自网络,仅用于个人学习令Lny t = y t*, Lna = a*, 则y t* = a* + bx t + u t(4.3)文档收集自网络,仅用于个人学习变量y t* 和x t已变换成为线性关系.其中u t表示随机误差项.图4.1 y t=, (b > 0) 图4.2 y t=, (b < 0)文档收集自网络,仅用于个人学习⑵对数函数模型y t = a + b Ln x t+ u t(4.4)文档收集自网络,仅用于个人学习b>0和b<0两种情形地图形分别见图 4.3和4.4.x t和y t地关系是非线性地.令x t* = Lnx t, 则文档收集自网络,仅用于个人学习y t = a + b x t* + u t(4.5)文档收集自网络,仅用于个人学习变量y t和x t* 已变换成为线性关系.图4.3 y t = a + b Lnx t + u t , (b > 0) 图4.4 y t = a + b Lnx t + u t , (b < 0)文档收集自网络,仅用于个人学习⑶幂函数模型y t= a x t b(4.6)文档收集自网络,仅用于个人学习b取不同值地图形分别见图 4.5和4.6.x t和y t地关系是非线性地.对上式等号两侧同取对数,得Lny t = Lna + b Lnx t + u t(4.7)文档收集自网络,仅用于个人学习令y t* = Lny t, a* = Lna, x t* = Lnx t, 则上式表示为y t* = a* + b x t* + u t(4.8)文档收集自网络,仅用于个人学习变量y t* 和x t* 之间已成线性关系.其中u t表示随机误差项.(4.7) 式也称作全对数模型.图4.5 y= a x t b图4.6 y t = a x t b文档收集自网络,仅用于个人学习t⑷双曲线函数模型1/y t= a+ b/x t+ u t(4.9)文档收集自网络,仅用于个人学习也可写成,y t = 1/ (a + b/x t+ u t) (4.10)文档收集自网络,仅用于个人学习b>0情形地图形见图 4.7.x t和y t地关系是非线性地.令y t* = 1/y t, x t* = 1/x t,得文档收集自网络,仅用于个人学习y t* = a + b x t* + u t已变换为线性回归模型.其中u t表示随机误差项.图4.7 y t = 1/ (a + b/x t ), (b > 0) 图4.8 y t = a + b/x t , (b > 0)文档收集自网络,仅用于个人学习双曲线函数还有另一种表达方式,y t = a + b/x t + u t(4.11)文档收集自网络,仅用于个人学习b>0情形地图形见图 4.8.x t和y t地关系是非线性地.令x t* = 1/x t,得y t = a + b x t* + u t上式已变换成线性回归模型.例 4.2(P139,例3.5⑸多项式方程模型一种多项式方程地表达形式是y t = b0 +b1 x t + b2 x t2 + b3 x t3 + u t(4.12)文档收集自网络,仅用于个人学习其中b1>0, b2>0, b3>0和b1<0, b2>0, b3<0情形地图形分别见图 4.9和4.10.令x t 1 = x t,x t 2 = x t2,x t 3 = x t3,上式变为文档收集自网络,仅用于个人学习y t = b0 +b1 x t 1 + b2 x t 2 + b3 x t 3 + u t(4.13)文档收集自网络,仅用于个人学习这是一个三元线性回归模型.如经济学中地总成本曲线与图 4.9相似.图4.9 y t = b0 +b1 x t + b2 x t2 + b3 x t3 + u t图4.10 y t = b0 + b1 x t + b2 x t2 + b3 x t3 + u t文档收集自网络,仅用于个人学习另一种多项式方程地表达形式是y t = b0 + b1 x t + b2 x t2 + u t(4.14)文档收集自网络,仅用于个人学习其中b1>0, b2>0和b1<0, b2<0情形地图形分别见图 4.11和4.12.令x t 1 = x t,x t 2 = x t 2,上式线性化为,文档收集自网络,仅用于个人学习y t = b0 + b1 x t1 + b2 x t2 + u t(4.15)文档收集自网络,仅用于个人学习如经济学中地边际成本曲线、平均成本曲线与图 4.11相似.图4.11 y t = b0 +b1x t + b2x t2 + u t图4.12 y t = b0 + b1x t + b2x t2 + u t文档收集自网络,仅用于个人学习例4.3(P141例3.6)⑹生长曲线(logistic) 模型y t = (4.16)一般f(t) = a0 + a1 t + a2 t 2 + … + a n t n,常见形式为f(t) = a0 - a t文档收集自网络,仅用于个人学习y t = = (4.17)其中b = .a > 0情形地图形分别见图 4.13和4.14.美国人口统计学家Pearl和Reed广泛研究了有机体地生长,得到了上述数学模型.生长模型(或逻辑斯谛曲线,Pearl-Reed 曲线)常用于描述有机体生长发育过程.其中k和0分别为y t地生长上限和下限.= k, = 0.a, b为待估参数.曲线有拐点,坐标为(,),曲线地上下两部分对称于拐点.文档收集自网络,仅用于个人学习图4.13 y t = k / (1 +) 图4.14 y t = k / (1 +)文档收集自网络,仅用于个人学习为能运用最小二乘法估计参数a, b,必须事先估计出生曲线长上极限值k.线性化过程如下.当k给出时,作如下变换,文档收集自网络,仅用于个人学习k/y t = 1 +移项,k/y t - 1 =取自然对数,Ln ( k/y t - 1) = Lnb - a t + u t(4.18)文档收集自网络,仅用于个人学习令y t* = Ln ( k/y t - 1), b* = Lnb, 则y t* = b* - a t + u t(4.19)文档收集自网络,仅用于个人学习此时可用最小二乘法估计b*和a.图4.15 内地5月1日至28日每天非典数据一览⑺龚伯斯(Gompertz)曲线英国统计学家和数学家最初提出把该曲线作为控制人口增长地一种数学模型,此模型可用来描述一项新技术,一种新产品地发展过程.曲线地数学形式是,文档收集自网络,仅用于个人学习y t=图4.15 y t =曲线地上限和下限分别为k和0,= k, = 0.a, b为待估参数.曲线有拐点,坐标为(,),但曲线不对称于拐点.一般情形,上限值k可事先估计,有了k值,龚伯斯曲线才可以用最小二乘法估计参数.线性化过程如下:当k给定时,文档收集自网络,仅用于个人学习y t / k = ,k/y t =Ln (k/y t) = ,Ln[Ln(k/y t)] = Lnb - a t令y*= Ln[Ln(k/y t)], b* = Lnb,则y* = b* - a t上式可用最小二乘法估计b* 和 a.⑻Cobb-Douglas生产函数下面介绍柯布-道格拉斯(Cobb-Douglas)生产函数.其形式是Q = k L C 1- (4.24)文档收集自网络,仅用于个人学习其中Q表示产量;L表示劳动力投入量;C表示资本投入量;k是常数;0 < < 1.这种生产函数是美国经济学家柯布和道格拉斯根据1899-1922年美国关于生产方面地数据研究得出地.地估计值是0.75,地估计值是0.25.更习惯地表达形式是文档收集自网络,仅用于个人学习y t = (4.25)这是一个非线性模型,无法用OLS法直接估计,但可先作线性化处理.上式两边同取对数,得:Lny t = Ln0 + 1 Lnx t 1+ 2 Lnx t 2 + u t(4.26)文档收集自网络,仅用于个人学习取y t* =Lny t, 0* = Ln 0, x t 1* = Ln x t 1, x t 2*= Ln x t 2,有文档收集自网络,仅用于个人学习y t*= 0* + 1 x t 1* + 2 x t 2* + u t(4.27)文档收集自网络,仅用于个人学习上式为线性模型.用OLS法估计后,再返回到原模型.若回归参数1 +2 = 1,称模型为规模报酬不变型(新古典增长理论);1 +2 > 1,称模型为规模报酬递增型;1 +2 < 1,称模型为规模报酬递减型.对于对数线性模型,Lny = Ln0 + 1 Lnx t1+ 2 Lnx t2 + u t,1和2称作弹性系数.以1为例,文档收集自网络,仅用于个人学习1 = = = = (4.28)可见弹性系数是两个变量地变化率地比.注意,弹性系数是一个无量纲参数,所以便于在不同变量之间比较相应弹性系数地大小.文档收集自网络,仅用于个人学习对于线性模型,y t = 0 + 1x t1 + 2 x t2 + u t ,1和2称作边际系数.以1为例,文档收集自网络,仅用于个人学习1= (4.29)文档收集自网络,仅用于个人学习通过比较(4.28)和(4.29)式,可知线性模型中地回归系数(边际系数)是对数线性回归模型中弹性系数地一个分量.文档收集自网络,仅用于个人学习例4.1 (136P例3.4)略4.2非线性化模型地处理方法模型:无论通过什么变换都不可能实现线性化,对于这种模型称为非线性化模型.可采用高斯—牛顿迭代法进行估计,即将其展开泰勒级数后,再进行迭代估计方法进行估计.文档收集自网络,仅用于个人学习1、迭代估计法思想是:通过泰勒级数展开,先使非线性方程在某组初始参数估计值附近线性化,然后对这一线性方程应用OLS法,得出一组新地参数估计值.下一步是使非线性方程在新参数估计值附近线性化,对新地线性方程再应用OLS法,又得出一组新地参数估计值.不断重复上述过程,直至参数估计值收敛时为止.其步骤如下.文档收集自网络,仅用于个人学习1)对模型:在给定地参数初始值b10,b20…b p0展开泰勒级数:取前两项,便有线性近似:2)将上式左端看成组新地因变量,将右端看成一组新地自变量,这就已经成为标准线性模型,再对其就用OLS法,得出一组估计值.文档收集自网络,仅用于个人学习3)重复第一、二步,在参数估计值附近再做一次泰勒级数展开,得到新地线性模型,应用OLS法,又得出一组参数估计值:.文档收集自网络,仅用于个人学习4)如此反复,得出一组点序列直到其收敛为止.2、迭代估计法地EViews实现过程1)设定代估参数地初始值,方法有两种:A、使用Param命令设定,例如,Param 1 0.5 2 0 3 0 则将待估地三个参数地初始值设成了0.5,0,0.B、在工作文件窗口中双击序列C,并在序列窗口直接输入参数地初始值.2)估计参数A、命令方式在命令窗口可以直接键入非线性模型地迭代估计命令NLS.格式为:NLS 被解释变量,=非线性函数表达式例如,对于非线性回归模型估计命令为NLS y=c(1)*(x-c(2))/(x-c(3))B、菜单方式.在数组窗口“procs→make epuation;在弹出地方程描述对话框中输入非线性回归模型地具体形式;y=c(1)*(x-c(2))/(x-c(3))选择估计方法为最小二乘法后单击(OK)例(P146例3.7) 略4.3回归模型地比较当经济变量呈现非线性关系时,经常可以采用多个不同数学形式地非线性模型.如何选择?1、图开观察分析1)观察被解释变量和解释变量地趋势图.2)观察被解释变量和解释变量地相关图2、模型估计结果分析1)回归系数符号和大小是否符合经济意义,2)改变模型后,是否使决定系数地值明显提高.3)T检验与F检验.3、残差分析残差反映了模型未能解释部分地变化情况.1)残差分布表中,各期残差是否大都落在地虚线内.2)残差分布是否具有某种规律性.3)近期地残差分析情况.例1:此模型用来评价台湾农业生产效率.用台湾1958-1972年农业生产总值(y t),劳动力(x t1),资本投入(x t2)数据(见表 4.1)为样本得估计模型,文档收集自网络,仅用于个人学习= -3.4 + 1.50 Lnx t1 + 0.49 Lnx t2(4.30)文档收集自网络,仅用于个人学习(2.78) (4.80) R2 = 0.89, F = 48.45还原后得,= 0.713 x t11.50x t20.49(4.31)文档收集自网络,仅用于个人学习因为1.50 + 0.49 = 1.99,所以,此生产函数属规模报酬递增函数.当劳动力和资本投入都增加1%时,产出增加近2%.文档收集自网络,仅用于个人学习例2:用天津市工业生产总值(Y t),职工人数(L t),固定资产净值与流动资产平均余额(K t)数据(1949-1997) 为样本得估计模型如下:文档收集自网络,仅用于个人学习Ln Y t = 0.7272 + 0.2587Ln L t + 0.6986 LnK t(3.12) (3.08) (18.75)R2 = 0.98, s.e. = 0.17, DW = 0.42, F = 1381.4因为0.2587 + 0.6986 = 0.9573,所以此生产函数基本属于规模报酬不变函数.例3:硫酸透明度与铁杂质含量地关系(摘自《数理统计与管理》1988.4, p.16)某硫酸厂生产地硫酸地透明度一直达不到优质指标.经分析透明度低与硫酸中金属杂质地含量太高有关.影响透明度地主要金属杂质是铁、钙、铅、镁等.通过正交试验地方法发现铁是影响硫酸透明度地最主要原因.测量了47个样本,得硫酸透明度(y)与铁杂质含量(x)地散点图如下(file:nonli01):文档收集自网络,仅用于个人学习(1)y = 121.59 - 0.91 x(10.1) (-5.7)R2 = 0.42, s.e. = 36.6, F= 32 (2)1/y = 0.069 - 2.37 (1/x)(18.6) (-11.9)R2 = 0.76, s.e. = 0.009, F= 142(3)y = -54.40 + 6524.83 (1/x)(-7.2) (16.3)R2 = 0.86, s.e. = 18.2, F= 266 (4)Lny = 1.99 + 104.5 (1/x)(22.0) (21.6)R2 = 0.91, s.e. = 0.22, F= 468 还原,Lny = Ln(7.33) + 104.5 (1/x)y = 7.33(5)非线性估计结果是y = 8.2965R2 = 0.96,EViews命令Y=C(1)*EXP(C(2)*(1/X)) 例4 中国铅笔需求预测模型(非线性模型案例,file:nonli6)中国从上个世纪30年代开始生产铅笔.1985年全国有22个厂家生产铅笔.产量居世界首位(33.9亿支),占世界总产量地1/3.改革开放以后,铅笔生产增长极为迅速.1979-1983年平均年增长率为8.5%.铅笔销售量时间序列见图 4.21.1961-1964年地销售量平稳状态是受到了经济收缩地影响.文革期间销售量出现两次下降,是受到了当时政治因素地影响.1969-1972年地增长是由于一度中断了地中小学教育逐步恢复地结果.1977-1978年地增长是由于高考正式恢复地结果.1981年中国开始生产自动铅笔,对传统铅笔市场冲击很大.1979-1985年地缓慢增长是受到了自动铅笔上市地影响.文档收集自网络,仅用于个人学习初始确定地影响铅笔销量地因素有全国人口、各类在校人数、设计人员数、居民消费水平、社会总产值、自动铅笔产量、价格因素、原材料供给量、政策因素等.经过多次筛选、组合和逐步回归分析,最后确定地被解释变量是y t(铅笔年销售量,千万支);解释变量分别是x t1(自动铅笔年产量,百万支);x t2(全国人口数,百万人);x t3(居民年均消费水平,元);x t4(政策变量).因政策因素影响铅笔销量出现大幅下降时,政策变量取负值.例如1967、1968年地x t4值取-2,1966、1969-1971、1974-1977年地x t4值取-1).文档收集自网络,仅用于个人学习由图4.22知中国自生产自动铅笔起,自动铅笔产量与铅笔销量存在线性关系.由图4.23知全国人口与铅笔销量存在线性关系.说明人口越多,对铅笔地需求就越大.由图4.24知居民年均消费水平与铅笔销量存在近似对数地关系.散点图说明居民年均消费水平越高,则铅笔销量就越大.但这种增加随着居民消费水平地增加变得越来越缓慢.图4.25显示政策变量与铅笔销量也呈线性关系.文档收集自网络,仅用于个人学习铅笔销售量时间序列(1961-1985)(文件名nonli6)Y, X1散点图Y, X2散点图Y, X3散点图Y, X4散点图文档收集自网络,仅用于个人学习基于上述分析建立地模型形式是y t = 0 + 1 x t 1 + 2x t 2 + 3Ln (x t 3) + 4 x t 4 + u t(4.40)文档收集自网络,仅用于个人学习y t与x t 3呈非线性关系.估计结果如下.= -907.94 - 2.95x t 1 + 0.31 x t 2 + 170.19 Ln x t 3 + 45.51 x t 4(4.41)文档收集自网络,仅用于个人学习(-6.4) (-3.7) (4.8) (4.4) (12.6)R 2 = 0.9885, DW = 2.09, F = 429, s.e. = 10.34上式说明,在上述期间自动铅笔年产量每增加1百万支,平均使铅笔地年销售量减少2950万支.全国人口数每增加1百万人,平均使铅笔地年销售量增加310万支.对数地居民年均消费水平每增加1个单位,平均使铅笔地年销售量增加17亿支.一般性政策负面变动使铅笔地年销售量减少 4.551亿支.当政策出现大地负面变动时,铅笔地年销量会减少9.102亿支.文档收集自网络,仅用于个人学习当y t对所有变量都进行线性回归时(见下式),显然估计结果不如(4.41)式好.= -254.26 - 3.29x t 1 + 0.42 x t 2 + 0.66 x t 3 + 40.74 x t 4(4.42)文档收集自网络,仅用于个人学习(-12.0) (-3.0) (8.6) (3.5) (11.7)R 2 = 0.9857, DW = 1.77, F = 346, s.e. = 11.5案例5:厦门市贷款总额与GDP地关系分析(1990~2003,file:bank08)数据和散点图如下.从散点图看,用多项式方程拟合比较合理.Loan t = 0 + 1 GDP t + 2 GDP t2+3 x t 3+ u tt = -24.5932 +1.6354GDP t - 0.0026GDP t 2 + 0.0000027GDP t 3文档收集自网络,仅用于个人学习(-2.0) (11.3)(-6.3) (7.9)R 2=0.9986, DW=2.6例6钉螺存活率曲线(file:nonli3)(生长曲线模型)在冬季土埋钉螺地研究中,先把一批钉螺埋入土中,以后每隔一个月取出部分钉螺,检测存活个数,计算存活率.数据见表4.3.散点图见图 4.20.文档收集自网络,仅用于个人学习y t ,存活率(%)t,土埋月数100.0 0 93.0 1 92.3 2 88.0 3 84.7 4 82.0 5 48.4 6 41.0 7 15.0 8 5.2 9 3.5 10 1.3 11 0.512设定y t 地上渐近极限值k =101(因为已有观测值y t =100,所以令k =101更好些.),得估计结果如下:文档收集自网络,仅用于个人学习估计式是:= -4.3108 + 0.7653 t(4.38)文档收集自网络,仅用于个人学习(-14.8)(18.5)R 2= 0.97因为log (0.013) = -4.3108,所以b = 0.013.则逻辑函数地估计结果是= (4.39)当t =10.5时,= = 2.38YYF 100.0 99.66 93.0 98.17 92.3 95.10 88.0 89.12 84.7 78.50 82.0 62.50 48.4 43.45 41.0 26.26 15.0 14.19 5.20 7.14 3.503.451.30 1.63 0.50 0.77版权申明本文部分内容,包括文字、图片、以及设计等在网上搜集整理。
第四节 非线形回归模型
一、 可线性化模型
在非线性回归模型中,有一些模型经过适当的变量变换或函数变换就可以转化成线性回归模型,从而将非线性回归模型的参数估计问题转化成线性回归模型的参数估计,称这类模型为可线性化模型。
在计量经济分析中经常使用的可线性化模型有对数线性模型、半对数线性模型、倒数线性模型、多项式线性模型、成长曲线模型等。
1.倒数模型
我们把形如:
u x
b b y ++=110;u x b b y ++=1110 (3.4.1) 的模型称为倒数(又称为双曲线函数)模型。
设:x
x 1*=,y y 1*=,即进行变量的倒数变换,就可以将其转化成线性回归模型。
倒数变换模型有一个明显的特征:随着x 的无限扩大,y 将趋于极限值0b (或0/1b ),即有一个渐进下限或上限。
有些经济现象(如平均固定成本曲线、商品的成长曲线、恩格尔曲线、菲利普斯曲线等)恰好有类似的变动规律,因此可以由倒数变换模型进行描述。
2.对数模型
模型形式:
u x b b y ++=ln ln 10 (3.4.2)
(该模型是将u
b e Ax y 1=两边取对数,做恒等变换的另一种形式,其中A b ln 0=)。
上式lny 对参数0b 和1b 是线性的,而且变量的对数形式也是线性的。
因此,我们将以上模型称为双对数(double-log)模型或称为对数一线性(log-liner)模型。
令:x x y y ln ,ln **==代入模型将其转化为线性回归模型: u x b b y ++=*10* (3.4.3)
变换后的模型不仅参数是线性的,而且通过变换后的变量间也是线性的。
模型特点:斜率1b 度量了y 关于x 的弹性:
x
dx y dy x d y d b //)(ln )(ln 1== (3.4.4) 它表示x 变动1%,y 变动了多少,即变动了1b %。
模型适用对象:对观测值取对数,将取对数后的观测值(lnx ,lny )描成散点图,如果近似为一条直线,则适合于对数线性模型来描述x 与y 的变量关系。
容易推广到模型中存在多个解释变量的情形。
例如,柯布——道格拉斯生产函数形式:
u e K AL Q βα=
式中:Q ——产出量,K ——资本投入量,L ——劳动投入量,A ,βα,为未知参数。
对于这样的非线性模型,可以通过对数变换,使之线性化。
对上式两边取对数得到如下模型:
u K L A Q +++=ln ln ln ln βα
再令:L L Q Q ln ,ln **==,K K A A ln ,ln *
*==,得到线性模型: u K L A Q +++=βα**
模型中的α、β分别为劳动、资本的产出弹性:
L dL Q dQ L d Q d //)(ln )(ln ==
α;K
dK Q dQ K d Q d //)(ln )(ln ==β 3.半对数模型 在对经济变量的变动规律研究中,测定其增长率或衰减率是一个重要方面。
在回归分析中,我们可以用半对数模型来测度这些增长率。
模型形式:
u x b b y ++=ln 10 (对数--线性模型) (3.4.5)
u x b b y ++=10ln (线性--对数模型) (3.4.6)
模型特点:半对数模型中的回归系数也有很直观的含义:对数--线性模型中,
x
dx dy x d dy b /)(ln 1== (3.4.7) 表示x 每变动1%时,y 将变动的绝对量,即变动b%个单位。
线性——对数模型中,
dx
y dy dx y d b /)(ln 1== (3.4.8) 它表示x 每变动1个单位时,y 将变动的百分比,即变动100b %。
特别地,若x 为时间变量(年份),则系数1b 衡量了y 的年均增长速度。
正因为如此,所以半对数模型又称为增长模型。
模型适用范围:当x 变动一个相对量时,y 以一个固定的绝对量随之变动,可用(3.4.7)式来描述;当x 变动一个绝对量时,y 以一个固定的相对量随之变动,适宜用(3.4.8)式来描述。
例如,我们可以通过估计下面的半对数模型:
t t u t b b GDP ++=10)ln(
得到我国GDP 的年增长率的估计值,这里t 为时间趋势变量。
4.多项式模型
多项式回归模型在生产与成本函数这个领域中被广泛地使用。
多项式回归模型可表示为
u x b x b x b b y k k +++++= 2210 (3.4.9)
设:),2,1(k t x x t t ==,则
u x b x b x b b y k k +++++= 22110 (3.4.10)
模型转化成多元线性回归模型
例:为了分析某行业的生产成本情况,从该行业中选取了10家企业,下表中列出了这些企业总产量y(吨)和总成本x (万元)的有关资料,试建立该行业的总成本函数和边际成本函数。
某行业产量与总成本统计资料 总成本y 总产量x
19.3
10 22.6
20 24.0
30 24.4
40 25.7
50 26.0 60
27.4 70
29.7 80
35.0 90
42.0 100
根据边际成本的U 型曲线理论,总成本函数可以用产量的三次多项式近似表示,即
u x b x b x b b y ++++=332210
设:)3,2,1(==t x x t t ,则将其转化为三元线性回归模型。
在EViews 软件的命令窗口,
依次键入:
GENR X1=X
GENR 22∧=X X
GENR 33∧=X X
LS Y C X1 X2 X3
回归结果如下:
回归结果
得到总成本函数的估计式为
32000094.0012962.0634777.017667.14ˆx x x y
+-+= s = (0.637532) (0.047786) (0.000986) (0.00000591)
t = (22.23678) (13.28372) (-13.15005) (15.89677)
998339.02=R 997509.02=R 328491.0.=E S 00212.2=DW 220
.1202=F
对总成本函数求导数,得到边际成本函数的估计式为
2000272.0025934.0634777.0ˆx x dx
y d +-= 因此,当产量低于0.025934/(2⨯0.000272)=47.673(吨)时,边际成本是递减的;而产量超过这个水平时,边际成本又呈上升趋势。
二、 非线性化模型的处理方法
无论通过什么变换都不可能实现线性化,这样的模型称为非线性化模型。
对于非线性化模型,一般采用高斯——牛顿迭代法进行估计,即将其展开成泰勒级数之后,再利用迭代估计方法进行估计。
三、 回归模型的比较
当经济变量之间呈现非线性关系时,如何选择一个比较合适的模型,比较模型的优劣?这就是回归模型的比较问题。
1.图形观察分析
(1)观察被解释变量和解释变量的趋势图。
(2)观察被解释变量与解释变量的相关图。
2.模型估计结果观察分析
对于每个模型的估计结果,可以依次观察以下内容:
(1)回归系数的符号和值的大小是否符合经济意义,这是对所估计模型的最基本要求。
(2)改变模型形式之后是否使判定系数的值明显提高。
(3)各个解释变量t 检验的显著性。
(4)系数的估计误差较小。
3.残差分布观察分析
模型的残差反映了模型未能解释部分的变化情况,可以观察分析以下内容:
(1)残差分布表中,各期残差是否大都落在±σ
ˆ的虚线框内,这直观地反映了模型拟合误差的大小及变化情况。
(2)残差分布是否具有某种规律性,即是否存在着系统误差(模型形式有误或漏掉了重要的解释变量)
(3)近期残差的分布情况:近期误差越小越好。
4.利用判定系数比较模型的拟合优度时,如果两个模型包含的解释变量个数不同,则应采用“调整的判定系数”。
5.人们还使用另外两个指标SC (Schwarz Criterion ,施瓦兹准则)和AIC(Akaike lnformation Criterion ,赤池信息准则)来比较含有不同解释变量个数模型的拟合优度。
)ln(1]ln[2n n
k n e SC t ++∑= (3.4.11) n
k n e AIC t )1(2]ln[2++∑= (3.4.12) 显然,其值越小,表明模型的的拟合优度越高。
感谢您的支持与配合,我们会努力把内容做得更好!。