04非线性回归模型的线性化 (3)
- 格式:docx
- 大小:259.33 KB
- 文档页数:12
第四节 非线形回归模型一、 可线性化模型在非线性回归模型中,有一些模型经过适当的变量变换或函数变换就可以转化成线性回归模型,从而将非线性回归模型的参数估计问题转化成线性回归模型的参数估计,称这类模型为可线性化模型。
在计量经济分析中经常使用的可线性化模型有对数线性模型、半对数线性模型、倒数线性模型、多项式线性模型、成长曲线模型等。
1.倒数模型我们把形如:u xb b y ++=110;u x b b y ++=1110 (3.4.1) 的模型称为倒数(又称为双曲线函数)模型。
设:xx 1*=,y y 1*=,即进行变量的倒数变换,就可以将其转化成线性回归模型。
倒数变换模型有一个明显的特征:随着x 的无限扩大,y 将趋于极限值0b (或0/1b ),即有一个渐进下限或上限。
有些经济现象(如平均固定成本曲线、商品的成长曲线、恩格尔曲线、菲利普斯曲线等)恰好有类似的变动规律,因此可以由倒数变换模型进行描述。
2.对数模型模型形式:u x b b y ++=ln ln 10 (3.4.2)(该模型是将ub e Ax y 1=两边取对数,做恒等变换的另一种形式,其中A b ln 0=)。
上式lny 对参数0b 和1b 是线性的,而且变量的对数形式也是线性的。
因此,我们将以上模型称为双对数(double-log)模型或称为对数一线性(log-liner)模型。
令:x x y y ln ,ln **==代入模型将其转化为线性回归模型: u x b b y ++=*10* (3.4.3)变换后的模型不仅参数是线性的,而且通过变换后的变量间也是线性的。
模型特点:斜率1b 度量了y 关于x 的弹性:xdx y dy x d y d b //)(ln )(ln 1== (3.4.4) 它表示x 变动1%,y 变动了多少,即变动了1b %。
模型适用对象:对观测值取对数,将取对数后的观测值(lnx ,lny )描成散点图,如果近似为一条直线,则适合于对数线性模型来描述x 与y 的变量关系。
(整理)计量经济学第四章⾮线性回归模型的线性化第四章⾮线性回归模型的线性化以上介绍了线性回归模型。
但有时候变量之间的关系是⾮线性的。
例如 y t = α 0 + α11βt x + u t y t = α 0 t x e 1α+ u t上述⾮线性回归模型是⽆法⽤最⼩⼆乘法估计参数的。
可采⽤⾮线性⽅法进⾏估计。
估计过程⾮常复杂和困难,在20世纪40年代之前⼏乎不可能实现。
计算机的出现⼤⼤⽅便了⾮线性回归模型的估计。
专⽤软件使这种计算变得⾮常容易。
但本章不是介绍这类模型的估计。
另外还有⼀类⾮线性回归模型。
其形式是⾮线性的,但可以通过适当的变换,转化为线性模型,然后利⽤线性回归模型的估计与检验⽅法进⾏处理。
称此类模型为可线性化的⾮线性模型。
下⾯介绍⼏种典型的可以线性化的⾮线性模型。
4.1 可线性化的模型⑴指数函数模型y t = t t ubx ae + (4.1)b >0 和b <0两种情形的图形分别见图4.1和4.2。
显然x t 和y t 的关系是⾮线性的。
对上式等号两侧同取⾃然对数,得Lny t = Lna + b x t + u t (4.2)令Lny t = y t *, Lna = a *, 则y t * = a * + bx t + u t (4.3) 变量y t * 和x t 已变换成为线性关系。
其中u t 表⽰随机误差项。
010203040501234XY 1图4.1 y t =tt u bx ae+, (b > 0) 图4.2 y t =t+, (b < 0)⑵对数函数模型y t = a + b Ln x t+ u t(4.4)b>0和b<0两种情形的图形分别见图4.3和4.4。
x t和y t的关系是⾮线性的。
令x t* = Lnx t, 则y t = a + b x t* + u t(4.5)变量y t和x t* 已变换成为线性关系。
图4.3 y t = a + b Lnx t + u t , (b > 0) 图4.4 y t = a + b Lnx t + u t , (b < 0)⑶幂函数模型y t= a x t b t u e(4.6) b取不同值的图形分别见图4.5和4.6。
浅谈非线性回归模型的线性化广东省惠州市惠阳区崇雅中学高中部 卢瑞勤(516213)回归分析在各个领域中都有十分重要的作用,比如:在财务中可以用回归分析进行财务预测;在医疗检验中可以用回归分析进行病理预报等等。
高中新课标教材就在《必修3》和《选修2-3》中分别增加了《线性回归》和《回归分析》的内容,介绍了求线性回归方程的方法。
但在实际问题中,变量间的关系并非总是线性关系,本文结合本人的教学实践,对教材中的这两部分内容进行适当延伸,谈谈对一些可线性化的非线性回归模型的线性化问题,供各位同行在教学时参考。
一、什么是可线性化的非线性回归模型线性回归模型的基本特征是预报变量可以表示成解释变量和一个系数相乘的和,即预报变量y 可以表示成解释变量i x (i =1,2,3,……)的如下形式:0112233y a a x a x a x =++++,其中变量ix 是以其原型(而不是以ni x 或其它)的形式出现,变量y 是各变量i x 的线性函数。
而有些回归模型不具备这个特点,但是可以通过适当的代数变换转化成这种形式,我们称这类回归模型为可线性化的回归模型。
在本文中,我们只讨论只有一个解释变量可线性化的非线性回归模型的线性化。
二、非线性回归模型的线性化的基本思路非线性回归模线性化的基本思路是:由已知数据,确定解释变量和预报变量,作出散点图,根据经验,确定回归曲线的类型,然后作适当的代数变换,若变换后散点图体现较好的线性关系,即可将其化成线性形式求解,最后还原到原来的回归曲线。
如果回归曲线可用多种形式表示,可以各自将其线性化后求解,再用相关系数2R 进行拟合效果分析,2R 越大,拟合效果越好,所求的回归方程也就越精确。
三、非线性回归模型的线性化的常用方法可线性化的非线性回归模型有以下几种常见类型:(1)双曲线型,其形式为1a b y x =+,其变换为1y y '=, 1x x'=,变换后的形式为y b ax ''=+ (2)幂函数型,其形式为by ax = ,可以变形为ln ln ln y a b x =+,作变换ln y y '= ,ln x x '= ,变换后的形式为y a bx ''=+(3)指数函数型,其形式为bxy ae = ,以变形为ln ln y a bx =+,作变换ln y y '=,ln a a '= ,变换后的形式为y a bx ''=+(4)对数函数型,其形式为ln y a b x =+,作变换ln x x '=,变换后的形式为y a bx '=+ 下面以高中新课标数学教材《选修2-3》一道习题为例加以说明【例】在某地区的一段时间内观察到的不小于某震级x 的地震个数y 数据如下表,试建立回归方程表述二者之间的关系。
计量经济学习题含答案第1章绪论习题一、单项选择题1.把反映某一总体特征的同一指标的数据,按一定的时间顺序和时间间隔排列起来,这样的数据称为( B )A. 横截面数据B. 时间序列数据C. 面板数据D. 原始数据2.同一时间、不同单位按同一统计指标排列的观测数据称为(B )A.原始数据 B.截面数据C.时间序列数据 D.面板数据3.用计量经济学研究问题可分为以下四个阶段(B)A.确定科学的理论依据、建立模型、模型修定、模型应用B.建立模型、估计参数、检验模型、经济预测C.搜集数据、建立模型、估计参数、预测检验D.建立模型、模型修定、结构分析、模型应用4.下列哪一个模型是计量经济模型( C )A.投入产出模型B.数学规划模型C.包含随机变量的经济数学模型D.模糊数学模型二、问答题1.计量经济学的定义2.计量经济学的研究目的3.计量经济学的研究内容1.答:计量经济学是统计学、经济学、数学相结合的一门综合性学科,是一门从数量上研究物质资料生产、交换、分配、消费等经济关系和经济活动规律及其应用的科学2.答:计量经济学的研究目的主要有三个:(1)结构分析。
指应用计量经济模型对经济变量之间的关系作出定量的度量。
(2)预测未来。
指应用已建立的计量经济模型求因变量未来一段时期的预测值。
(3)政策评价。
指通过计量经济模型仿真各种政策的执行效果,对不同的政策进行比较和选择。
3.答:计量经济学在长期的发展过程中逐步形成了两个分支:理论计量经济学和应用计量经济学。
理论计量经济学主要研究计量经济学的理论和方法。
应用计量经济学将计量经济学方法应用于经济理论的特殊分支,即应用理论计量经济学的方法分析经济现象和预测经济变量。
2一元线性回归模型习题一、单项选择题1.最小二乘法是指(D)A. 使达到最小值B. 使达到最小值C. 使达到最小值D. 使达到最小值2.在一元线性回归模型中,样本回归方程可表示为(C )A. B.C. D.3.线设OLS法得到的样本回归直线为,以下说法不正确的是(B ) A. B.C.D.在回归直线上4.对样本的相关系数,以下结论错误的是(A)A.越接近0,与之间线性相关程度高B.越接近1,与之间线性相关程度高C.D、,则与相互独立二、多项选择题1.最小二乘估计量的统计性质有( ABC )A. 无偏性B. 线性性C. 最小方差性D. 不一致性E. 有偏性2.利用普通最小二乘法求得的样本回归直线的特点(ACD)A. 必然通过点B. 可能通过点C. 残差的均值为常数D.的平均值与的平均值相等E. 残差与解释变量之间有一定的相关性3.随机变量(随机误差项)中一般包括那些因素(ABCDE )A回归模型中省略的变量B人们的随机行为C建立的数学模型的形式不够完善。
非线性回归模型的线性化以上介绍了线性回归模型。
但有时候变量之间的关系是非线性的。
例如 y t = α 0 + α11βt x + u t y t = α 0 t x e 1α+ u t上述非线性回归模型是无法用最小二乘法估计参数的。
可采用非线性方法进行估计。
估计过程非常复杂和困难,在20世纪40年代之前几乎不可能实现。
计算机的出现大大方便了非线性回归模型的估计。
专用软件使这种计算变得非常容易。
但本章不是介绍这类模型的估计。
另外还有一类非线性回归模型。
其形式是非线性的,但可以通过适当的变换,转化为线性模型,然后利用线性回归模型的估计与检验方法进行处理。
称此类模型为可线性化的非线性模型。
下面介绍几种典型的可以做线性化处理的非线性模型。
⑴ 指数函数模型y t = t t u bx ae + (4.1) b >0 和b <0两种情形的图形分别见图4.1和4.2。
显然x t 和y t 的关系是非线性的。
对上式等号两侧同取自然对数,得Lny t = Lna + b x t + u t (4.2)令Lny t = y t *, Lna = a *, 则y t * = a * + bx t + u t (4.3) 变量y t * 和x t 已变换成为线性关系。
其中u t 表示随机误差项。
图4.1 y t =tt u bx ae+, (b > 0) 图4.2 y t =tt u bx ae +, (b < 0)⑵ 对数函数模型y t = a + b Ln x t + u t (4.4)b >0和b <0两种情形的图形分别见图4.3和4.4。
x t 和y t 的关系是非线性的。
令x t * = Lnx t , 则y t = a + b x t * + u t (4.5)变量y t 和x t * 已变换成为线性关系。
图4.3 y t = a + b Lnx t + u t , (b > 0) 图4.4 y t = a + b Lnx t + u t , (b < 0)⑶幂函数模型y t= a x t b t u e(4.6)b取不同值的图形分别见图4.5和4.6。
x t和y t的关系是非线性的。
对上式等号两侧同取对数,得Lny t = Lna + b Lnx t + u t(4.7) 令y t* = Lny t, a* = Lna, x t* = Lnx t, 则上式表示为y t* = a* + b x t* + u t(4.8) 变量y t* 和x t* 之间已成线性关系。
其中u t表示随机误差项。
(4.7) 式也称作全对数模型。
图4.5 y t = a x t b t u e图4.6 y t = a x t b t u e⑷双曲线函数模型1/y t = a + b/x t+ u t(4.9)也可写成,y t = 1/ (a + b/x t+ u t) (4.10) b>0情形的图形见图4.7。
x t和y t的关系是非线性的。
令y t* = 1/y t, x t* = 1/x t,得y t* = a + b x t* + u t已变换为线性回归模型。
其中u t表示随机误差项。
图4.7 y t = 1/ (a + b/x t ), (b > 0) 图4.8 y t = a + b/x t , (b > 0) 双曲线函数还有另一种表达方式,y t = a + b/x t + u t(4.11) b>0情形的图形见图4.8。
x t和y t的关系是非线性的。
令x t* = 1/x t,得y t = a + b x t* + u t上式已变换成线性回归模型。
⑸多项式方程模型一种多项式方程的表达形式是y t = b0 +b1 x t + b2 x t2 + b3 x t3 + u t(4.12)其中b1>0, b2>0, b3>0和b1<0, b2>0, b3<0情形的图形分别见图4.9和4.10。
令x t 1 = x t,x t 2 = x t2,x t 3 = x t3,上式变为y t = b0 +b1 x t 1 + b2 x t 2 + b3 x t 3 + u t(4.13)这是一个三元线性回归模型。
如经济学中的总成本曲线与图4.9相似。
图4.9 y t = b0 +b1 x t + b2 x t2 + b3 x t3 + u t图4.10 y t = b0 + b1 x t + b2 x t2 + b3 x t3 + u t 另一种多项式方程的表达形式是y t = b0 + b1 x t + b2 x t2 + u t(4.14)其中b1>0, b2>0和b1<0, b2<0情形的图形分别见图4.11和4.12。
令x t 1 = x t,x t 2 = x t 2,上式线性化为,y t = b0 + b1 x t1 + b2 x t2 + u t(4.15)如经济学中的边际成本曲线、平均成本曲线与图4.11相似。
图4.11 y t = b 0 +b 1x t + b 2x t 2 + u t 图4.12 y t = b 0 + b 1x t + b 2x t 2 + u t⑹ 生长曲线 (logistic) 模型y t = tu t f e k++)(1 (4.16)一般f (t ) = a 0 + a 1 t + a 2 t 2 + … + a n t n ,常见形式为f (t ) = a 0 - a ty t = u u at a e k +-+)(01= tu at be k+-+1 (4.17) 其中b = 0a e 。
a > 0情形的图形分别见图4.13和4.14。
美国人口统计学家Pearl 和Reed 广泛研究了有机体的生长,得到了上述数学模型。
生长模型(或逻辑斯谛曲线,Pearl-Reed 曲线)常用于描述有机体生长发育过程。
其中k 和0分别为y t 的生长上限和下限。
∞→t t Limy = k ,-∞→t t Limy = 0。
a , b 为待估参数。
曲线有拐点,坐标为(a Lnb ,2k),曲线的上下两部分对称于拐点。
图4.13 y t = k / (1 +tu at be+-) 图4.14 y t = k / (1 +tu at be +)为能运用最小二乘法估计参数a , b ,必须事先估计出生长上极限值k 。
线性化过程如下。
当k 给出时,作如下变换,k /y t = 1 + t u at be +- 移项, k /y t - 1 = t u at be +-取自然对数,Ln ( k /y t - 1) = Lnb - a t + u t (4.18) 令y t * = Ln ( k /y t - 1), b * = Lnb , 则y t * = b * - a t + u t (4.19)此时可用最小二乘法估计b *和a 。
图4.15 内地5月1日至28日每天非典数据一览⑺ 龚伯斯(Gompertz )曲线英国统计学家和数学家最初提出把该曲线作为控制人口增长的一种数学模型,此模型可用来描述一项新技术,一种新产品的发展过程。
曲线的数学形式是,y t =at be ke --图4.15 y t =atbeke --曲线的上限和下限分别为k 和0,∞→t t Limy = k , -∞→t t Limy = 0。
a , b 为待估参数。
曲线有拐点,坐标为(a Lnb ,ek ),但曲线不对称于拐点。
一般情形,上限值k 可事先估计,有了k 值,龚伯斯曲线才可以用最小二乘法估计参数。
线性化过程如下:当k 给定时,y t / k = at be e --,k /y t = at be e -Ln (k /y t ) = at be -, Ln [Ln (k /y t )] = Lnb - a t令y *= Ln [Ln (k /y t )], b * = Lnb ,则y * = b * - a t上式可用最小二乘法估计b * 和 a 。
Cobb-Douglas 生产函数下面介绍柯布−道格拉斯(Cobb-Douglas )生产函数。
其形式是Q = k L α C 1- α (4.24)其中Q 表示产量;L 表示劳动力投入量;C 表示资本投入量;k 是常数;0 < α < 1。
这种生产函数是美国经济学家柯布和道格拉斯根据1899-1922年美国关于生产方面的数据研究得出的。
α的估计值是0.75,β的估计值是0.25。
更习惯的表达形式是y t =t u t t e x x 21210βββ (4.25)这是一个非线性模型,无法用OLS 法直接估计,但可先作线性化处理。
上式两边同取对数,得:Lny t = Ln β0 + β1 Lnx t 1 + β2 Lnx t 2 + u t (4.26)取 y t * = Lny t , β0* = Ln β0, x t 1* = Ln x t 1, x t 2* = Ln x t 2,有y t *= β0* +β1 x t 1* + β2 x t 2* + u t (4.27)上式为线性模型。
用OLS 法估计后,再返回到原模型。
若回归参数 β1 + β2 = 1,称模型为规模报酬不变型(新古典增长理论); β1 + β2 > 1,称模型为规模报酬递增型; β1 + β2 < 1,称模型为规模报酬递减型。
对于对数线性模型,Lny = Ln β0 + β1 Lnx t 1 + β2 Lnx t 2 + u t ,β1和β2称作弹性系数。
以β1为例,β1 = 1t t Lnx Lny ∂∂= 1111t t t t x x y y ∂∂--= 11//t t tt x x y y ∂∂= 11t t t t x y y x ∂∂ (4.28) 可见弹性系数是两个变量的变化率的比。
注意,弹性系数是一个无量纲参数,所以便于在不同变量之间比较相应弹性系数的大小。
对于线性模型,y t = α0 + α1 x t 1 + α2 x t 2 + u t ,α1和 α2称作边际系数。
以α1为例,α1 =1t tx y ∂∂ (4.29) 通过比较(4.28)和(4.29)式,可知线性模型中的回归系数(边际系数)是对数线性回归模型中弹性系数的一个分量。
例1:此模型用来评价台湾农业生产效率。
用台湾1958-1972年农业生产总值(y t ),劳动力(x t 1),资本投入(x t 2)数据(见表4.1)为样本得估计模型, ∧t Lny = -3.4 + 1.50 Lnx t 1 + 0.49 Lnx t 2 (4.30) (2.78) (4.80) R 2 = 0.89, F = 48.45 还原后得,t yˆ= 0.713 x t 11.50 x t 20.49 (4.31) 因为1.50 + 0.49 = 1.99,所以,此生产函数属规模报酬递增函数。