双对数函数模型
- 格式:doc
- 大小:82.50 KB
- 文档页数:3
基于R语言的互补双对数模型分析作者:戴建国杨剑红来源:《宁波职业技术学院学报》2017年第04期摘要:针对分类数据模型的误差不满足正态分布,Logistic分布等常用分布,而是满足极值分布这类特殊情况时,采用互补双对数模型进行分析。
以R语言作为分析工具,并将其与几种常用模型进行对比分析,结果表明互补双对数模型优于其他模型。
关键词:互补双对数模型; R语言;有序分类中图分类号: O 212.1 文献标志码: A 文章编号: 1671-2153(2017)04-0087-031 问题提出大数据时代,数据挖掘与数据分析过程中遇到的数据类型主要有连续型,离散型,以及混合型,其涉及的方法众多,如机器学习,深度学习等。
当然,对于离散型数据,回归模型也是比较流行的统计分析方法之一,而且在多数情况下,因变量有可能是有序二分类或多分类的离散型变量,在医疗卫生统计或社会统计尤为常见,如对某事的评价可能分为不好、好、非常好这样三个等级。
对于这类数据常用的模型有Logistic回归模型(包括累积Logistic,邻近Logistic等模型),Probit回归模型,但它们分别是假设模型误差分布是Logistic分布和正态分布的,而有些情况误差并不满足这样的假设,其误差分布是非对称的极值分布或称Gumbel 分布[1]。
如某年某河面最高水位这样一个极值,这时需要寻求一个更为有效的模型,此时采用互补双对数线性模型与其他几种模型进行对比分析。
并且近年来R语言已成为当下最流行做数据分析和挖掘的工具之一,它不仅有丰富的函数包,而且能与Hadoop,Python等软件结合,使得成为重要的数据分析工具。
下面基于R语言用互补双对数模型对一组实际数据进行对比分析。
2 互补双对数线性模型[1]该模型的一般形式为log{-log[1-P(Y≤j)]}=αj+β'X,(1)从而可得求概率的表达式为式中:αj为解释变量不能解释的部分;β'为参数构成的向量。
WORD 格式
专业资料整理
关于双对数模型和半对数模型的斜率系数的经济含义的解释
1.双对数模型 lnY
ln 12lnX
u
d(lnY)
d(lnY)
dY
1 dY dY
d(lnY)
dX
*
dX
Y * X dY
Y
dY
dX e 则2=
d(lnX) 1 1 Y *
dX d(lnX)
dX
dX X
X
X
dQ 可以发现这个就
是
Y 对X 的弹性,请参考微观经济学中需求的价格弹性定义公式 ed= Q 。
dP
P 2.半对数 2
Xu
Y 2
lnXu
lnY
1
1
d(lnY) d(lnY) dY 1 dY (dY
)
Y
2 dX dY * Y * dX dX
dX 这个表示X 的单位绝对变化量导致 Y 的相对变化量(变化率)。
2 dY dY * dX dY * 1 dY * 1 dY d(lnX)
dX
d(lnX)
dX d(lnX) dX 1
dX
dX
( )
X X
这个就是X 的单位相对变化量导致 Y 的绝对量的变化量。
注:在微积分中符号 d 表示无穷小变化,除以原来的绝对量就是相对变化量或者说是变化率。
而还是不够准确,它是具体的数值,所以就会说近似了。
要学会用微积分的观点看就简单了,而且
我们开始求导数是可以把左边的被解释变量本身或者自然对数作为纵轴,把右边的解释变量的本身或者自然对数作为横轴,那么导数的几何意义就是曲线的斜率了。
双对数模型起源
双对数模型是一种高效简洁的模型,它通常被用来预测行为数据,如在线购物、在线搜索、营销等,能够捕捉行为的动态性。
本文将追溯双对数模型的始源。
双对数模型的起源可以追溯到20世纪50年代,当时,数学家香农发现,如果
在某种测量系统中两个不同变量是双对数形式的曲线,它们之间可以建立联系。
在20世纪60年代,Finney提出了双对数模型,独立地研究了双对数模型可以衡量的参数。
随后,Hall和Harris在1970年的研究中指出,双对数模型可以有效地应
用在傅里叶变换的图形分析上。
80年代以来,随着计算机技术的进步,双对数模型的应用变得越来越广泛,
它不仅被用于数据的可视化,而且被广泛应用于统计学和机器学习方面。
例如,在虚拟社交网络中,双对数模型可以用来构建一个优化算法,用来建立用户联系;在数据挖掘领域,双对数模型可以应用于探索数据中的关联关系;在机器学习领域,
双对数模型可以用来构建预测模型。
双对数模型以其概简高效的特点被人们普遍认可并落实到实际应用于中,它不
仅仅是简单的用于构建参数,而且能够提取行为信息,捕捉行为的细节、发现行为之间的联系,并且为机器学习等领域提供扩展性与可视化性。
2、双对数函数模型(幂函数模型) 模型形式: u x b b y ++=ln ln 10(该模型是将u b e Ax y 1=两边取对数,其中A b ln 0=)。
我们将以上模型称为双对数(double-log)模型或称为对数--线性(log-liner)模型。
作如下变换:x x y y ln ,ln **==将其代入原模型,则原模型转化为线性回归模型:u x b b y ++=*10*变换后的模型不仅参数是线性的,而且通过变换后的变量间也是线性的。
模型特点:双对数模型的斜率1b 度量了y 对x 的弹性:xdx ydy x d y d b //)(ln )(ln 1==模型适用对象:对观测值取对数,将取对数后的观测值(lnx,lny )描成散点图,如果近似为一条直线,则适合于双对数模型来描述x 与y 的变量关系。
将两个变量的对数线性回归模型推广到多元,例如,在生产函数的分析中,经常采用以下的柯布——道格拉斯生产函数形式:u e K AL Q βα=式中:Q --产出量,K --资本投入量,L --劳动投入量,A ,βα,为未知参数。
对上式两边取对数得到如下模型:u K L A Q +++=ln ln ln ln βα再令:L L Q Q ln ,ln **==,K K A ln ln,**==,得到线性模型:u K L A Q +β+α+=****模型中的α、β分别为劳动、资本的产出弹性:L dL Q dQ L d Q d //)(ln )(ln ==α;KdK QdQ K d Q d //)(ln )(ln ==β例根据下表给出的1978—2002年间总产出(用国内生产总值GDP度量,单位:亿元),劳动投入(用从业人员度量,单位为万人),以及资本投入(用固定资本度量,单位:亿元)。
运用OLS法建立我国的柯布一道格斯生产函数。
表2利用Eviews软件解题如下:首先建立工作文件,其次输入样本数据Q、L、K,再次,在Eviews软件的命令窗口,依次键入:GENR LNGDP=LOG(GDP)GENR LNL=LOG(L)GENR LNK=LOG(K)LS LNGDP C LNL LNK输出结果如下:由此建立的我国柯布一道格斯生产函数为:K L GDP ln 74759.0ln 71365.0403778.4ln ++-=)ˆ(i b s =(3.539284) (0.363194) (O.053038) t=(-1.244257) (1.964930) (14.09537)994632.02=R 994095.02=R F=1852.869 S.E=0.083623DW=0.669052对回归方程解释如下:偏斜率系数0.71365表示产出对劳动投入的弹性,也就是说,0.71365表示在资本投入保持不变的条件下,劳动投入每增加一个百分点,平均产出将增加0.71%。
双对数回归模型的系数解释
双对数回归模型是一种回归分析方法,其模型形式为lny=a+blnx+u,其中x和y是自变量和因变量,a和b是待估计的参数,u是误差项。
对于双对数回归模型的系数,特别是b系数,其解释如下:
当x每增加1%,y的预期变化率是b%。
换句话说,如果x增加100%,则y的预期变化率是b% 2。
这种解释是基于对数函数的性质,即ln(x)的微分是1/x,这意味着当x增加时,lnx也会增加,但增加的速度逐渐减缓。
此外,双对数回归模型也常用于研究经济问题,例如研究价格和数量之间的关系。
在这种情况下,b系数可以解释为弹性,即当一个变量变化1%时,
另一个变量变化的百分比。
例如,如果b为,则意味着当x变化1%时,y
变化%。
总之,双对数回归模型的系数解释主要关注的是因变量y对自变量x的变化率或弹性。
如需更多信息,建议查阅统计学相关书籍或咨询统计学专业人士。
计量经济学第六章6.1 解释概念(1)双对数模型 (2)对数-线性模型 (3)线性-对数模型 (4)多项式回归(5)标准化变量 (6)边际效应 (7)弹性 (8)瞬时增长率 答:(1)双对数模型是一种广泛应用的函数形式,模型中的因变量和自变量都以对数度量,比如设定一个双对数模型12ln ln Y X u ββ=++(2)对数线性模型是指因变量取对数、解释变量为原有形式的模型。
比如:12log()wage educ u ββ=++。
(3)线性对数模型是指因变量为原有形式,解释变量取对数的模型。
比如:12ln Y X u ββ=++(4)多项式回归模型中解释变量并不都是以线性的形式出现,多项式是由常数和一个或多个解释变量及其正整数次幂构成的表达式。
多项式回归模型的一般函数形式表示为21123k k Y X X X u ββββ-=+++++(5)标准化变量是标准化变量就是将变量减去其均值并除以其标准差。
(6)边际效应是指一单位变量X 的变化所引起的变量Y 的单位变化。
(7)弹性是指一个变量变动的百分比相应于另一变量变动的百分比来反应变量之间的变动的灵敏程度。
(8)瞬时增长率是指仅当时间变动很小时,才近似等于因变量的相对变化。
6.2 考虑双对数模型12ln ln Y X u ββ=++分别描绘出21β=,21β>,201β<<,21β=-,21β<-,210β-<<时表现Y 与X 之间关系的曲线。
答:当21β=时,Y 和X 对应的是曲线是:当21β>时,对应的曲线是:201β<<时:21β=-时,Y 和X 对应的图形为:21β<-时,对应的函数为:210β-<<时,Y 和X的曲线为:6.3 在研究生产函数时,我们得到如下结果2ln 8.570.460ln 1.285ln 0.272(4.2)(0.025)(0.347)(0.041)360.889K L t se n R θ=-+++===其中θ为产量,K 为资本,L 为劳动时数,t 为时间变量。
2、双对数函数模型(幂函数模型) 模型形式: u x b b y ++=ln ln 10
(该模型是将u b e Ax y 1=两边取对数,其中A b ln 0=)。
我们将以上模型称为双对数(double-log)模型或称为对数--线性(log-liner)模型。
作如下变换:
x x y y ln ,ln **==
将其代入原模型,则原模型转化为线性回归模型:
u x b b y ++=*10*
变换后的模型不仅参数是线性的,而且通过变换后的变量间也是线性的。
模型特点:双对数模型的斜率1b 度量了y 对x 的弹性:
x
dx y
dy x d y d b //)(ln )(ln 1==
模型适用对象:对观测值取对数,将取对数后的观测值(lnx,lny )描成散点图,如果近似为一条直线,则适合于双对数模型来描述x 与y 的变量关系。
将两个变量的对数线性回归模型推广到多元,例如,在生产函数的分析中,经常采用以下的柯布——道格拉斯生产函数形式:
u e K AL Q βα=
式中:Q --产出量,K --资本投入量,L --劳动投入量,A ,βα,为未知参数。
对上式两边取对数得到如下模型:
u K L A Q +++=ln ln ln ln βα
再令:L L Q Q ln ,ln **==,K K A ln ln,**==,得到线性模型:
u K L A Q +β+α+=****
模型中的α、β分别为劳动、资本的产出弹性:
L dL Q dQ L d Q d //)(ln )(ln ==
α;K
dK Q
dQ K d Q d //)(ln )(ln ==β
例根据下表给出的1978—2002年间总产出(用国内生产总值GDP度量,单位:亿元),劳动投入(用从业人员度量,单位为万人),以及资本投入(用固定资本度量,单位:亿元)。
运用OLS法建立我国的柯布一道格斯生产函数。
表2
利用Eviews软件解题如下:首先建立工作文件,其次输入样本数据Q、L、K,再次,在Eviews软件的命令窗口,依次键入:
GENR LNGDP=LOG(GDP)
GENR LNL=LOG(L)
GENR LNK=LOG(K)
LS LNGDP C LNL LNK
输出结果如下:
由此建立的我国柯布一道格斯生产函数为:
K L GDP ln 74759.0ln 71365.0403778.4ln ++-=
)ˆ(i b s =(3.539284) (0.363194) (O.053038) t=(-1.244257) (1.964930) (14.09537)
994632.02=R 994095.02=R F=1852.869 S.E=0.083623
DW=0.669052
对回归方程解释如下:
偏斜率系数0.71365表示产出对劳动投入的弹性,也就是说,0.71365表示在资本投入保持不变的条件下,劳动投入每增加一个百分点,平均产出将增加0.71%。
类似地,在劳动投入保持不变的条件下,资本投入每增加一个百分点,产出将平均增加0.75%。