计量第3章(7节)非线性回归实例
- 格式:pdf
- 大小:269.18 KB
- 文档页数:4
非线性回归问题两个变量不呈线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型。
分析非线性回归问题的具体做法是:〔1〕假设问题中已给出经验公式,这时可以将变量x 进行置换〔换元〕,将变量的非线性关系转化为线性关系,将问题化为线性回归分析问题来解决. 〔2〕假设问题中没有给出经验公式,需要我们画出数据的散点图,通过与各种函数〔如指数函数、对数函数、幂函数等〕的图象作比拟,选择一种与这些散点拟合得最好的函数,然后采用适当的变量置换,将问题化为线性回归分析问题来解决. 下面举例说明非线性回归分析问题的解法.例1 在彩色显影中,由经验可知:形成染料光学密度y 与析出银的光学密度x 由公式e b xy A =〔b <0〕表示,现测得实验数据如下:试求对的回归方程.分析:该例是一个非线性回归分析问题,由于题目中已给定了要求的曲线为eb xy A =〔b <0〕类型,我们只要通过所给的11对样本数据求出A 和b ,即可确定x 与y 的相关关系的曲线方程.解:由题意可知,对于给定的公式e bxy A =〔b <0〕两边取自然对数,得ln ln b y A x=+. 与线性回归方程对照可以看出,只要取1u x=,ln v y =,ln a A =,就有v a bu =+,这是v 对u 的线性回归直线方程,对此我们再套用相关性检验,求回归系数b 和a . 题目中所给数据由变量置换1u =,ln v y =变为如表所示的数据:由于|r |=0.998>0.602,可知u 与v 具有很强的线性相关关系. 再求得0.146b =-,0.548a =,∴v =0.5480.146u -,把u 和v 置换回来可得0.146ln 0.548y x=-, ∴0.1460.1460.1460.5480.548e1.73xxxy eee---===,∴回归曲线方程为0.1461.73exy -=.点评:解决此题的思路是通过适当的变量置换把非线性回归方程转化为线性回归方程,然后再套用线性回归分析的解题步骤.例2 为了研究某种细菌随时间x 变化的繁殖个数,收集数据如下:天数x 1 2 3 4 5 6 繁殖个数y612254995190〔1〕作出这些数据的散点图; 〔2〕求出y 对x 的回归方程. 解析:〔1〕作出散点图如图1所示.〔2〕由散点图看出样本点分布在一条指数型曲线e bxy c =〔c >0〕的周围,那么ln ln y bx c =+.令ln ln z y a c ==,,那么z bx a =+.x1 2 3 4 5 6 z相应的散点图如图2. 从图2可以看出,变换后的样本点分布在一条直线附近,因此可以用线性回归方程来拟合.由表中数据得到线性回归方程为0.69 1.115z x =+.因此 细菌的繁殖个数对温度的非线性回归方程为0.69 1.115e x y +=.点评:通过作散点图看出,此题是一个非线性回归问题,通过变量置换转化为线性回归问题求解的.值得注意的是,此题的数据与回归曲线是拟合得相当好的,这说明确定性关系〔如公式、函数关系式〕和相关关系之间并没有一条不可逾越的鸿沟.由于有实验误差、测量误差等存在,变量之间确实定性关系往往通过相关关系表现出来;反过来,在有些问题中,可以研究相关关系来深入了解变量变化的内在规律,从而找到它们确实定性关系.。
非线性回归实例例3.5.1 建立中国城镇居民食品消费需求函数模型。
根据需求理论,居民对食品的消费需求函数大致为),,(01P P X f Q = (3.5.13)其中,Q 为居民对食品的需求量,X 为消费者的消费支出总额、1P 为食品价格指数,0P 为居民消费价格总指数。
引入居民消费价格总指数0P 的原因,主要在于研究居民其他消费对食品的替代性。
需求理论同时指出,上述需求函数应具有零阶齐次性,即当所有商品和消费者货币支出总额按同一比例变动时,需求量保持不变,这就是所谓的消费者无货币幻觉。
按照需求函数的这一特征,(3.5.13)式可写为 )/,/(010P P P X f Q = (3.5.14) (3.5.14)式表明,居民对食品的消费需求,取决于居民的实际消费总支出0/P X 以及食品的相对价格01/P P 。
显然,该式具有零阶齐次性。
为了进行比较,我们将同时估计(3.5.13)式与(3.5.14)式。
首先确定具体的函数形式。
根据恩格尔定律,随着居民消费支出的增加,居民对食品的消费支出也增加,但食品消费支出比例会逐渐下降。
因此,居民对食品的消费支出与居民的总支出间呈幂函数的变化关系。
同时,为了方便考察需求的价格弹性等相关问题,将(3.5.13)式具体写为32101βββP P AX Q = (3.5.15)经对数变换,(3.5.15)式可用如下双对数线性回归模型进行估计:μββββ++++=031210ln ln ln )ln(P P X Q (3.5.16) 式中,A ln 0=β。
同样地,(3.5.14)式可用如下线性回归模型进行估计: μβββ+++=)/ln()/ln()ln(012010P P P X Q (3.5.17)采用双对数线性回归模型,能够方便地考察需求函数中零阶齐次性的特征。
显然,对(3.5.16)式施加0321=++βββ的约束,即可化为(3.5.17)式。
因此,对(3.5.17)式进行回归,就意味着原需求函数满足零阶齐次性条件。
题目什么是非线性回归模型请给出一个非线性回归模型的例子什么是非线性回归模型?非线性回归模型是一种用于建立自变量和因变量之间非线性关系的统计模型。
在线性回归模型中,假设因变量与自变量之间存在一个线性关系,并基于此来进行预测和分析。
然而,在现实世界中,很多情况下自变量和因变量之间的关系并不是简单的线性关系,而是呈现出曲线、指数或其他非线性形式。
因此,非线性回归模型通过引入非线性项来更准确地拟合实际数据并预测未知结果。
非线性回归模型的例子:以物理学领域的自由落体运动为例,我们可以使用非线性回归模型来分析自由落体运动中的速度与时间之间的关系。
在自由落体运动中,当质点从高处自由下落时,它的速度会逐渐增加。
根据牛顿第二定律,质点的加速度与作用力成正比,而作用力与质量成正比。
因此,在不考虑阻力的情况下,可以推导出自由落体运动的速度与时间之间的关系如下:v = g * t其中,v 表示速度,g 为重力加速度,t 为时间。
然而,在实际情况中,考虑到阻力的存在,自由落体运动并非完全符合这个简单的线性关系。
当速度增大时,阻力会逐渐增大,使得加速度减小。
因此,我们需要引入非线性项来更准确地描述速度与时间的关系。
一个常用的非线性回归模型是二次回归模型。
它可以表示为:v = a * t^2 + b * t + c其中,a、b、c 为待估计的参数。
通过收集自由落体运动的实验数据,我们可以利用最小二乘法来估计参数a、b、c 的值,从而建立起速度与时间之间的非线性回归模型。
在实际应用中,非线性回归模型广泛用于各个领域,如生物学、经济学、社会科学等。
它可以更准确地描述和预测自变量和因变量之间的复杂关系,为决策和研究提供重要支持。
总结:非线性回归模型是一种用于建立自变量和因变量之间非线性关系的统计模型。
通过引入非线性项,它能更准确地拟合实际数据,并提供更准确的预测和分析结果。
以自由落体运动为例,我们可以使用二次回归模型来分析速度与时间之间的关系。
例:下表给出了某地区1971—2000年的人口数据(表1)。
试用Matlab软件,对该地区的人口变化进行曲线拟合。
表1 某地区人口变化数据年份时间变量t=年份-1970人口y(人)1971 1 33 815 1972 2 33 981 1973 3 34 004 1974 4 34 165 1975 5 34 212 1976 6 34 327 1977 7 34 344 1978 8 34 458 1979 9 34 498 1980 10 34 476 1981 11 34 483 1982 12 34 488 1983 13 34 5131984 14 34 497 1985 15 34 511 1986 16 34 520 1987 17 34 507 1988 18 34 509 1989 19 34 521 1990 20 34 513 1991 21 34 515 1992 22 34 517 1993 23 34 519 1994 24 34 519 1995 25 34 521 1996 26 34 521 1997 27 34 523 1998 28 34 525 1999 29 34 525 2000 30 34 527根据上表中的数据,做出散点图,见图1。
337003380033900340003410034200343003440034500346001970197219741976197819801982198419861988199019921994199619982000年份人口从图1可以看出,人口随时间的变化呈非线性过程,而且存在一个与横坐标轴平行的渐近线,故可以用Logistic 曲线模型进行拟合。
因为Logistic 曲线模型的基本形式为:tbea y -+=1Matlab 程序如下: people_model.mx=[1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30]; y=[33815 33981 34004 34165 34212 34327 34344 34458 34498 34476 34483 34488 34513 34497 34511 34520 34507 34509 34521 34513 3451534517 34519 34519 34521 34521 34523 34525 34525 34527];b0=[0.0001 0.00001];[beta,r,j] = nlinfit(x,y,@people_fun,b0)people_fun.mfunction yy = people_fun(beta,x)yy = 1 ./ (beta(1) + beta(2) * exp(-x));运行结果: beta =1.0e-004 *0.2902 0.0184 回归函数为:tey -+=00000184.000002902.01在command 窗口输入:>> plot(x,people_fun(beta,x))注:本题也可以考虑转化为线性模型处理。
非线性回归分析(教案)第一章:非线性回归分析简介1.1 非线性回归的定义与意义1.2 非线性回归与线性回归的比较1.3 非线性回归分析的应用领域1.4 本章概要第二章:非线性模型的选择2.1 常见非线性模型介绍2.2 模型选择的方法与原则2.3 利用软件选择非线性模型2.4 本章概要第三章:非线性回归的计算方法3.1 数值解法简介3.2 梯度下降法3.3 牛顿法3.4 拟牛顿法3.5 本章概要第四章:非线性回归的参数估计与检验4.1 参数估计的原理与方法4.2 参数估计的算法实现4.3 参数检验的方法与准则4.4 模型诊断与改进4.5 本章概要第五章:非线性回归在实际问题中的应用5.1 实例一:人口增长模型5.2 实例二:药物动力学模型5.3 实例三:经济预测模型5.4 实例四:生物医学信号处理模型5.5 本章概要第六章:非线性回归软件的使用6.1 常见非线性回归软件介绍6.2 非线性回归软件的使用方法6.3 利用软件进行非线性回归分析的步骤6.4 本章概要第七章:非线性回归在生物学中的应用7.1 生物学中常见非线性模型介绍7.2 非线性回归在生物学研究中的应用案例7.3 生物学数据处理与非线性回归分析7.4 本章概要第八章:非线性回归在经济与管理科学中的应用8.1 经济与管理科学中的非线性模型介绍8.2 非线性回归在经济预测中的应用案例8.3 非线性回归在管理决策中的应用案例8.4 本章概要第九章:非线性回归在工程与应用科学中的应用9.1 工程与应用科学中的非线性模型介绍9.2 非线性回归在工程设计中的应用案例9.3 非线性回归在应用科学研究中的应用案例9.4 本章概要第十章:非线性回归分析的扩展与前沿10.1 非线性回归分析的局限性与改进10.2 非线性回归分析的新方法与发展趋势10.3 非线性回归分析与其他统计方法的结合10.4 本章概要第十一章:非线性回归的优化策略11.1 优化算法概述11.2 常见优化算法介绍11.3 非线性回归的优化策略11.4 本章概要第十二章:非线性回归在医学中的应用12.1 医学中的非线性模型介绍12.2 非线性回归在医学诊断中的应用案例12.3 非线性回归在医学治疗方案设计中的应用案例12.4 本章概要第十三章:非线性回归在地球科学中的应用13.1 地球科学中的非线性模型介绍13.2 非线性回归在地球物理勘探中的应用案例13.3 非线性回归在气候学研究中的应用案例13.4 本章概要第十四章:非线性回归在化学与材料科学中的应用14.1 化学与材料科学中的非线性模型介绍14.2 非线性回归在化学反应动力学分析中的应用案例14.3 非线性回归在材料性能预测中的应用案例14.4 本章概要第十五章:非线性回归分析的实践与挑战15.1 非线性回归分析的实际操作技巧15.2 非线性回归分析面临的挑战与问题15.3 未来非线性回归分析的发展方向15.4 本章概要重点和难点解析第一章:非线性回归分析简介重点:非线性回归的定义与意义,非线性回归与线性回归的比较。
统计学中的非线性回归模型与应用案例统计学是一门研究数据收集、分析和解释的学科。
在统计学中,回归分析是一种常用的方法,用于研究自变量与因变量之间的关系。
传统的回归模型假设自变量与因变量之间的关系是线性的,然而在现实世界中,很多情况下变量之间的关系并不是简单的线性关系。
因此,非线性回归模型应运而生。
非线性回归模型允许自变量与因变量之间的关系呈现出曲线、指数、对数等非线性形式。
这种模型的应用非常广泛,可以用于解决各种实际问题。
下面将介绍一些非线性回归模型的应用案例。
案例一:生长曲线模型生长曲线模型是一种常见的非线性回归模型,用于描述生物体、经济指标等随时间变化的增长过程。
以植物的生长为例,我们可以将植物的高度作为因变量,时间作为自变量,建立一个非线性回归模型来描述植物的生长过程。
通过拟合模型,我们可以预测植物在未来的生长情况,为农业生产提供参考依据。
案例二:Logistic回归模型Logistic回归模型是一种常用的非线性回归模型,用于研究二分类问题。
例如,我们可以使用Logistic回归模型来预测一个人是否患有某种疾病。
以心脏病的预测为例,我们可以将心脏病的发生与各种危险因素(如年龄、性别、血压等)建立一个Logistic回归模型。
通过拟合模型,我们可以根据个体的危险因素预测其是否患有心脏病,从而采取相应的预防措施。
案例三:多项式回归模型多项式回归模型是一种常用的非线性回归模型,用于描述自变量与因变量之间的高阶关系。
例如,我们可以使用多项式回归模型来研究温度与气压之间的关系。
通过拟合模型,我们可以得到温度与气压之间的高阶关系,从而更好地理解气象变化规律。
案例四:指数回归模型指数回归模型是一种常用的非线性回归模型,用于描述自变量与因变量之间的指数关系。
例如,我们可以使用指数回归模型来研究广告投入与销售额之间的关系。
通过拟合模型,我们可以得到广告投入对销售额的指数影响,从而为企业制定广告投放策略提供决策依据。
非线性回归实例
例1:此模型用来评价台湾农业生产效率。
用台湾1958-1972年农业生产总值(Y t ),劳动力(X 1t ),资本投入(X 2t )数据为样本得到估计模型:
= -3.4 + 1.50 LnX 1t + 0.49 LnX 2t
(2.78) (4.80) R 2 = 0.89, F = 48.45
还原后得,
= 0.713X 1t 1.50 X 2t 0.49
因为1.50 + 0.49 = 1.99,所以,此生产函数属规模报酬递增函数。
当劳动力和资本投入都增加1%时,产出增加近2%。
例2:用天津市工业生产总值(Y t ),职工人数(L t ),固定资产净值与流动资产平均余额(K t )数据 (1949-1997年) 为样本得估计模型如下:
Ln Y t = 0.7272 + 0.2587 Ln L t + 0.6986 LnK t
(3.12) (3.08) (18.75)
R 2 = 0.98, s.e. = 0.17, DW = 0.42, F = 1381.4
因为0.2587 + 0.6986 = 0.9573,所以此生产函数基本属于规模报酬不变函数。
例3: 中国铅笔需求预测模型
中国从上个世纪30年代开始生产铅笔。
1985年全国有22个厂家生产铅笔。
产量居世界首位(33.9亿支),占世界总产量的1/3。
改革开放以后,铅笔生产增长极为迅速。
1979-1983年平均年增长率为8.5%。
铅笔销售量时间序列见图1。
1961-1964年的销售量平稳状态是受到了经济收缩的影响。
文革期间销售量出现两次下降,是受到了当时政治因素的影响。
1969-1972年的增长是由于一度中断了的中小学教育逐步恢复的结果。
1977-1978年的增长是由于高考正式恢复的结果。
1981年中国开始生产自动铅笔,对传统铅笔市场冲击很大。
1979-1985年的缓慢增长是受到了自动铅笔上市的影响。
初始确定的影响铅笔销量的因素有全国人口、各类在校人数、设计
人员数、居民消费水平、社会总产值、自动铅笔产量、价格因素、原材料供给量、政策因素等。
经过多次筛选、组合和逐步回归分析,最后确定的被解释变量是Y t(铅笔年销售量,千万支);解释变量分别
是X t1(自动铅笔年产量,百万支);X t2(全国人口数,百万
人);X t3(居民年均消费水平,元);X t4(政策变量)。
因政策因素影响铅笔销量出现大幅下降时,政策变量取负值。
例如1967、1968年的X t4值取-2,1966、1969-1971、1974-1977年的X t4值取-1)。
由图2知中国自生产自动铅笔起,自动铅笔产量与铅笔销量存在线性关系。
由图3知全国人口与铅笔销量存在线性关系。
说明人口越多,对铅笔的需求就越大。
由图4知居民年均消费水平与铅笔销量存在近似对数的关系。
散点图说明居民年均消费水平越高,则铅笔销量就越大。
但这种增加随着居民消费水平的增加变得越来越缓慢。
图5显示政策变量与铅笔销量也呈线性关系。
图1 铅笔销售量时间序列(1961-1985)
图2 Y, X1散点图图3 Y, X2散点图
图4 Y, X3散点图图5 Y, X4散点图
基于上述分析建立的模型形式是
Y t = 0 + 1 X t 1 + 2X t 2 + 3Ln (X t 3) + 4 X t 4 + u t (1)
Y t与X t 3呈非线性关系。
估计结果如下。
= -907.94 - 2.95 X t 1 + 0.31 X t 2 + 170.19 Ln X t 3 + 45.51 X t 4 (2) (-6.4) (-3.7) (4.8) (4.4) (12.6)
R 2 = 0.9885, DW = 2.09, F = 429, s.e. = 10.34
上式说明,在上述期间自动铅笔年产量每增加1百万支,平均使铅笔的年销售量减少2950万支。
全国人口数每增加1百万人,平均使铅笔的年销售量增加310万支。
对数的居民年均消费水平每增加1个单位,平均使铅笔的年销售量增加17亿支。
一般性政策负面变动使铅笔的年销售量减少4.551亿支。
当Y t对所有变量都进行线性回归时(见下式),显然估计结果不如(2)式好。
= -254.26 - 3.29 X t 1 + 0.42 X t 2 + 0.66 X t 3 + 40.74 X t 4 (3)
(-12.0) (-3.0) (8.6) (3.5) (11.7)
R 2 = 0.9857, DW = 1.77, F = 346, s.e. = 11.5
例4:厦门市贷款总额与GDP的关系分析(1990~2003年)
数据和散点图如下。
从散点图看,用多项式方程拟合比较合理。
Loan t = 0 +1 GDP t + 2 GDP t 2 + 3 GDP t3 + u t
= -24.5932 +1.6354GDP t - 0.0026GDP t 2 + 0.0000027GDP t 3
t
(-2.0) (11.3) (-6.3) (7.9)
R2=0.9986, DW=2.6,F = 2463.275, s.e. =9.9883。