3连续时间动态最优化问题
- 格式:doc
- 大小:331.00 KB
- 文档页数:16
最优控制理论的发展与展望[1]最优控制理论是20 世纪60 年代迅速发展起来的现代控制理论中的主要内容之一,它研究和解决的是如何从一切可能的方案中寻找一个最优的方案。
1948 年维纳等人发表论文,提出信息、反馈和控制等概念,为最优控制理论的诞生和发展奠定了基础。
我国著名学者钱学森在1954 年编著的《工程控制论》直接促进了最优控制理论的发展。
美国著名学者贝尔曼的“动态规划”和原苏联著名学者庞特里亚金的“最大值原理”是在最优控制理论的形成和发展过程中,最具开创性的研究成果,并开辟了求解最优控制问题的新途径。
此外,库恩和图克共同推导的关于“不等式约束条件下的非线性最优必要条件(库恩—图克定理) ”及卡尔曼的关于“随机控制系统最优滤波器”等是构成最优控制理论及现代最优化技术理论基础的代表作。
[1][1]鲁棒控制是针对不确定性系统的控制系统的设计方法,其理论主要研究的问题是不确定性系统的描述方法、鲁棒控制系统的分析和设计方法以及鲁棒控制理论的应用领域。
鲁棒控制理论发展的最突出的标志之一是H∞控制。
H∞控制从本质上可以说是频域内的最优控制理论。
鲁棒控制与最优控制结合解决许多如线性二次型控制、电机调速、跟踪控制、采样控制、离散系统的镇定、扰动抑制等实际问题。
[2]近年来,最优控制理论[1,2]的研究,无论在深度和广度上,都有了很大的发展,已成为系统与控制领域最热门的研究课题之一,取得了许多研究成果。
同时,也在与其他控制理论相互渗透,出现了许多新的最优控制方式,形成了更为实用的学科分支。
例如鲁棒最优控制[3]、随机最优控制[4]、分布参数系统的最优控制[5]、大系统的次优控制[6]、离散系统的最优控制及最优滑模变结构控制[7,8]等。
而对于非线性系统,其最优控制求解相当困难,需要求解非线性HJB 方程或非线性两点边值问题,除简单情况外[9],这两个问题都无法得到解析解。
因此,许多学者都致力于寻求近似的求解方法[10~13],通过近似解得到近似的最优控,即次优控制。
电力系统最优潮流分析电力系统是现代社会中最重要的系统工程之一,为社会生产和人民生活提供了绝大部分能量。
电能的生产需要耗费大量的燃料,而目前电能在输送、分配和消费过程中存在着大量的损耗。
因此如何采取适当措施节约能源,提高整个电力系统的运行效率,优化系统的运行方式,是国内外许多学者一直关注与研究的热点。
电力系统的最优化运行是指在确保电力系统安全运行、满足用户用电需求的前提下,如何通过调度系统中各发电机组或发电厂的运行,从而使系统发电所需的总费用或所消耗的总燃料达到最小的运筹决策问题。
数学上可将此问题描述为非线性规划或混合非线性规划问题。
最优潮流问题是指在满足必须的系统运行和安全约束条件下,通过调整系统中可利用控制手段实现预定目标最优的系统稳定运行状态。
同经典的经济调度法相比,最优潮流具有全面规划、统筹考虑等优点,它可将安全运行和最优经济运行等问题进行综合考虑,通过统一的数学模型来描述,从而将电力系统对经济性、安全性以及电能质量等方面的要求统一起来。
最优潮流问题的提出把电力系统的最优运行理论提高到一个新的高度,受到了国内外学者高度重视。
最优潮流已在电力系统中的安全运行、电网规划、经济调度、阻塞管理、可靠性分析以及能量管理系统等方面得到了广泛应用,成为了电力系统网络运行分析和优化中不可或缺的工具。
一、最优潮流问题研究的意义最优潮流可将电力系统可靠性与电能质量量化成相应的经济指标,并最终达到优化资源配置、降低成本、提高服务质量的目的。
因此最优潮流研究具有传统潮流计算无法比拟的意义,主要体现在以下两个方面。
一方面,通过最优潮流计算可指导系统调度员的操作,保证系统在经济、安全、可靠的状态下运行。
具体表现为:第一,当所求问题以目标函数、控制变量和约束条件的形式固定下来后,就一定可以求出唯一最优解,并且该结果不受人为因素的影响。
第二,最优潮流的寻优过程可以自动识别界约束,在解逐渐趋于最优的过程中可得到网络传输瓶颈信息,从而可以指导电网扩容与规划。
连续优化、离散优化、组合优化与整数优化最优化问题(optimization problem)⾃然地分成两类:⼀类是连续变量的问题,称为连续优化问题;另⼀类是离散变量的问题,称为离散优化问题。
1. 连续优化(continuous optimization)连续优化是求解连续优化是求解在连续变量的问题,其⼀般地是求⼀组实数,或者⼀个函数。
离散优化(discrete optimization)2. 离散优化连续优化是求解离散变量的问题,是从⼀个⽆限集或者可数⽆限集⾥寻找⼀个对象,典型地是⼀个整数,⼀个集合,⼀个排列,或者⼀个图。
3. 组合优化(combinatorial optimization)组合优化问题的⽬标是从组合问题的可⾏解集中求出最优解,通常可描述为:令Ω={s1,s2,…,sn}为所有状态构成的解空间,C(si)为状态si对应的⽬标函数值,要求寻找最优解s*,使得对于所有的si∈Ω,有C(s*)=minC(si)。
组合优化往往涉及排序、分类、筛选等问题,它是运筹学的⼀个重要分⽀。
典型的组合优化问题有旅⾏商问题(Traveling Salesman Problem-TSP)、加⼯调度问题(Scheduling Problem,如Flow-Shop,Job-Shop)、0-1背包问题(Knapsack Problem)、装箱问题(Bin Packing Problem)、图着⾊问题(Graph Coloring Problem)、聚类问题(Clustering Problem)等。
这些问题描述⾮常简单,并且有很强的⼯程代表性,但最优化求解很困难,其主要原因是求解这些问题的算法需要极长的运⾏时间与极⼤的存储空间,以致根本不可能在现有计算机上实现,即所谓的“组合爆炸”。
正是这些问题的代表性和复杂性激起了⼈们对组合优化理论与算法的研究兴趣。
4. 整数优化(integer programming, IP)要求所有的未知量都为整数的线性规划问题叫做整数规划 (integer programming, IP) 或整数线性规划 (integer linear programming, ILP) 问题。
mpc 贝尔曼方程全文共四篇示例,供读者参考第一篇示例:MPC 贝尔曼方程是一种经济学和数学领域中常用的模型,用于描述在连续时间内进行决策的最优化问题。
MPC 是Model Predictive Control(模型预测控制)的缩写,是一种控制策略,将系统建模为离散时间步的状态空间模型,通过动态规划和优化算法来找到最佳的控制策略。
贝尔曼方程则是动态规划问题的关键方程,首次由数学家理查德·贝尔曼在上世纪50年代提出。
贝尔曼方程描述了一个动态系统中的最优值函数(value function)满足的递归关系式。
通过求解贝尔曼方程,可以得到系统的最优控制策略,从而在给定的约束条件下,找到最佳的决策方案。
MPC 贝尔曼方程的核心思想是在每个时间步上,通过计算当前时刻的值函数和未来时刻的预测模型,来优化控制策略。
具体来说,MPC 贝尔曼方程可以表达为以下形式:V*(x,k) = min u(k) [ c(x(k),u(k)) + V*(f(x(k),u(k)), k+1) ]V*(x,k) 是在时间步k 时状态x 下的最优值函数;u(k) 是在时间步k 时的控制策略;c(x(k),u(k)) 是在状态x(k) 和控制策略u(k)下的成本函数;f(x(k),u(k)) 是状态转移函数,描述了系统在当前状态和控制策略下的演化过程。
通过不断迭代求解上述方程,可以逐步计算出系统在每个时间步上的最优控制策略,从而实现对系统的最优控制。
MPC 贝尔曼方程的优势在于能够处理具有非线性、动态和不确定性特性的系统,并且可以灵活地调整控制策略以应对不同的情况。
在实际应用中,MPC 贝尔曼方程被广泛应用于工业控制、机器人控制、交通信号优化等领域。
在工业控制中,MPC 贝尔曼方程可以优化生产过程中的控制策略,提高生产效率和产品质量;在机器人控制中,MPC 贝尔曼方程可以优化机器人的运动路径,提高工作效率和安全性;在交通信号优化中,MPC 贝尔曼方程可以优化信号灯的控制策略,减少交通拥堵和排放。
马尔可夫决策过程(Markov Decision Process, MDP)是一种用来描述随机决策过程的数学模型。
在实际应用中,很多问题都可以被建模成MDP并通过合适的算法进行求解。
在MDP中,状态空间、动作空间和奖励函数的离散性是基本前提,但在某些应用中,这些变量可能是连续的。
本文将介绍马尔可夫决策过程中的连续时间建模方法,探讨其在实际问题中的应用。
一、连续时间马尔可夫决策过程MDP最早是由Bellman提出的,它适用于描述状态和动作都是离散的情形。
但是,很多实际问题中,状态空间和/或动作空间是连续的,这时需要进行连续时间建模。
连续时间MDP(Continuous-time Markov Decision Process, CTMDP)是对MDP的一种扩展,它考虑状态和动作空间是连续的情形。
在CTMDP中,状态转移由随机微分方程描述,动作空间是连续的。
状态空间一般也是连续的,但有时也可以是离散的。
奖励函数在时间上是连续的,与状态和动作相关。
CTMDP的目标是找到一个策略,使得期望累积奖励最大化。
二、CTMDP的求解方法CTMDP的求解方法与MDP有些不同。
在MDP中,常用的求解方法是值迭代或策略迭代,但这些方法不适用于CTMDP,因为连续状态空间和动作空间使得价值函数和策略函数难以表示。
对于CTMDP,常用的求解方法是近似动态规划。
近似动态规划是通过近似值函数和/或策略函数来求解CTMDP的方法。
其中,近似值函数方法包括函数逼近和蒙特卡洛方法,而近似策略函数方法包括策略梯度和Q-learning等。
近似值函数方法通过对值函数进行逼近来求解CTMDP。
常用的函数逼近方法包括线性函数逼近、非线性函数逼近和神经网络逼近等。
在CTMDP中,值函数是关于状态和动作的函数,它的逼近可以通过对状态和动作空间进行离散化,然后对每个离散状态和动作进行值函数逼近。
此外,蒙特卡洛方法也可以用于求解CTMDP,它通过采样得到的轨迹来估计值函数。
最优控制问题的预测模型方法最优控制是一种重要的数学理论和方法,广泛应用于控制工程、经济管理、物流规划等领域。
预测模型方法作为最优控制中的一种重要手段,被用来描述和优化系统的动态行为。
本文将介绍最优控制问题的预测模型方法,并讨论其应用和发展前景。
一、最优控制问题概述最优控制问题是指在给定约束条件下,通过选择最佳控制策略,使得控制系统的性能指标达到最优。
最优控制问题通常可以用微分方程的形式来描述,其中包括系统状态方程、控制方程和性能指标。
求解最优控制问题的关键在于建立合适的模型和求解方法。
二、预测模型方法简介预测模型方法是一种常用的最优控制求解方法,它通过建立系统的预测模型,利用模型预测系统未来状态,并据此制定最优控制策略。
预测模型方法可以分为离散时间和连续时间两种形式,常用的包括动态规划、模型预测控制、神经网络等方法。
1. 动态规划动态规划是一种基于最优化原理的最优控制方法,它将最优控制问题转化为递归的最优化问题。
通过构建递推关系和边界条件,可以求解出系统在每个时刻的最优控制策略。
动态规划方法在离散时间问题中应用广泛,但在连续时间问题中计算复杂度较高。
2. 模型预测控制模型预测控制是一种基于模型预测的最优控制方法,它通过优化一个有限时间内的性能指标,求解出未来一段时间内的最优控制策略。
模型预测控制方法可以灵活地处理约束条件和非线性系统,并且在实践中具有较好的应用效果。
3. 神经网络方法神经网络方法是一种基于人工神经网络的最优控制方法,它通过学习系统的输入和输出数据,建立系统的映射关系,并利用神经网络进行最优控制。
神经网络方法具有较强的逼近能力和自适应性,但需要大量的训练数据和计算资源。
三、应用和发展前景预测模型方法在最优控制问题中具有广泛的应用和发展前景。
目前,预测模型方法已经应用于许多领域,包括工业自动化、交通运输、金融风控等。
随着计算机技术和人工智能的发展,预测模型方法在实时性、精确性和效率方面都有了较大的提升。
控制系统中的最优控制与最优化技术随着科技的不断进步和应用范围的扩大,控制系统在各行各业中的重要性也日益凸显。
最优控制与最优化技术作为控制系统中的重要概念和方法,在提高系统性能和效率方面发挥着关键作用。
本文将就控制系统中的最优控制与最优化技术进行深入探讨。
一、最优控制的定义与概念最优控制是指在满足给定约束条件的前提下,通过使某种性能准则达到最大或最小值来确定控制器参数或控制策略的问题。
最优控制的实现可以使系统在最短时间内达到期望状态或在给定资源条件下获得最佳性能。
最优化技术是实现最优控制的关键方法之一,它利用数学和计算方法来寻找系统中使性能准则达到最大或最小值的最优解。
最优化技术广泛应用于各种领域,例如经济学、工程学、管理学等,其中最为常见的应用是在控制系统中。
二、最优控制的分类最优控制可以分为离散最优控制和连续最优控制两大类。
离散最优控制是指在离散时间点上确定控制器参数或控制策略的问题。
典型的离散最优控制方法包括动态规划、贝尔曼方程等。
连续最优控制是指在连续时间范围内确定控制器参数或控制策略的问题。
常见的连续最优控制方法有经典最优控制、最速控制、最小能耗控制等。
三、最优化技术在控制系统中的应用最优化技术在控制系统中有着广泛的应用。
以下是一些常见的应用领域。
1. 机器人控制机器人控制是利用最优化技术来实现机器人移动、定位和路径规划等问题。
通过对机器人运动过程中的能耗、时间等指标进行优化,可以实现机器人的高效控制和优化运动。
2. 制造业控制在制造业中,最优化技术可以用来优化物料和生产设备的调度、工艺参数的优化以及生产线的平衡等问题。
通过合理地设计和优化控制策略,可以提高制造业的生产效率和产品质量。
3. 能源系统控制能源系统控制是指在能源产生、传输和消费过程中,通过最优化技术实现能源的高效利用。
例如在电力系统中,可以通过最优化技术对电网的输电线路和发电机组进行优化调度,以最大限度地提高电网的稳定性和电能的利用率。
贝尔曼方程 zhihu 微分形式贝尔曼方程是动态规划中的核心方程之一,它在优化问题中起着重要的作用。
贝尔曼方程的微分形式是动态规划的基础,是我们解决问题时候的理论依据。
在实际问题中,我们可以通过贝尔曼方程来求解最优策略,找到最优解。
下面我们就来对贝尔曼方程的微分形式进行详细解释。
贝尔曼方程是由美国数学家理查德·贝尔曼于1956年提出的,他在他的著作《动态规划》中首次提出了这个概念。
贝尔曼方程描述了某一时刻的最优策略和下一时刻的最优策略之间的关系,从而可以通过递归的方式求解最优解。
在动态规划中,我们经常遇到一些不断变化的最优化问题,而贝尔曼方程正是用来解决这类问题的工具之一。
贝尔曼方程的微分形式是动态规划中的一个重要概念。
在微分形式中,我们可以将贝尔曼方程表示为一个关于状态变量和控制变量的偏微分方程。
通过求解这个方程,我们可以获得系统在不同状态下的最优控制策略。
这个微分形式通常用于连续时间的优化问题中,通过求解哈密顿-雅可比-贝尔曼方程,可以找到系统在每一个时刻的最优控制策略。
贝尔曼方程的微分形式可以通过哈密顿-雅可比-贝尔曼方程来表示。
这个方程是动态规划中的一个重要定理,它描述了在某一时刻系统的最优控制策略和下一时刻系统的最优控制策略之间的关系。
通过求解这个方程,我们可以找到系统在每一个时刻的最优控制策略,从而最大化我们的目标函数。
在实际问题中,贝尔曼方程的微分形式可以用来解决各种优化问题。
比如在金融领域中,我们可以通过贝尔曼方程的微分形式来优化投资策略,最大化收益。
在工程领域中,我们可以用它来设计控制系统,实现最优控制。
总之,贝尔曼方程的微分形式是动态规划的基础,是我们解决问题时的理论依据。
综上所述,贝尔曼方程的微分形式在动态规划中起着至关重要的作用。
通过求解贝尔曼方程的微分形式,我们可以找到系统在不同状态下的最优控制策略,从而解决各种优化问题。
在实际问题中,贝尔曼方程的微分形式可以被广泛应用,帮助我们实现最优化目标。
第一章最优化问题及数学预备知识最优化分支:线性规划,整数规划,几何规划,非线性规划,动态规划。
又称规划论。
应用最优化方法解决问题时一般有以下几个特点:1. 实用性强2. 采用定量分析的科学手段3. 计算量大,必须借助于计算机4. 理论涉及面广应用领域:工业,农业,交通运输,能源开发,经济计划,企业管理,军事作战……。
§1.1 最优化问题实例最优化问题:追求最优目标的数学问题。
经典最优化理论:(1) 无约束极值问题:),,,(opt 21n x x x f(),,,(m in 21n x x x f 或),,,(m ax 21n x x x f )其中,),,,(21n x x x f 是定义在n 维空间上的可微函数。
解法(求极值点):求驻点,即满足⎪⎪⎩⎪⎪⎨⎧='='='0),,(0),,(0),,(11121n x n x n x x x f x x f x x f n并验证这些驻点是否极值点。
(2) 约束极值问题:),,,(opt 21n x x x fs.t. )(,,2,1,0),,,(21n l l j x x x h n j <==解法:采用Lagrange 乘子法,即将问题转化为求Lagrange 函数),,(),,,(),,;,,,(1121121n j j lj n l n x x h x x x f x x x L λλλ∑=+=的无约束极值问题。
近代最优化理论的实例:例1 (生产计划问题) 设某工厂有3种资源B 1,B 2,B 3,数量各为b 1,b 2,b 3,要生产10种产品A 1,…,A 10 。
每生产一个单位的A j 需要消耗B i 的量为a ij ,根据合同规定,产品A j 的量不少于d j ,再设A j 的单价为c j 。
问如何安排生产计划,才能既完成合同,又使总收入最多?(线性规划问题)数学模型:设A j 的计划产量为 j x ,z 为总产值。
控制系统的最优控制方法控制系统的最优控制方法在工程领域中具有重要意义。
最优控制是指在给定系统模型和性能指标的条件下,通过调整系统参数和控制策略,使得系统的性能达到最佳状态。
本文将详细介绍最优控制的基本原理、常用方法以及应用领域。
一、最优控制的基本原理最优控制的基本原理是通过优化算法和数学方法,求解给定系统模型下的最优控制策略。
最优控制问题通常可以建模为一个最优化问题,其中包括系统动力学方程、性能指标和约束条件。
最优化问题可以采用不同的数学方法求解,如动态规划、最优化理论、变分法等。
在最优控制理论中,最为经典的方法是动态规划。
动态规划通过将整个控制问题划分为多个子问题,并利用递推关系求解最优控制策略。
动态规划方法具有较高的计算效率和较好的最优性能,被广泛应用于各类控制系统中。
二、常用的最优控制方法1. 动态规划方法动态规划方法是最优控制中最常用的方法之一。
它通过将系统的控制历史分解为多个阶段,并利用递推关系求解最优控制策略。
动态规划方法适用于线性和非线性系统,能够考虑多个性能指标和约束条件。
2. 最优化理论方法最优化理论方法是指利用最优化算法求解最优控制问题。
最优化理论方法包括线性规划、非线性规划、凸优化等。
这些方法通过数学优化算法,寻找系统模型下的最优控制策略。
3. 变分法方法变分法方法是一种计算变分问题的方法,用于求解最优控制问题中的变分方程。
通过对系统的状态和控制变量进行变分,将最优控制问题转化为求解变分方程的问题。
变分法方法通常适用于连续时间系统的最优控制问题。
三、最优控制的应用领域最优控制方法在各个工程领域中都有广泛的应用。
以下为一些常见的应用领域:1. 自动驾驶系统自动驾驶系统是一种复杂的控制系统,需要通过最优控制方法实现高效且安全的自动驾驶。
最优控制方法可以优化自动驾驶中的车辆动态、路径规划和交通流控制等问题。
2. 机器人控制机器人控制是利用最优控制方法实现机器人动作规划和控制的过程。
简述最优化原则一、前言最优化原则是指在一定的约束条件下,寻找使某个目标函数取得最大或最小值的方法和理论。
它是数学、工程、经济等领域中的重要问题之一,广泛应用于各个领域。
本文将从概念、分类、常用方法以及应用等方面进行详细的介绍。
二、概念最优化原则是指在满足一定约束条件下,通过调整自变量的取值来使目标函数达到最优值的方法和理论。
其中,自变量是可以被控制或调整的变量,如生产成本、销售价格等;而因变量则是受自变量影响而发生变化的变量,如利润、销售额等。
三、分类1.单目标优化单目标优化是指只有一个目标函数需要优化的情况。
例如,在生产成本固定的情况下,如何确定产品数量以使利润最大化,这就属于单目标优化问题。
2.多目标优化多目标优化是指存在多个相互独立且相互竞争的目标函数需要同时进行优化。
例如,在设计一个汽车时需要考虑安全性、舒适性和外观等多个因素,并且这些因素之间存在相互制约,需要在这些因素之间进行权衡和平衡。
3.连续优化连续优化是指自变量是连续的实数变量的情况。
例如,在确定某个产品的最佳销售价格时,价格可以取任意实数值。
4.离散优化离散优化是指自变量只能取有限个离散值的情况。
例如,在生产某个产品时,生产数量只能取整数值。
四、常用方法1.梯度下降法梯度下降法是一种基于负梯度方向进行搜索的最优化方法。
其基本思想是通过不断调整自变量的取值来使目标函数逐渐趋近于最小值。
该方法适用于单目标优化问题,并且自变量为连续实数变量的情况。
2.遗传算法遗传算法是一种模拟生物进化过程进行搜索的最优化方法。
其基本思想是通过模拟进化过程中的选择、交叉和变异等操作来寻找最优解。
该方法适用于多目标优化问题,并且自变量可以为连续或离散变量。
3.粒子群算法粒子群算法是一种模拟鸟群或鱼群等群体行为进行搜索的最优化方法。
其基本思想是通过模拟粒子在搜索空间中的移动和相互影响来寻找最优解。
该方法适用于连续优化问题。
4.模拟退火算法模拟退火算法是一种基于物理退火过程进行搜索的最优化方法。
第三讲连续时间动态最优化问题一、预备知识动态最优化问题历来是数学家们关注的热点和难点问题。
从17世纪末的伯努利,到20世纪50年代的贝尔曼和庞特里亚金,中间经过拉格朗日、欧拉等一大批数学家的努力,才使动态最优化理论日臻完善。
20世纪初,在拉姆齐(1928)的工作之后,动态数学技巧才被广泛地引入到经济学中来,目前,这些技巧已是大多数现代经济学家不可或缺的工具。
上一节,我们探讨了离散时间的动态优化问题,介绍了古典的拉格朗日乘数法和比较现代的贝尔曼方程法。
本节我们将在连续时间的动态优化问题中,也介绍两种方法,他们是古典的变分法和比较现代的汉密尔顿最大值原理。
下面分别介绍这两种方法。
二、连续时间动态最优化问题的描述例1.索罗(Solow)新古典经济增长模型的一个明显缺陷是把储蓄率看成是外生给定的。
事实表明,储蓄率不是常数。
为了将储蓄率内生化,堪斯(Cass,1965)和库普曼斯(Koopmans,1965) 利用拉姆齐(Ramsey, 1928)倡导的最优化方法,将储蓄率看作是由家庭和企业在竞争市场上追求自身利益最大化的结果,以此证明储蓄率是由模型决定的内生变量。
假设经济包含两个部门,家庭和企业,家庭通过提供劳动服务从企业取得工资,通过提供资产获得利息。
家庭收入分成消费和储蓄两部分。
家庭在预算约束条件下按照消费效用最大化的原则进行消费和投资决策。
家庭生命是无限期的。
家庭大小与成年人口数量对应,成年人口按给定(外生)不变的速度增长,为方便其见,人口的变化规律由下式确定: nt e t L =)(这里,假设初期人口数量为1,然后按等比级数递增,n 为人口增长率。
C(t)表示 t 时刻的消费, c(t)=C(t)/L(t)表示人均消费。
消费者问题是: [][]na c ra w adte e t c u t c U Max t nt t c --+=⋅⋅=⎰∞- 0)()()(ρ(1)此处,u(c)是c 的增函数并满足边际效用递减规律,u(c)满足稻田条件:∞=→)(lim'0c u c , 0)(lim '=∞→c u c 即当c 趋于零时,边际效用趋于无穷大,当c 趋于无穷大时,边际效用趋于零。
U[c(t)]表示家庭的总效用; a(t)=A(t)/L(t)表示人均净资产; r(t)表示资产收益率; w(t)表示工资率;ρ>0表示时间偏好率, 其含义是,时间越久远,效用的贴现值越少,ρ也叫做主观贴现率。
通常假设ρ>n 以保证家庭总效用在消费给定时是有界的1。
最优化问题(1)的另一种表达形式可以将由第二方程求得的消费c 代入到第一个方程获得:[][][]dt t at a t F dt e e ana ra w u t c U Max t nt t c ⎰⎰∞∞-=⋅⋅--+=00)()(),(,))( ρ (2)这就是目标函数的泛函表示最优化问题转化为:[][][]dt t at a t F dt e e ana ra w u t a V Max t nt t a ⎰⎰∞∞-=⋅⋅--+=00)()(),(,))( ρ例2. 乔根森(利润最大化)模型在乔根森的新古典投资理论中,假设企业利用资本K 和劳动L 进行生产,其生产函数具有新古典生产函数),(L K Q Q =形式。
新古典生产函数遵循三个假设,即:(1)边际生产力大于零;(2)边际生产力递减;(3)规模报酬不变。
P 表示产品价格;M 表示资本品价格;W 表示劳动力的工资;δ表示资本折旧率。
则企业的投资与资本的关1注:()t tte eρρρ+≈⎪⎭⎫⎝⎛=-111, 因此,贴现因子可以写成e 以为底的指数形式,目的是为了便于计算。
系为K K I δ+'=在任意时刻企业的净收益为:)(),(K K M WL L K PQ δ+'--如果企业贴现率r, 未来净收益的贴现值可表示为:[][]d tt K t L t K t F dte K K M WL L K PQ L K N t ⎰⎰∞∞-=-'--=0'0)(),(),(,(),(),(ρδ (3)是目标泛函F 的广义积分。
[][]d tt K t L t K t F dte K K M WL L K PQ L K V t t L t K ⎰⎰∞∞-=-'--=0'0)(),()(),(),(,(),(),(max ρδ[]KK I dte MI WL L K PQ L K N t δρ+'=--=⎰∞-0),(),(该最优化问题还可以写成:)()()())(),(),(,(),(max 0,t K t I t K dtt I t L t K t F L K N LK δ-='=⎰∞(4)一般来说,泛函积分可以表示为两种方式:一种是将泛函积分表示,如(2)和(3)的表示的最优化问题,目标函数是路径及其导数的函数。
另一种表示,如(1)和(4)所示,目标函数是控制变量和状态变量的函数,目标函数受转移动态方程的约束。
三、变分法3.1 变分问题的一般形式前面所述的最优化问题可以用目标泛函来表示:[][]dt t y t y t F y V Ty⎰'=0)(),(,max (5)且满足初始条件: Z T y A y ==)(,)0(目标函数][y V 是路径)(t y 的函数。
我们的目的是选择一条路径使积分表达式(5)达到最大。
由于变分法是利用微积分的工具发展而来,泛函极值问题是函数极值问题的发展和推广,所以,我们要求被积函数具有一阶、二阶导数。
我们知道,使函数达到最大值的点是极值点,所以,使泛函达到极值的曲线或者路径为极值曲线或极值路径。
3.2 预备知识对含参变量x 积分:⎰=ba dt x t F x I ),()(I⎰='=b a x dt x t F x I dxdI),()(' 如果a, b 也看作是参变量,则⎰=ba dt x t Fb a I ),(),(),(x b F b I=∂∂ ),(x a F aI-=∂∂ 分步积分公式:⎰⎰-=udv vu vdu复合函数求导法: 对于[])(),(),(t z t y t x F ,有dtdzz F dt dy y F t x x F dt dF ∂∂+∂∂+∂∂∂∂= 由于函数[])(),(,t y t y t F '是),,(y y t '的函数,而y y ',都是t 的函数,所以,F 和F '都是t 的复合函数。
因此,我们有dty d y F dt dy y F t F dt dF y y y y ''∂∂+∂∂+∂∂=''''3.3.欧拉方程的推导第一步,将求极值曲线的问题变换为求极值点的问题。
假设)(*t y 是已知的极值曲线,我们的目的是找到这条曲线所满足的必要条件。
任意选取连接(0,A )和(0,Z )点的扰动曲线)(t p , 则可以构造极值曲线的邻近路径: )()()(*t p t y t y ⋅+=ε)()()('*t p t y t y '⋅+='ε其中,ε是一个任意小的数,当它趋于0时,)()(*t y t y → 对于给定的)(*t y 和)(t p ,每一个ε对应于一条邻近路径y ,从而确定泛函的特定值。
于是,泛函就成了ε的函数)(εV V =,其表达式为:[]d t t p t y t p t y t F V T⎰⋅+⋅+=0'*'*)()(),()(,)(εεε由于极值曲线)(*t y 对应点ε=0, 所以,函数)(εV V =在ε=0点达到最大值,根据一元函数极值的必要条件,必有:0)()(000=⎪⎪⎭⎫ ⎝⎛''∂∂+∂∂=⎪⎪⎭⎫⎝⎛∂'∂'∂∂+∂∂∂∂=∂∂=⎰⎰⎰dt t p y Ft p y F dt y y F y y F dt F d dV TT T εεεε或者0)()(00=''∂∂+∂∂⎰⎰dt t p yF dt t p y FT T第二步:进行分步积分根据分步积分法,上式的第二个积分可以简化为:dt y Fdt d t p dty F dt d t p t p y F t dp y F dt t p y F TT TTT'∂∂-='∂∂-'∂∂='∂∂=''∂∂⎰⎰⎰⎰0000)()()()()(代入()式,可得:0)(0=⎪⎪⎭⎫ ⎝⎛'∂∂-∂∂⎰dt t p y F dt d y F T第三步:求欧拉方程上式包含附加任意函数p(t),泛函积分达到最优的条件应该不依赖于附加函数p(t),事实上,我们可以证明0='∂∂-∂∂y F dt d y F .为证明上述结论,我们证明下面的引理: 如果给定函数)(t f 和任意函数)(t g 满足:0)(0=⎪⎪⎭⎫ ⎝⎛'∂∂-∂∂⎰dt t p y F dt d y F T0)()(0⎰=Tdt t g t f , 则必有0)(=t f .证明(反证法):如果0)(≠t f ,不失一般性,我们假设存在一点0t 使0)(0>t f ,由于)(t f 是连续函数,所以必然存在一个充分小的数δ使)(t f 在区间),(00δδ+-t t 上,满足0)(>t f 。
下面我们构造函数:=)(t g 1,当),(00δδ+-∈t t t=)(t g 0,当),(00δδ+-∉t t t⎰⎰⎰⎰⎰+-+-+->=++=δδδδδδ0000000)(0)(0)()(0t t t t Tt t Tdt t f dt dt t f dt dt t g t f ,这与原假设矛盾,所以,0)(=t f 成立。
由于y Fdt d y F '∂∂-∂∂就相当于)(t f ,所以,0=???+?y F dt d y F 。
这就是泛函积分最优的一阶条件,也称欧拉方程。
第四步,欧拉方程的另一种表达方式 由于)()(''t y F t y F F dt y d y F dt dy y F t F dt dF y F dt d y y y y y t y y y y ''+'+'∂∂+∂∂+∂∂=='∂∂'''''''=所以,0='∂∂+∂∂yF dt d y F 被改写成0)()(=-''+'+''''y y y y y y t F t y F t y F F例1, 假设消费者的即时效用函数)1(1)()1(θθ--=-c c u 2。