2离散时间的动态最优化问题
- 格式:doc
- 大小:118.00 KB
- 文档页数:8
离散控制系统的最优控制理论离散控制系统的最优控制理论是控制工程领域中的一个重要研究方向。
离散控制系统是指在时间上只能在特定时间点进行操作的系统,相比连续控制系统,离散控制系统需要使用离散时间模型进行建模和控制设计。
最优控制理论是研究如何设计控制策略以使系统能够在某种指标下达到最优性能的一门学科。
离散控制系统的最优控制理论旨在寻找最优的控制策略,使得系统的性能指标如稳定性、响应速度、能耗等在给定约束条件下达到最优。
1. 离散控制系统的建模离散控制系统的建模是进行最优控制设计的基础。
在离散控制系统中,系统的状态在一系列离散时间点上进行更新。
离散控制系统的建模通常使用差分方程或状态空间模型。
差分方程描述了系统的状态在每个时间点的更新关系,而状态空间模型则将系统的状态和输入表示为向量,并使用矩阵形式描述系统的动态特性。
根据具体问题的需要,选择合适的建模方法可以更好地描述系统的动态行为。
2. 离散控制系统的性能指标离散控制系统的性能指标是评价系统控制性能的定量指标。
常见的性能指标包括稳定性、响应速度、能耗等。
稳定性是系统重要的性能指标之一,用于评估系统是否能够在有限时间内达到稳定状态。
响应速度是指系统对输入变化的快速响应能力。
能耗则是指系统在完成特定任务时所消耗的能源。
通过选取合适的性能指标,可以更好地评估和改进离散控制系统的性能。
3. 最优控制理论的基本原理最优控制理论的基本原理是寻找一组最优控制策略,使得系统的性能指标达到最优。
最优控制问题通常可以通过数学方法建立为一个优化问题。
其中,最常见的方法是最小化或最大化一个性能指标的数学表达式。
为了求解这些优化问题,可以使用动态规划、最优化理论等数学工具。
最优控制理论提供了一种系统优化设计的方法,可以帮助工程师设计更优秀的控制策略。
4. 最优控制策略的设计方法最优控制策略的设计方法取决于具体的离散控制系统和性能指标。
常见的设计方法包括经典控制方法和现代控制方法。
离散控制系统中的最优控制方法离散控制系统是一种在时间和状态上都是离散的控制系统,相对于连续控制系统来说,其最优控制方法也有所不同。
本文将介绍离散控制系统中的最优控制方法,主要包括动态规划、最优化算法和强化学习。
一、动态规划动态规划是一种基于状态转移的最优化方法,在离散控制系统中有着广泛的应用。
其基本思想是将原问题分解为若干子问题,并通过求解子问题的最优解来得到原问题的最优解。
在离散控制系统中,我们可以将状态和控制变量转化为状态转移方程,然后利用动态规划递推求解,得到最优的控制策略。
二、最优化算法最优化算法是一种通过迭代优化来求解最优控制问题的方法,常见的有梯度下降法、牛顿法等。
在离散控制系统中,我们可以将控制问题转化为一个优化问题,并使用最优化算法来求解最优的控制策略。
例如,在离散时间马尔可夫决策过程中,我们可以利用值迭代或策略迭代等最优化算法来求解最优策略。
三、强化学习强化学习是一种通过试错学习来求解最优控制问题的方法,其核心思想是智能体通过与环境的交互来学习最优的行为策略。
在离散控制系统中,我们可以将控制问题抽象为一个马尔可夫决策过程,并使用强化学习算法如Q-learning、SARSA等来求解最优策略。
强化学习在离散控制系统中具有较好的应用效果,在复杂的离散控制系统中能够找到近似最优的控制策略。
综上所述,离散控制系统中的最优控制方法包括动态规划、最优化算法和强化学习。
这些方法在不同的离散控制系统中有着广泛的应用,能够求解出最优的控制策略。
在实际应用中,我们需要根据具体的控制问题选择合适的方法,并结合系统的特点和需求进行调整和优化。
离散控制系统中的最优控制方法在提高系统性能和效率方面具有重要意义,对于实际工程应用具有较大的价值。
拉格朗日条件的离散动态优化
拉格朗日乘数法的基本思想
作为一种优化算法,拉格朗日乘子法主要用于解决约束优化问题,它的基本思想就是通过引入拉格朗日乘子来将含有n个变量和k个约束条件的约束优化问题转化为含有(n+k)个变量的无约束优化问题。
拉格朗日乘子背后的数学意义是其为约束方程梯度线性组合中每个
向量的系数。
如何将一个含有n个变量和k个约束条件的约束优化问题转化为含有(n+k)个变量的无约束优化问题?拉格朗日乘数法从数学意义
入手,通过引入拉格朗日乘子建立极值条件,对n个变量分别求偏导对应了n个方程,然后加上k个约束条件(对应k个拉格朗日乘子)一起构成包含了(n+k)变量的(n+k)个方程的方程组问题,这样就能根据求方程组的方法对其进行求解。
解决的问题模型为约束优化问题:min/max a function f(x,y,z), where x,y,z are not independent and g(x,y,z)=0.
即:min/max f(x,y,z)
s.t. g(x,y,z)=0。
离散优化问题及其求解技术在我们的日常生活和工作中,经常会遇到各种各样需要做出最优决策的情况。
比如,在生产线上如何安排工人的工作任务,以达到最高的生产效率;在物流运输中,如何规划车辆的行驶路线,以最小化运输成本;在项目管理中,如何分配资源,以确保项目按时完成。
这些问题都可以归结为离散优化问题。
离散优化问题是指在有限个或可数个可行解中,寻找最优解的问题。
与连续优化问题不同,离散优化问题的可行解是离散的,不是连续的。
这就使得离散优化问题的求解更加具有挑战性。
离散优化问题的类型多种多样。
其中,最常见的包括整数规划问题、组合优化问题和网络优化问题。
整数规划问题要求决策变量必须取整数值。
例如,在决定要购买多少台机器设备时,机器的数量只能是整数。
组合优化问题则涉及到从一组有限的对象中选择最优的组合。
比如,旅行商问题(TSP),就是要找到一个旅行商在多个城市之间旅行的最短路径,且每个城市只能访问一次。
网络优化问题则是在网络结构上进行优化,比如在通信网络中如何分配带宽,以最大化网络的性能。
那么,如何求解这些离散优化问题呢?下面我们来介绍一些常见的求解技术。
精确算法是一类能够保证找到最优解的方法。
其中,分支定界法是一种常用的整数规划精确算法。
它通过将问题不断分解为子问题,并为每个子问题设定上下界,逐步缩小搜索范围,最终找到最优解。
然而,精确算法在处理大规模问题时,往往会面临计算时间过长的问题。
启发式算法则是在合理的时间内找到一个较好的解,但不能保证是最优解。
常见的启发式算法包括贪心算法和局部搜索算法。
贪心算法在每一步都做出当前看起来最优的选择,但这种局部最优的选择并不一定能导致全局最优解。
局部搜索算法从一个初始解开始,通过在其邻域中搜索更好的解来逐步改进。
例如,模拟退火算法就是一种基于局部搜索的启发式算法,它通过模拟物理中的退火过程,在搜索过程中引入一定的随机性,以避免陷入局部最优。
元启发式算法是近年来发展起来的一类高效的求解方法,如遗传算法、蚁群算法和粒子群优化算法等。
离散型组合优化问题
离散型组合优化问题是一类重要的数学问题,其主要目标是在给定的约束条件下,找到使得目标函数取得最大(或最小)值的一组离散变量的组合。
这类问题被广泛应用于运筹学、金融学、工程学等领域。
在离散型组合优化问题中,变量一般是离散的,即只能取有限个离散取值。
例如,在投资组合优化中,我们需要选择一些特定的资产来构建投资组合,每个资产的比例可以视为一个离散变量。
我们需要考虑到不同资产之间的关系、收益风险等因素,并制定一种优化策略来最大化投资组合的收益或最小化风险。
离散型组合优化问题的解决方法主要分为两类:精确解法和启发式算法。
精确解法通常用于规模较小的问题,通过穷举搜索或动态规划等方法,枚举所有可能的组合并计算其目标函数值,从中选取最优解。
然而,由于组合爆炸的问题,这种方法对于大规模问题效率较低。
因此,启发式算法成为解决大规模离散型组合优化问题的主要方法。
启发式算法通过设计一种启发式准则或搜索策略,能够在较短的时间内找到一个接近最优解的可行解。
常见的启发式算法包括遗传算法、模拟退火算法、禁忌搜索算法等。
这些算法能够在大规模离散型组合优化问题中取得较好的效果。
例如,在旅行商问题中,遗传算法可以有效地探索巡回路径的组合,并找到一个近似最优解。
总而言之,离散型组合优化问题是一类具有广泛应用价值的数学问题。
通过合适的算法和方法,我们能够找到可行的解决方案,并为决策提供有力的支持。
数学中的离散优化离散问题的最优化方法与算法数学中的离散优化:离散问题的最优化方法与算法离散优化是数学中的一个重要分支,涉及到在给定的约束条件下,寻找离散决策变量的最优值。
离散问题的最优化方法与算法在现实生活中有着广泛的应用,例如在经济学、工程学、计算机科学等领域。
本文将介绍几种常见的离散优化方法与算法,并给出相应的实例说明。
1. 背包问题背包问题是一类经典的离散优化问题,其目标是在给定的背包容量下,选择一些物品放入背包中,使得物品的总价值最大化。
常见的背包问题包括0-1背包问题、分数背包问题等。
0-1背包问题要求每个物品要么完整地放入背包,要么完全不放入;而分数背包问题允许物品被切割后放入背包。
这类问题通常可以用动态规划算法来解决。
2. 蚁群算法蚁群算法是一种基于模拟蚂蚁觅食行为的启发式优化算法,在求解离散优化问题中具有很好的效果。
蚁群算法模拟了蚂蚁在搜索食物时的行为,通过信息素的引导和信息素挥发的调控,使蚂蚁集体找到最优解。
蚁群算法在TSP(旅行商问题)等多个领域取得了较好的实验结果。
3. 遗传算法遗传算法是一种模拟自然进化过程的优化算法,适用于求解离散或连续优化问题。
遗传算法通过模拟遗传、变异和选择等基本过程,生成新的解并逐代改进,最终得到一个或多个最优解。
遗传算法通过种群的进化,使解空间中的解逐渐趋向最优解,具有全局搜索能力。
遗传算法在图着色、子集选择等问题中有广泛应用。
4. 线性规划算法线性规划是研究线性约束条件下的最优解的数学方法。
虽然线性规划常被用于求解连续问题,但在离散优化问题中也有相应的应用。
例如,当变量的取值只能是整数时,可将线性规划问题转化为整数线性规划问题,再利用分支定界等方法求解。
5. 图论算法图论是数学中探讨图的性质和关系的重要分支,也是解决离散优化问题的有效工具。
图论中的最短路径算法(如Dijkstra算法、Bellman-Ford算法)、最小生成树算法(如Prim算法、Kruskal算法)等,都可以应用于离散优化中,如网络规划、通信路由等问题。
离散最佳化离散最优化是一种数学方法,用于解决离散决策问题。
在离散最优化中,我们需要在给定的约束条件下,找到最优的决策方案。
离散最优化可以应用于各种领域,如物流规划、资源分配、网络设计等。
离散最优化的目标是寻找最优解,即使得目标函数取得最大或最小值的解。
在实际应用中,目标函数往往与一些变量相关,我们需要通过调整这些变量的取值来使目标函数达到最优值。
离散最优化的难点在于,变量的取值只能是离散的,而不是连续的。
这就要求我们通过合理的搜索算法来找到最优解。
离散最优化的方法有很多种,其中一种常用的方法是穷举法。
穷举法通过枚举所有可能的解,并计算每个解的目标函数值,然后找到最优解。
然而,穷举法的计算量往往非常大,特别是当问题规模较大时。
因此,我们需要寻找更加高效的算法来解决离散最优化问题。
另一种常用的方法是动态规划。
动态规划是一种将问题分解为子问题,并通过求解子问题的最优解来求解原始问题的方法。
动态规划算法通常需要建立一个状态转移方程,通过递推关系来计算最优解。
动态规划算法的优点是可以避免重复计算,提高计算效率。
除了穷举法和动态规划,离散最优化还可以使用贪心算法、分支定界法、遗传算法等等。
每种方法都有其适用的场景和特点,我们需要根据具体情况选择合适的方法来解决问题。
离散最优化的应用非常广泛。
在物流规划中,我们需要在给定的仓库、配送中心、客户之间,找到最优的路径和配送方案,以降低物流成本。
在资源分配中,我们需要合理地分配有限的资源,以最大限度地满足需求。
在网络设计中,我们需要设计一个高效的网络拓扑结构,以提高网络的传输速度和稳定性。
离散最优化在实际应用中面临一些挑战。
首先,离散最优化问题往往具有多个约束条件和目标函数,需要考虑多个因素的权衡。
其次,离散最优化问题的解空间往往非常大,需要通过高效的搜索算法来找到最优解。
此外,离散最优化问题的求解往往需要考虑实际的约束和限制,如资源的有限性、时效性等。
在实际应用中,离散最优化可以帮助我们做出更加科学和合理的决策。
离散优化问题及其求解技术离散优化问题在现实生活中广泛存在,涉及到资源分配、路线规划、任务调度等众多领域。
通过使用合适的求解技术,我们可以有效地解决这些优化问题。
本文将介绍离散优化问题的基本概念和常见求解技术,旨在帮助读者提升对该领域的理解和应用能力。
一、离散优化问题概述离散优化问题是指在一组有限选择中,寻找最优解的问题。
与连续优化问题相比,离散优化问题的解空间是离散的。
离散优化问题通常可以形式化为一个数学模型,其中包含目标函数和一系列约束条件。
离散优化问题可以分为线性规划、整数规划、组合优化等不同类型。
线性规划是指目标函数和约束条件均为线性的优化问题;整数规划是指变量的取值只能是整数的优化问题;而组合优化则是指在离散集合中寻找最优解的问题。
二、离散优化问题的求解技术1. 枚举法枚举法是一种简单直观的求解技术,它通过枚举所有可能的解来找到最优解。
枚举法的优点是能够确保找到最优解,缺点是对于大规模问题,耗时较长。
2. 贪婪算法贪婪算法是一种基于当前最优选择来进行决策的求解技术。
在每一步中,贪婪算法选择当前最优的解,并逐步构建最终解。
贪婪算法的优点是简单高效,缺点是不能保证找到全局最优解。
3. 动态规划动态规划是一种将问题分解为子问题然后逐步求解的求解技术。
动态规划通过存储中间计算结果,避免了重复计算,以提高求解效率。
动态规划的优点是能够找到最优解,但对于问题规模较大的情况,计算复杂度较高。
4. 分支定界法分支定界法是一种通过不断减小解空间来寻找最优解的求解技术。
该方法将问题分解为一系列子问题,并通过剪枝操作来减小问题的规模。
分支定界法的优点是能够找到最优解,并且计算复杂度相对较低。
5. 遗传算法遗传算法是一种模拟生物进化过程的求解技术。
该方法通过使用基因编码和选择、交叉、变异等遗传操作来搜索解空间,并通过适应度函数评估解的质量。
遗传算法的优点是能够处理高维、非线性问题,但对于问题的选择和参数的设置较为敏感。
离散控制系统中的最优控制离散控制系统是指由一系列离散(非连续)的控制器构成的系统,它对系统进行离散化处理和采样,并根据采样值进行控制。
在离散控制系统中,最优控制是一种优化问题,旨在找到使给定性能指标最小化或最大化的控制策略。
本文将介绍离散控制系统中的最优控制方法和应用。
一、动态规划方法动态规划是离散控制系统最优控制的常用方法之一。
它通过将控制问题划分为一系列互相关联的子问题,逐步求解并获得最优解。
动态规划方法有以下几个步骤:1. 状态定义:将系统的状态用离散变量表示,例如状态矢量。
2. 动态规划递推方程:建立系统状态在不同时间步长之间的递推关系,用于计算最优解。
3. 边界条件:确定初始和终止条件,保证递推方程的有效求解。
4. 最优化准则:选择适当的性能指标,例如代价函数或效用函数,作为最优化准则。
5. 迭代求解:根据动态规划递推方程和最优化准则进行迭代求解,得到最优控制策略。
动态规划方法在离散控制系统中有广泛的应用。
例如,在机器人路径规划和自动化生产线调度等领域,动态规划方法可以帮助确定最优路径和最优调度策略,实现系统的高效控制。
二、最优控制理论最优控制理论是离散控制系统中另一种常用的最优控制方法。
它通过优化控制问题的最优化准则,找到使性能指标达到最小值或最大值的控制策略。
最优控制理论的核心是求解最优控制问题的最优化方程。
最优控制问题的最优化方程通常通过极值原理或哈密顿-雅可比-贝尔曼(HJB)方程来建立。
这些方程使用众多数学工具,如变分法和微分几何学,将控制问题转化为求解偏微分方程或变分问题。
通过求解最优化方程,可以得到最优控制器的具体形式和参数。
最优控制理论在离散控制系统中具有重要的应用价值。
例如,在飞行器姿态控制和无线传感网络中,最优控制理论可以帮助设计出具有最佳性能的控制器,提高系统的稳定性和响应速度。
三、模型预测控制(MPC)模型预测控制是离散控制系统中一种基于模型的最优控制方法。
它将系统建模为一个预测模型,并根据预测模型的结果来制定最优控制策略。
第二讲:离散时间的最优化问题一、对库恩-塔克条件的进一步说明上一次讲的库恩塔克条件中的互为松弛条件是0)]([2,1=-x x g a λ (15) 不等式约束实际上包括两种情况,一种是等式成立,另一种是不等式成立对前一种情况,即在(15)式约束中,如果约束条件中的等号成立,则库恩塔克条件自然满足,即库恩塔克条件等价于用拉格朗日乘数法获得的最优化的一阶条件。
对后一种情况来说,如果约束条件中的等式不成立,则最优解必在区间内。
这时,带有不等式约束的最优解与无约束解是一样的。
根据最优化解的必要条件,则一阶偏导数必为零,即:011=x g x f ∂∂=∂∂λ (11)’ 且 022=x g x f ∂∂=∂∂λ 根据隐函数存在定理的要求,1x g ∂∂和2x g ∂∂不能同时为零。
在经济学中,该条件一般是成立的,例如,消费者预算约束C bx ax x x g <+=2121),(, C>0, 而a, b 一般不会同时为0,所以,1x g ∂∂和2x g ∂∂不同时为0, 则必有0=λ。
所以,无论那种情况,库恩塔克条件都成立。
二、动态最优化问题与静态最优化不同,动态最优化是指在一个随时间变化的过程中,选择一条随时间变化的路径,当变量沿着该路径变化时,目标函数达到最大值。
因此,动态最优化问题与静态最优化问题的不同之处,主要在于静态最优化问题的解是一个点,于时间无关,而动态最优化问题的解是一条依赖于时间的路径,实际上是一条曲线。
一般来说,这类问题可以分两种情形讨论。
第一种情形是时间是离散的,即将一段时间划分为几个不同的区间,有限个或无限个区间都可以。
第二种情况是时间是连续的,要求一段时间的任意时刻目标函数达到最优解。
对于离散时间的最优化问题,一般来说,常用的方法有两种,一种是直接建立拉格朗日函数,用拉格朗日乘数法求解。
另一种是建立一个贝尔曼(Bellman )方程,将最优化问题变成一个两期问题求解。
对于连续时间的最优化问题,常用的方法也有两种,一种是变分法,是利用泛函分析的方法,把时间路径看成泛函问题的最优解。
另一种方法是汉尔米顿(Hamilton )法,事实上是拉格朗日乘数法的推广和变种。
本节将首先讨论一下离散时间的最优化问题,而将连续时间的最优化问题留给下一讲。
下面,结合某些具体经济问题,理解离散最优化方法的思想和具体步骤。
三、离散时间最优化问题的两种解法(以消费资产定价模型为例)1. 现代生命周期理论问题的提出现代生命周期理论是有莫迪利安尼(1963)在50年代和60年代首先创立的,其最最初形式是确定性、非随机的。
后来,在理性预期学派的影响下,大约在1978年,由霍尔(Robert. Hall )成功地给出了生命周期函数的现代形式,即随机的生命周期函数。
该理论解决了现时消费与未来消费或储蓄之间、同一时期不同类型储蓄资产之间的配置关系。
为说明现代生命周期理论,做如下假设:1) 消费者的偏好可以写成:U t =E t {f(q 1, q 1,…,q t , …, q T )}其中,U t 是t 时期的效用,E t 是在t 时期利用了所有可得到的信息的(理性)预期算子,q 1, q 1,…,q t , …, q T 是从时刻1到T 的消费品向量,f(•)是一个对各自变量均非递减的凹函数。
该函数计算的效用是在确定性条件下从消费向量得到的,它代表了消费者一生中的消费效用,下标表示年龄的大小,1表示出生日,T 表示死亡日。
因为决策是在面对未来的不确定情况下做出的,所以,用预期算子表示消费者目标是期望效用最大化。
2) 为了简单起见,设效用函数满足时际可加性条件,即U t 可以写成: U t =E t ∑=Tt r V t (q t )由于效用函数是时际可分离的,所以一生效用极大化的含义可简化成两个问题:第一步,求每个时期的子效用函数V t (q t )的极大化。
因为整体的最优化必然对每个时期而言是最优的,否则,总可以通过对该时期的最优化加以改进。
而在每个时期的最优化时,无需考虑跨时期的支出总量;第二步,考虑整个生命周期内总消费使总效用函数达到最大化。
第一步,要解决的问题是t 时期的效用最大化:max V t (q t )s.t. p t q t =C t这是一个静态最优化问题。
其中,p t 是对应于q t 的价格向量,C t 是t 时期的消费支出总额。
由于消费者不知道C t (C t 将通过进一步的时际选择问题来决定),所以,我们在关注t 时期的商品需求分析的同时也要进行跨时期的消费需求分析。
第二步,t 时期消费C t 由下列时际配置决定:用ψ(C t , p t )表示t 时期的效用最大值(第一步最优化),即标准的间接时际效用函数。
原来的时际效用函数就可以写成:U t =E t ∑=T t r V t (q t )=E t ∑=Tt r ψ(C t , p t )该效用最大化问题的约束条件由下列关于资产的递推方程给出:A t+1=N t (P t+1+d t+1)N t P t =A t +Y t +C t对所有的t 到T 都成立。
由于N t =(A t +Y t +C t )/P t ,这两个方程可以合并为: A t+1=(A t +Y t +C t )[(P t+1+d t+1)/P t ]显然,这是一个关于两个时期的不同资产A t 和A t+1的递归方程。
其中A t 表示t 时期初始资产价值,N t 表示价格为P t 的资产名义持有量,d t 是在t 时期开始前资产的红利,Y t 是t 时期的收入。
3) 一般情况下还假设消费者的最终资产为正,即:A T+1≧02. 离散时间动态最优化解法之一:拉格朗日乘数法这该最优化问题就可以写成:目标函数:Max U t =E t ∑=T t r V t (q t )=E t ∑=Tt r ψ(C t , p t )约束条件:S.T. A t+1=(A t +Y t +C t )[(P t+1+d t+1)/P t ]建立拉格朗日函数:L =E t ∑=T t r ψ(C r , p r )+∑=Tt r λr{A r+1- [(P r+1+d r+1)/P r ] (A r +Y r +C r )}该问题的一阶条件是:0=∂∂Cr L ⇒⎪⎪⎭⎫ ⎝⎛+=∂ψ∂+++111),(r r r r r r r p d p C p C λ 01=∂∂+r A L ⇒⎪⎪⎭⎫ ⎝⎛+=++-t t r tt r p d p 111λλ r r r r C p C λ=∂ψ∂111),(+++ ⎪⎪⎭⎫ ⎝⎛+∂ψ∂=∂ψ∂+++++r r r r r r r r r p d p C p C C p C 11111),(),( 这就是欧拉方程,也是关于消费演进的差分方程。
3.离散时间最优化问题解法之二:Bellman 方程法Bellman 方程的基本思路是将n 期的离散时间最优化问题转化成两期问题来解决。
首先定义价值函数:∑=ψ==Ts r r r r s s s s p C E A V V ),(max )(, s= t, t+1, t+2,…,T 。
这里称V s 是s 时的价值函数,它显然依赖于s 期的财富A s 。
有了价值函数之后,消费者的效用就可以写成贝尔曼(Bellman )方程的形式,即t 期的价值(即t 期的总效用)等于t 期的即时效用与t+1期的价值(即t 期的总效用):该问题的逻辑思路是一种被称作倒向递归技术,沿着这种思路,数学家已经取得了重大进展,产生了倒向随机微分方程的新领域。
我国数学家在这方面的研究已经处在世界领先地位,我的一位同班同宿舍的同学因此还获得了中国自然科学杰出青年基金。
消费者在t 期构想(T -1)期的情况,即构造资产向量N t-1的组合,使V T -1达到最大。
其中,[]()[]{}{}T T T T T T Y T T T T NT T d p N V E p p N y A A V ++-+ψ=--------111111111),(max )(- 获得了(T -1)时期的价值之后,接下来就要对(T -2)时期的资产进行配置。
按照类似于上面的做法,获得(T -2)时期的价值,即求解问题:[]()[]{}{}1121122222222),(max )(-----T T T T T T Y T T T T NT T d p N V E p p N y A A V ++-+ψ=--------如此类推下去,当消费者递归到t 时,消费者面临的问题就是简单的“今天和明天”之间的权衡了。
因此,资产向量组合N t 就是下列最优化问题的解:[]()[]{}{}111),(max )(+++++-+ψ=t t t t t t t t t t t Nt t d p N V E p p N y A A V 求解上述最优化问题,问题至少可以得到一下两个结论:第一,通过对资产组合选择的最优化,即对N 求导,可以得到关系: (){}111'11)(),(++++++⋅=∂ψ∂t t t t t t t t t d p A V E p C p C 第二,对每个价值函数)(t t A V 求导,可得:t t t t C A V ∂ψ∂=)(',或者,111'1)(++++t t t t C A V ∂ψ∂= 以上两式结合起来,可以得到欧拉方程:()⎭⎬⎫⎩⎨⎧+⋅∂ψ∂=∂ψ∂++11111),(),(t t t t t t t t t t d p C p C E p C p C +++ 令λt =)('t t A V =d ψ(C t , p t )/d C t ,R t+1= (P t+1+d t+1)/ P t 是资产报酬系数则,λt 表示每增加一个单位的消费而增加的价值,即边际价值或边际效用,欧拉方程可以简写为:λt =E t (λt+1R t+1)欧拉方程不仅仅提供了消费资产定价的标准结论,即现在消费和未来消费的边际替代率应等于资产的相对价格(资产收益率)R t+1,而且由于该方程将消费者决策置于多个时期框架里,它有助于认识未来资产报酬和货币价值的不确定性。
它不仅可以应用到消费和储蓄的决策方面,同时也可以用于资产定价。
因此,该模型常被称为消费资产定价模型。
四. 消费资产定价模型的几种特例:霍尔(Hall, 1978)在它的开创性论文中,假定价格和利率固定不变,消费仅受到收入的随机影响,并将时间偏好率引入目标函数,得到了如下特殊形式的欧拉方程:E t U ’(C t+1) = (1+δ) U ’(C t )/(1+r)由于消费资产定价模型中,消费的边际效用依赖于消费者的偏好形式,不同的消费者偏好可能达到不同的边际效用,因此,从欧拉方程中可以根据效用函数的具体形式获得不同的消费函数形式。