第7章经济系统的最优控制1
- 格式:ppt
- 大小:1.71 MB
- 文档页数:30
最优控制问题介绍最优控制问题是现代控制理论的核心内容之一,它研究的主要问题是如何在满足一定约束条件下,使得某一性能指标达到最优。
这类问题广泛存在于各个领域,如航天工程、经济管理、生态系统等。
通过对最优控制问题的研究,我们可以更加科学、合理地进行决策,实现资源的优化配置,提高系统的运行效率。
一、最优控制问题的基本概念最优控制问题通常可以描述为一个动态系统的优化问题。
在这个问题中,我们需要找到一个控制策略,使得系统从初始状态出发,在给定的时间内,通过控制输入,使得系统的某一性能指标达到最优。
这个性能指标可以是时间最短、能量消耗最小、误差最小等。
为了解决这个问题,我们首先需要建立系统的数学模型。
这个模型应该能够准确地描述系统的动态行为,包括状态方程、输出方程以及约束条件等。
然后,我们需要定义一个性能指标函数,这个函数描述了我们希望优化的目标。
最后,我们通过求解一个优化问题,找到使得性能指标函数达到最优的控制策略。
二、最优控制问题的分类根据系统的动态特性和性能指标函数的不同,最优控制问题可以分为多种类型。
其中,最常见的包括线性二次型最优控制问题、最小时间控制问题、最小能量控制问题等。
1. 线性二次型最优控制问题:这类问题中,系统的动态特性是线性的,性能指标函数是状态变量和控制输入的二次型函数。
这类问题在实际应用中非常广泛,因为许多实际系统都可以近似为线性系统,而二次型性能指标函数可以方便地描述许多实际优化目标。
2. 最小时间控制问题:在这类问题中,我们的目标是使得系统从初始状态到达目标状态的时间最短。
这类问题通常出现在对时间要求非常严格的场合,如火箭发射、紧急制动等。
3. 最小能量控制问题:这类问题的目标是使得系统在完成指定任务的过程中消耗的能量最小。
这类问题在能源有限的系统中尤为重要,如无人机、电动汽车等。
三、最优控制问题的求解方法求解最优控制问题的方法主要有两种:解析法和数值法。
1. 解析法:解析法是通过求解系统的动态方程和性能指标函数的极值条件,得到最优控制策略的解析表达式。
最优控制最优控制(optimal control)使控制系统的性能指标实现最优化的基本条件和综合方法。
可概括为:对一个受控的动力学系统或运动过程,从一类允许的控制方案中找出一个最优的控制方案,使系统的运动在由某个初始状态转移到指定的目标状态的同时,其性能指标值为最优。
这类问题广泛存在于技术领域或社会问题中。
例如,确定一个最优控制方式使空间飞行器由一个轨道转换到另一轨道过程中燃料消耗最少。
最优控制理论是50年代中期在空间技术的推动下开始形成和发展起来的。
苏联学者L.S.庞特里亚金1958年提出的极大值原理和美国学者R.贝尔曼1956年提出的动态规划,对最优控制理论的形成和发展起了重要的作用。
线性系统在二次型性能指标下的最优控制问题则是R.E.卡尔曼在60年代初提出和解决的。
从数学上看,确定最优控制问题可以表述为:在运动方程和允许控制范围的约束下,对以控制函数和运动状态为变量的性能指标函数(称为泛函)求取极值(极大值或极小值)。
解决最优控制问题的主要方法有古典变分法(对泛函求极值的一种数学方法)、极大值原理和动态规划。
最优控制已被应用于综合和设计最速控制系统、最省燃料控制系统、最小能耗控制系统、线性调节器等。
最优控制理论(optimal control theory)最优控制理论概述最优控制理论是现代控制理论的一个主要分支,着重于研究使控制系统的性能指标实现最优化的基本条件和综合方法。
最优控制理论是研究和解决从一切可能的控制方案中寻找最优解的一门学科。
它是现代控制理论的重要组成部分。
这方面的开创性工作主要是由贝尔曼(R.E.Bellma n)提出的动态规划和庞特里亚金等人提出的最大值原理。
这方面的先期工作应该追溯到维纳(N.Wiener)等人奠基的控制论(Cybernetics)。
1948年维纳发表了题为《控制论—关于动物和机器中控制与通讯的科学》的论文,第一次科学的提出了信息、反馈和控制的概念,为最优控制理论的诞生和发展奠定了基础。
最优控制又叫动态优化工程技术领域里的过程(物理过程或化学过程),通常都是可以控制的过程控制:使过程的发展变化按人们的需要进行动态优化问题的四个要素:1.建立过程的动态模型(动态系统的状态方程)2.指定所需的初始状态和结束状态(状态方程的边界条件)3.确立在可行控制策略4.性能指标动态系统的变化,可以看成对应状态的变化,其中每一个状态对应着n维状态空间中的一个点,系统的运动将在状态空间中画出一条状态曲线动态系统的状态方程:1.是对研究对象的动态数学建模2.体现了系统运动时应遵循的规律,反映了系统的动态特征3.一般是微分方程组描述状态方程f[x(t),u(t),t]的数学性质:1.f[x(t),u(t),t]是向量函数,维数与状态变量维数相同2.f[x(t),u(t),t]是关于x(t)/u(t)/t的连续函数3.f[x(t),u(t),t]是关于x(t)/t的连续可微函数4.u(t)是关于t的分段连续函数,只有有限个第一类间断点系统的初始时刻t0和初始状态x0一般都是已知的系统的结束时刻tf:固定或者不固定系统的结束状态xf:全部固定/全部不固定/部分固定性能指标:1.要根据实际任务确定,例如过程持续的时间最少/过程消耗的能量最少/成本最小/利益最大等等2.种类:终值型/积分型/复合型,它们都是关于x(t)/t的连续可微函数最优控制一定是容许控制,即最优控制策略(最优控制函数)在控制函数空间中的一个子集中选择当最优控制轨迹确定后,通过系统的状态方程,可以确立对应的最优状态轨迹现代控制理论相对于经典控制理论的优点:1.从时不变系统延伸到时变系统2.从单输入单输出系统延伸到多输入多输出系统3.从频域回到时域,采用能够揭示系统内部各状态变化规律的状态空间描述法最优控制理论属于现代控制理论的分支从数学角度来看,最优控制问题本质上是求泛函极值的变分学问题变分法分为古典变分法和现代变分法(最大值原理/动态规划)古典变分法只能解决容许控制集为开集的最优控制问题实际最优控制问题的容许控制集都是闭集,可以用现代变分法解决函数分为两类:普通函数和泛函普通函数随自变量t变化有确定值对应泛函随普通函数(称为泛函的宗量函数)的形式变化有确定值对应,t已确定或不产生影响复合函数也是普通函数,随自变量t变化有确定值对应具有某些相同特征的所有函数组成一个函数类,或称函数空间在函数空间内,每一个函数(形式不同的)成为函数空间的一个点,例如sin(x)和sin(2x)是正弦函数空间的两个点泛函宗量的变分:1.同一函数空间中的两个函数的差(t已确定或不产生影响)2.宗量的变分仍然是一个普通函数3.这里“变分”的意思是改变量宗量的维数为m时,则宗量的变分在m维函数空间中进行,其中每一维函数空间各自是具有某些相同特征的函数类两个普通函数k阶相近的定义,从几何上来看就是曲线的相似程度两个普通函数间的k阶距离定义,从几何上来看就是曲线的差异程度m维函数空间中,与点[x0(t),x1(t),...xm(t)]距离相同的点构成m维空间中的一个球面泛函k阶连续的定义(利用两个普通函数间的k阶距离来定义)线性泛函的定义:满足齐次性与可加性泛函的变分:1.是泛函增量的关于宗量变分的线性主部2.是关于宗量变分的线性连续泛函3.仍然是一个泛函4.泛函的变分是唯一的5.这里变分的意思相当于普通函数的微分泛函变分的计算公式,是关于宗量变分的泛函,也是关于alpha的普通函数,从普通函数极值条件出发推导得到泛函极值条件求普通函数的极值,必要条件是:极值在稳定点获得,稳定点即普通函数导数为0的点求泛函的极值,必要条件是:极值在泛函变分为0的点取得Lagrange/Mayer/Bolza形式指标的相互转换欧拉--拉格朗日方程的推导过程欧拉--拉格朗日方程是一个二阶微分方程欧拉--拉格朗日方程成立的前提:1.宗量函数对自变量的二阶导数存在2.积分函数二阶连续可微欧拉--拉格朗日方程的能积分出最优解的特殊情况含有多个宗量函数的欧拉--拉格朗日方程组形式等式约束条件下的泛函极值问题采用拉格朗日乘子思想等式约束下的多变量普通函数极值问题,拉格朗日乘子是m维常向量等式约束下的泛函极值问题,拉格朗日乘子是m维普通函数,称为协态变量拉格朗日乘子法的步骤:原问题-->辅助泛函-->解等式约束+欧拉方程-->用边界条件确定未知系数-->判断极大/极小/鞍点等式约束下的泛函极值问题中,拉格朗日乘子(本质上是普通函数)的欧拉方程就是原问题的等式约束条件对于最优控制问题,控制函数u(t)和状态函数x(t)都看成是泛函的宗量,系统的动态方程作为等式约束条件Hamilton函数是泛函,其t的范围由x(t)/u(t)中的t范围确定,可以看成是mayer型泛函Hamilton函数的作用:积分型泛函J对u(t)的等式约束条件极值问题,转换成H对u(t)的无约束条件机制问题Hamilton函数方法解决最优控制问题,是基于必要条件,而不是充分条件Hamilton函数沿着最优空之轨迹和最优状态轨迹,对时间t的全导数等于偏导数当Hamilton函数不显含t时,H是不依赖于t的常数基础数理化:数学是理路,物理和化学是实践;工程中的物理和化学变化过程都是可控的;过程:与时间有关,随着时间推荐的变化,又叫动态过程;动态过程的数学模型又称状态方程,为OEDs或者DAEs形式对一个过程实施控制往往可以选择的策略不唯一,为了使得任务完成得最好,需要选择最优控制策略;最优的意义:根据任务确定的技术或者经济指标,可以是时间上最快、能量上最省、成本最低、利润最大等;状态微分方程f[x(t),u(t),t]是关于u(t),x(t),t的连续函数,是关于x(t),t的连续可微函数,u(t)只有有限个第一类间断点;状态、状态空间、动态系统的变化过程对应于状态空间中的点运动轨迹、点运动轨迹的起始点和结束点就是状态方程的边界条件;系统的初始时间t0和初始状态x0通常是给定的;系统的结束状态根据结束时间tf是否固定和结束状态是否固定可分为6种情况;性能指标的类型:终值型(Mayer型)、积分型(Lagrange型)、复合型(Bolza型;)终值型(Mayer型)是x(t),t的连续可微函数;积分型(Lagrange型)是u(t),x(t),t的连续函数,是x(t),t的连续可微函数,u(t)只有有限个第一类间断点;注意终值型(Mayer型)指标中不含u(t);最优控制轨迹往往在m维控制函数空间的一个子集omiga中选择;经典控制论的特点:针对SISO、线性、时不变(定常)、集中参数系统,以laplace变换作为分析工具,频域内;现代控制论的特点:针对MIMO、非线性、时变、分布参数系统,以状态空间分析方法为分析工具,时域内分析;对系统的状态空间描述,最大好处在于能够反映系统内部各状态变量之间的关系;最优控制理论属于现代控制理论的一部分;最优控制问题在数学上来说属于求泛函极值的变分学领域;古典变分法的局限性:只能处理u(t)无约束或者为开集的泛函极值问题;现代变分学的两个代表:最大值原理(苏联,Pontryagin提出)和动态规划(美国,Bellman 提出);现代计算机的发展推动了控制理论和优化理论的发展与应用,增加了基于计算的科研活动方式;函数分为一般函数和泛函两类;一般函数:自变量形式唯一,当自变量确定为某一值时,函数值也随之确定;泛函:自变量形式和取值(范围)已经确定,当宗量函数形式确定时,泛函值也随之确定;复合函数属于一般函数;终值型泛函中,tf能被确定,所以泛函值取决于终值型泛函的宗量形式;积分型泛函中,被积函数往往是u(t),x(t),dx(t)/dt,t的函数,u(t),x(t)都属于积分型泛函的宗量;积分型泛函中,由于宗量的维数大于1:宗量为u(t),x(t),且各自维数也可能大于1,所以积分型泛函属于多维泛函(宗量为多维,在多维函数空间内取值);Hamiltonian属于多维泛函,自变量取值范围为t0~tf,宗量包括控制函数u(t),状态函数x(t),协态函数y(t);函数空间:具有相同性质的函数类(按函数不同形式区分函数类中的单个函数),构成了一维函数空间(一根轴),每个属于该函数类的具体形式函数都是该一维函数空间(轴)上的一个点;宗量函数的变分deltax(t):是同一函数类中两个一般函数的差,或者说是某一维函数空间中两个点之间的距离,本质上仍然是一个一般函数;一般函数相近的几何意义:曲线形态相似;泛函连续性的定义及与宗量函数相近(宗量函数的变分趋于0)的关系;线性泛函的定义:满足针对宗量函数的齐次性和可加性(将宗量看成一般函数的自变量);泛函变分detalJ[x(t)]:是泛函增量关于“宗量函数变分”的线性主部,是关于“宗量函数变分”的线性连续泛函,本质是泛函;泛函的变分具有唯一形式;求一个泛函的变分不直接使用定义,而用偏导数方法获得,这与一般函数的微积分知识相似;泛函达到极值的必要条件:泛函在宗量函数x*(t)处的变分为0,有三种情况:非极值,极大值,极小值;古典变分法中的欧拉方程由积分型泛函变分为0的必要条件推出,所以欧拉方程也是泛函达到极值的必要条件;欧拉方程本质上是一个二阶偏微分方程;欧拉方程成立的前提是:L[x(t),dx(t)/dt,t]对宗量函数x(t)、宗量函数的导数dx(t)/dt、自变量t存在二阶偏导数;注意L[x(t),dx(t)/dt,t]本身不能称为泛函(自变量的值没有给定),也不能称为宗量函数(宗量函数是x(t));欧拉方程可以求解的条件:L[x(t),dx(t)/dt,t]中不显含x(t)、dx(t)/dt、t三者其一或其二;宗量函数为向量函数时,欧拉方程也成为向量二阶偏微分方程(二阶偏微分方程组);phi(tf)这条终端曲线实际靠测试获得,并作为已知曲线;横街条件反应的是:极值曲线终端斜率与给定曲线斜率之间的关系横街条件成立的前提:L[x(t),dx(t)/dt,t]对宗量函数x(t)、宗量函数的导数dx(t)/dt、自变量t存在二阶偏导数;phi(t)对自变量t存在一阶偏导数;终端点可变情况下,泛函极值的必要条件共有两个:欧拉方程、横街条件;Lagrange型泛函的一阶变分和二阶变分的表达式;泛函极值属性的判断需要借助二阶变分表达式,它是一个对称函数矩阵;涉及到最优控制问题时,最优状态轨迹不仅要使目标函数最优,更重要的是满足系统的状态方程;系统的状态方程(等式)可以看成是求泛函极值问题时的微分等式约束;带等式约束的泛函极值问题,处理思想和一般函数的等式约束极值问题思路一样,采用拉格朗日乘子法思想;带等式约束的泛函极值问题,拉格朗日乘子是一般函数(一般函数的等式约束极值问题中,拉格朗日乘子是常数);带等式约束的泛函极值问题,与一般函数的等式约束极值问题相比,梯度为0的必要条件进化成为变分为0(欧拉方程的满足);带等式约束的泛函极值问题,原等式约束可以视为F[x(t),dx(t)/dt,lamda(t),t]对宗量函数lamda(t)的欧拉方程;利用古典变分法求解最优控制问题,是将控制函数u(t)和拉格朗日乘子函数lamda(t)都作为泛函的宗量函数;Hamiltonian的作用是将dx(t)/dt从F[u(t),x(t),dx(t)/dt,lamda(t),t]中分离出去,它们的关系是:H[u(t),x(t),lamda(t),t]=F[u(t),x(t),dx(t)/dt,lamda(t),t]-lamda(t)dx(t)/dt正则方程组的推导既可以从F[u(t),x(t),dx(t)/dt,t]的欧拉方程推导,也可以直接从变分=0的必要条件推导(欧拉方程从变分=0的必要条件中推导出来);推导tf固定、tf自由时的最优控制问题必要条件时,辅助函数的做法:终态约束等式约束放在积分号外面,状态方程等式约束放在积分号里面;tf固定时的三种情况:x(tf)固定(仅需要欧拉方程无需横截条件)属于x(tf)自由的特殊情况,x(tf)自由又属于x(tf)受约束的情况;tf自由时的三种情况:x(tf)固定(仅需要欧拉方程无需横截条件)属于x(tf)自由的特殊情况,x(tf)自由又属于x(tf)受约束的情况;tf固定又属于tf自由时的特殊情况,仅缺少关于最优时间的方程,所以6种情况最终都可以归类为tf自由、x(tf)受约束的情况处理;Hamiltonian沿着最优控制轨迹和最优状态轨迹(即H[u(t),x(t),lamda(t),t]中的u(t),x(t),lamda(t)都在最优轨迹上取值)时,对时间的偏导数等于对时间的全导数;以上性质说明:沿着最优控制轨迹和最优状态轨迹时,若Hamiltonian不显含t,则Hamiltonian为常数;不等式约束泛函极值问题?古典变分法要求u(t)属于一个全函数空间或者一个函数空间中的开集;现代变分法从实际出发,u(t)可以属于一个函数空间中的闭集;现代变分法中的代表:极小值原理(苏联,Pontryagin)和动态规划(美国,Bellman)极小值原理比古典变分法的进步:u(t)可以属于一个函数空间内的闭集,不要求Hamiltonian对u(t)可微;当u(t)属于一个函数空间内的闭集时,H对u(t)的偏导数可能不为0(在闭函数空间内取不到极点)、deltau(t)可以为0,两方面原因造成古典变分法不再适用;与古典变分法对应的是,极小值原理也有6种情况,最普遍的是tf可变、x(tf)受约束的情况;对于tf可变的情况,需要增加一个确定tf的方程(属于横截条件的一部分);Hamiltonian达到极小值的定义?极小值原理仅是最优控制问题的必要条件;如果x(tf)有终端约束,那么两点边值问题的求解难度会增加很多,常用方法为打靶法(扫描法);协态变量就是等式约束泛函极值问题的拉格朗日乘子函数;状态变量终态的自由与固定,对应协态变量终态的固定与自由;状态变量微分方程求解联合协态变量微分方程求解体现了原问题--对偶问题的共同求解思想?目标泛函对u(t)求偏导,实际是泛函对宗量函数求偏导;从理论分析可以得到,目标泛函对u(t)的梯度(偏导数)在最优控制问题中与Hamiltonian 对u(t)的梯度(偏导数)等价;最优控制(动态优化)问题转换成静态优化问题的理论:通过对u(t)的离散化,将函数空间变为向量空间?从而可以直接使用静态优化算法;处理x(tf)受约束的方法除了惩罚函数法还有其他方法没?[文档可能无法思考全面,请浏览后下载,另外祝您生活愉快,工作顺利,万事如意!]。